• 我的订阅
  • 头条热搜
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...应用场景非常广泛,包括但不限于自动驾驶、医疗诊断、视频内容理解、图像描述生成、视觉问答等。例如,在自动驾驶领域,多模态大模型可以整合来自摄像头、雷达和激光雷达的数据,以实现更精准的环境感知和决策。由于...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...对应到全模态大模型,泛指可以利用文本、图片、音频、视频、3D等不同模态的数据进行跨模态的统一表征和学习,更接近人类的学习方式。其次是成本。ChatGPT刚刚走红的时候,不少人在讨论OpenAI的训练成本,据悉GPT-3训练一次...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...图为《捉妖记》海报。 赵宜OpenAI开发的文(图)生视频模型Sora演示素材发布后,再次在全球范围引发了对生成式人工智能的迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
...行训练。并且用这种方法,只需要很少的人类监督。 如视频天然就把画面与声音做了配对,网络中也可以收集到天然把图像和文字配对的内容等。而以图像/视频为中心训练好AI后,对于原始数据中没有直接联系的模态,比如语...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
国产AI,正式把视频生成拉进了有声电影时代。自从Sora引爆视频生成之后,基本上所有AI生成的视频都属于“默片”的效果,也就是没有对应的音效(注意不是配乐)。但现在,音效是可以直接自带了!而且还是4K、60帧高清画...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色,但面对多模态信息时,却往往显得力不...……更多
小红书布局大模型:多媒体算法负责人牵头、上线AI绘画应用 | Long China 50独家
...过一年的小红书智能多媒体算法负责人,主要负责AI和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。除了成立大模型团队以外,36氪了解到,小红书内部还有多个独立部门同...……更多
大模型的未来,快手在自己身上找答案
...芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短剧,台下欢呼声此起彼伏。对外界来说,AI 能力是抽象的,带货主播和短剧显得更有体感;一家 AI 驱动的科...……更多
不要小看「实而不华」的腾讯 AI
...双语输入及理解,具备多轮绘图能力,并对外开源;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持 16s 视频生成,预计在第三季度可以实现 30s 视频生成,同时,腾...……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
字节跳动正式宣告进军AI视频生成。9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。活动现场展示的视频生成效果令人惊叹。...……更多
...联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为关注,公司目前的业务中尚不涉及“文本自动生成视频技术”,媒体提到的公司“视联网数字化智能平台”不涉及多模态模型。 ……更多
字节跳动为企业提供极具性价比的多模态大模型能力
...得一提的是,字节跳动还将在2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版,豆包端到端实时语音模型也将很快上线目前,豆包大模型已经与八成主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终...……更多
文博会观察:大模型为文化产业发展提供新机遇
...AIGC)成为备受关注的社会焦点和技术热点。以Sora为代表的视频生成技术把智能化生产范围从文字扩大至视频,而这些都离不开大模型的支持。大模型的发展将给文化行业带来哪些影响?第二十届中国(深圳)国际文化产业博览交易...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转绘、AI音乐等多模态能力,大大提升了我的短视频创作效率和内容呈现效果。接下来,我们一起实操天工AI各项功能,邀大家一起测评,好不好用一试见真章。App:...……更多
每日与世界30亿次交互!这家AI独角兽企业发布视频、音乐生成模型
输入一段简单的提示词,等待1—2分钟,可生成6秒的视频;没有伴奏,音乐模型也可以是实力歌手。8月31日,AI独角兽企业上海稀宇科技有限公司(以下简称MiniMax)“Link 伙伴日”在西岸漩心拉开帷幕。当日,MiniMax正式发布视...……更多
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
...的可控时空生成,大规模的生成和实际场景相一致的驾驶视频数据,有机会重塑自动驾驶的开发。华为云盘古大模型5.0可控时空生成技术(STCG),赋予了模型理解并遵循物理规律的能力,这意味着,生成的视频不仅在视觉上逼...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...知识的深度学习和应用;「跨媒体大模型」还涉及诗词短视频合成和化合物合成的不同领域,通过结合不同形式的数据进一步拓展了 AI 的边界。「如果每个学科都能拥有自己的专业大模型,并将这些模型相互连接,将形成一个...……更多
Sora为何没能诞生在中国?
...框内输入“中世纪小号手”,打开音效开关键,点击生成视频,一个4秒的AI生成视频便跃然于屏幕上。人们不仅能看到一个身穿中世纪宫廷服饰乐手的画面,还能听到乐手吹小号的声音。北京时间3月10日,硅谷一家AI初创公司Pika...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。此...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
...模型平台。该模型具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该模型融合了人类意图理解和长期记忆机制,为用户提供超拟人的情感陪伴服务。同时,结合实时的全域数据及 LBS 信息采集处理,WAKE-AI 大...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...型相当于语言大模型的眼睛和耳朵,能够将语音、图像、视频、车辆信号等多种信息模态进一步理解,再打通语言大模型进行智能交互。而多模态生成大模型则相当于语言大模型的手和脚,能够将语音输出转化为多种模态信息,...……更多
视频生成群雄逐鹿,哪些重要问题待解?
...大模型峰会、AI Infra峰会,分会场将组织端侧生成式AI、AI视频生成和具身智能三场技术研讨会。主会场与分会场外则设有展览区。50+位嘉宾将在大会上带来致辞、演讲、报告和对话讨论,以前瞻性视角为大家解构和把脉生成式AI...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...决方案,小米小爱同学为车主提供智能化交互体验。文生视频平台。“商汤在这么多年做了非常多视频、感知、理解的技术和内容,商汤关注如何把视频的生成做到可控。我们打造了文生视频平台,强调对人物的可控性、情绪的...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tensor处理器单元(TPU)Trillium芯片。根据发布会最后的官方统计,完全聚焦于AI的这场主题演讲总共提到了121次AI。完全聚焦于AI的...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...技术架构和精细化应用,以及多模态模型在图、文、音、视频方面的特色应用。 开悟大模型采用主流的transformer模型和扩散模型技术路线,针对不同行业场景训练了特色化大模型,具备六大亮点。 1.语言模型可控化,采用...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...击。此前,谷歌已经对外放出了语音助手demo演示的预热视频,而GPT-4o最让人惊艳的地方就是“天花板级别”的人机自然语音交互。 那么,OpenAI机关算尽、谷歌有备而来的多模态大模型,究竟有什么神奇之处?GPT-4o中的“o”代...……更多
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...了后来居上。在模型上,字节补全了图像、语音、音乐、视频、3D等不同模态的生成式AI模型;在应用上,豆包App已成为国内用户最多的ToCAI产品,截至11月底,累计用户规模已超过1.6亿,单日活跃用户接近900万。不知不觉间,字...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...工大学 S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基准:成功率最高 2%Meta 推出「高效追踪一切」模型SOLAMI:首个端到端社交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获...……更多
全面AIGC时代,豆包模型家族准备好了
...巡展」深圳站中,豆包模型家族再次全新发布两款豆包·视频生成模型:豆包视频生成-PixelDance、豆包视频生成-Seaweed,并面向企业市场开启邀测。活动中,火山引擎总裁谭待同时发布了豆包·音乐模型及豆包·同声传译模型,豆...……更多
更多关于科技的资讯:
连续三年营收翻倍,VR头显企业「小派科技」完成亿元级C1+轮融资 | 36氪首发
文 | 王方玉编辑 | 苏建勋36氪获悉,VR头显研发制造商小派科技(杭州)有限公司(以下简称“小派科技”)近日完成亿元级C1+轮融资
2025-01-05 09:23:00
豪门二代跨界网红圈:短视频试水个人IP 主打反差狗血剧情
快科技1月5日消息,据媒体综合报道,近年来,一些顶级国产品牌企业的二代接班人不再局限于传统的商业领域,而是选择跨界进入网红界
2025-01-05 10:16:00
探索行业新模式,香港创辉推动融资租赁高质量发展
在金融领域,融资租赁作为一种新型的金融服务方式,为企业提供了更多的融资选择。在香港,创辉融资租赁有限公司(以下称“香港创辉”)凭借其独特的商业模式和专业的服务能力
2025-01-05 10:34:00
设备租赁新纪元:香港创辉如何驱动行业变革
香港创辉迎来2025年新发展,引领行业创新潮流香港创辉设备融资租赁公司作为领先的设备融资租赁服务提供商,今天宣布了一系列重大战略举措
2025-01-05 10:34:00
女生打独享顺风车拒绝司机绕路:结果被拽下车 丢高速路边
快科技1月5日消息,据报道,一位女网友投诉“嘀嗒”平台称,她打独享顺风车,却被告知还有位乘客,后因拒绝司机绕路办私事,在高速路被赶下了车
2025-01-05 10:46:00
全球首个第六代HBM!三星完成HBM4内存逻辑芯片设计:4nm工艺、性能大爆发
快科技1月5日消息,据韩国朝鲜日报报导,三星DS部门存储业务部最近完成了HBM4内存的逻辑芯片设计。Foundry业务部方面也已经根据该设计
2025-01-05 10:46:00
火蝠电商蝉联天猫五星经营服务商,获三项认证及一项大奖!
近日,天猫举办了生态伙伴晚宴,并揭晓了2025生态认证名单。火蝠电商凭借优秀的综合运营能力再次入选,成功获得了天猫五星经营服务商
2025-01-05 10:51:00
称小鹏是“小鸟汽车” 多次诋毁贬低!一自媒体向小鹏道歉、赔偿
快科技1月5日消息,小鹏汽车法务部日前发文宣布。自媒体“汽车曝光台”(或名:汽车通病曝光台、车曝台等)此前在抖音、微信视频号等多个网络平台矫伪事实
2025-01-05 07:45:00
全球最长寿人瑞糸冈富子在日本去世 享年116岁
当地时间周六,吉尼斯世界纪录和人类寿命研究机构LongeviQUEST披露,全球最长寿人瑞糸冈富子(Tomiko Itooka)已经去世
2025-01-05 07:45:00
雷军周日清早7点晒健身房照 网友:周末还锻炼 太卷了
快科技1月5日消息,今早7点,小米CEO雷军在微博晒出2025年第三次健身房打卡照,并配文:“周日有空,正好锻炼身体。”网友看后留言表示
2025-01-05 07:45:00
藏里羊中标日土羊绒,引领中国好羊绒走向世界
“世界羊绒看中国,中国羊绒看西藏”。藏里羊品牌创始人李建红先生受邀参加了2024年8月30日西藏阿里日土县举办的第五届白绒山羊绒毛品鉴暨产品竞拍活动会
2025-01-05 08:13:00
年检合格的车辆被黄牛检出5个故障码!有人故意制造车检焦虑
快科技1月5日消息,据央视新闻报道,近期,所谓“史上最严车检”引发热议。网上有消息称,“十辆车九辆半都过不去”“收音机故障也过不了车检”“能找黄牛找黄牛
2025-01-05 08:15:00
网易武侠手游《燕云十六声》最低配置需求公布:骁龙778G、苹果A13就能玩
快科技1月5日消息,网易武侠游戏《燕云十六声》移动端将于1月9日不删档上线,将在1月7日16点开启预下载。移动端与PC端数据互通
2025-01-05 08:15:00
江苏南京:“国字号”先进制造业企业和产业集群加速涌现
去年以来,南京先进制造业企业和产业集群频频跻身“国家队”——“国字号”在宁加速涌现□南京日报/紫金山新闻记者张甜甜通讯员王刚徐晏张海洋追光灯
2025-01-05 09:23:00
母婴童赛道,南京跑出“孩子王”预计2024年扣非后净利润同比增长91.92%—155.90%□南京日报/紫金山新闻记者张甜甜上周
2025-01-05 09:23:00