• 我的订阅
  • 头条热搜
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
智象多模态生成大模型3.0版发布
...合肥举行。现场,智象未来科技有限公司正式发布智象多模态生成大模型3.0版。智象未来创始人兼CEO梅涛发布智象多模态生成大模型3.0版。主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。Sora 终于来了!只要是 ChatGPT Plus/Pro 用户,直接就能用上。至于效果 ......看完官方放出的 demo,网友大呼:不太行 !当人们对「超级应用」的热情被 Sora 浇上一盆凉水时,多模态应用已经悄咪...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...参数量将以指数级的速率提升,另一方面是数据量随着多模态的引入也将大规模增长。不过,徐立提到,虽然目前业界训练模型对基础算力、基础设施的需求非常旺盛,但基础算力里对并行效率的要求非常高,真正好用的基础设...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
更多关于科技的资讯:
你借的共享充电宝那么贵 它们公司却穷得快退市了
不断涨价,业绩却越做越差,共享充电宝品牌怪兽充电无奈选择了私有化退市。1 月 6 日,怪兽充电宣布收到来自信宸资本( 中信集团旗下 )和公司管理层联合发出的私有化要约
2025-01-11 15:21:00
甲流高发 医生提醒:奥司他韦不能乱吃!
近期,甲型流感(简称甲流)的发病率有所上升。奥司他韦作为一种常用的抗流感药物,在预防和治疗甲流方面发挥着重要作用。然而
2025-01-11 15:51:00
群晖备份一体机发布:开箱即用 一机即可实现多种备份
快科技1月11日消息,中小企业在业务发展过程中,随着数据量增加和备份设备增多,面临成本增长和运维效率降低的挑战。对此,群晖推出了备份一体机DP7400
2025-01-11 16:21:00
春节新风尚!百果园济南区苏绣春节礼盒发布会,传递健康年味
临近春节,年味渐浓,百果园济南区2025 年春节系列礼盒发布会圆满落幕。发布会上,百果园×非遗苏绣传承人卢建英春节联名系列礼盒惊艳亮相
2025-01-11 16:30:00
华为解决5G最大弊端:不怕演唱会没信号了
快科技1月11日消息,随着5G深入建设,大型体育场馆和演唱会等高容量场景面临覆盖范围和上下行容量的挑战。近日,浙江电信携手华为在宁波完成了FDD Massive MIMO的创新商用测试
2025-01-11 16:51:00
索尼本田联手造了台66万的车 卖这么贵你就给我这个
快到年边了,没想到这位日本新势力抢在年前,给我们拉了坨大的。这次 CES ( 国际消费类电子产品展览会 )上,索尼本田又带着它的 AFEELA 来秀存在了
2025-01-11 16:51:00
搞这么厉害怎么不早点告诉我,ces上极氪展台都挤爆了
有幸围观了一下,不看不知道,极氪展台这是要晋升车界的甜甜圈吗,每个人都想来尝一尝看一看,这么多人,还有外国友人来凑热闹
2025-01-11 17:17:00
奢侈品牌大变动!据称普拉达正在考虑收购范思哲
据媒体周五(1月10日)报道,全球时尚奢侈品集团Capri Holdings计划出售旗下的范思哲(Versace),普拉达(Prada)正在考虑收购
2025-01-11 17:21:00
开门红!2025年电影总票房破10亿
快科技1月11日消息,根据灯塔专业版的数据,截至1月11日14时47分,今年的总票房(含预售)已经突破10亿元大关。其中
2025-01-11 17:21:00
本文转自:人民网-科普中国量子计算机,这一曾被视为科幻的技术奇迹,如今正逐步从理论走向现实,并在不断迭代中展现其颠覆性的计算潜力。
2025-01-11 17:25:00
全球首款骁龙8至尊版折叠屏!OPPO Find N5下周官宣:产品足够惊艳
快科技1月11日消息,今天,OPPO周意保预告,OPPO Find N5会在下周公布发布时间。周意保与网友互动时表示,OPPO Find N5足够惊艳
2025-01-11 17:51:00
辽宁移动旗舰店·沈阳十一纬路店:焕新绽放,重启极致用户体验
本文转自:人民网-辽宁频道近日,辽宁移动旗舰店·沈阳十一纬路店(以下简称“十一纬路旗舰店”)完成了全面的升级改造,以新型智慧营业厅的形象惊艳亮相
2025-01-11 18:18:00
当然有的,主要是以下三个渠道,大家可以根据自己的需要来选择。一、查询中标公告的官方渠道:①政府采购网站:中国政府采购网及其省级和市级分支是最权威的信息来源
2025-01-11 18:18:00
点击查看视频星品入驻,全球共享。旅游零售市场是国产品牌向世界展现东方风土、中国味道的绝佳窗口。本期《每周探店》来到了cdf海口国际免税城——这里正在举行长城五星G家族入驻中免集团的首发仪式
2025-01-11 18:41:00
蚂蚁集团完成收购好大夫:帮8亿用户找到28万好医生
快科技1月11日消息,在今天举办的2025年度好大夫峰会现场,蚂蚁集团和好大夫在线完成收购后首度同台亮相。双方共同宣布
2025-01-11 18:51:00