• 我的订阅
  • 头条热搜
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
智象多模态生成大模型3.0版发布
...合肥举行。现场,智象未来科技有限公司正式发布智象多模态生成大模型3.0版。智象未来创始人兼CEO梅涛发布智象多模态生成大模型3.0版。主办方供图“智象多模态生成大模型3.0版全面升级图像和视频生成能力。”据智象未来创...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码 【中信证券:OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码】财联社2月19日电,中信证券研报指出,近一周内,OpenAI和谷歌分别推出了他们的最新AI模型,...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。Sora 终于来了!只要是 ChatGPT Plus/Pro 用户,直接就能用上。至于效果 ......看完官方放出的 demo,网友大呼:不太行 !当人们对「超级应用」的热情被 Sora 浇上一盆凉水时,多模态应用已经悄咪...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...参数量将以指数级的速率提升,另一方面是数据量随着多模态的引入也将大规模增长。不过,徐立提到,虽然目前业界训练模型对基础算力、基础设施的需求非常旺盛,但基础算力里对并行效率的要求非常高,真正好用的基础设...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
meta开源多感官大模型,ai用6种模态体验虚拟世界
Meta最新 6模态大模型,让AI以更接近人类的方式理解这个世界。比如当你听见倒水声的时候就会想到杯子,听到闹铃声会想到闹钟,现在AI也可以。尽管画面中没有出现人类,AI听到掌声也能指出最有可能来自电脑。这个大模型 I...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...在演讲中介绍了基于昇腾AI与昇思MindSpore AI框架打造的全模态大模型紫东.太初2.0,并首次提出全模态多任务统一生成式学习框架。借用Hugging Face联合创始人Thomas Wolf的说法:“在过去的几年里,好的多模态模型一直是许多大型技...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
更多关于科技的资讯:
加油站错加汽油后奔驰大G趴窝:维修需要七八十万
1月19日消息,车辆加错油品后果相当严重,运转时有可能导致发动机直接报废。据1818黄金眼报道,刘女士有一辆奔驰G 400d
2025-01-19 12:58:00
帧率暴增8倍!NVIDIA揭秘DLSS进化背后:大型超算6年全天无休工作
快科技1月19日消息,NVIDIA近日NVIDIA 揭开了DLSS使游戏帧率暴增的背后技术支持,一台专门用于持续改进DLSS技术的超级计算机
2025-01-19 13:28:00
针对近日美国商务部发布的人工智能相关出口管制临时最终规则,中国贸促会在昨天的发布会上代表中国工商界做出回应,美方再次滥用出口管制措施
2025-01-19 13:53:00
华流才是顶流:美国网友已经准备在屋前屋后种菜
快科技1月19日消息,近日疯狂涌入小红书的美国网友们已经学到了非常多的新技能,而这些,往往都由中国网友传授。近日,在美国俄勒冈州
2025-01-19 13:58:00
绝美惊艳!钱塘江涌现千姿百态“奇树”
快科技1月19日消息,近日,据媒体报道,浙江钱塘江潮退之后,涌现出了千姿百态的“奇树”!这些“参天大树”栩栩如生,是潮水与滩涂共同绘就的绝美画卷
2025-01-19 13:58:00
比亚迪腾势N7迎来OTA升级:新增城市领航与车道辅助功能
快科技1月19日消息,据媒体报道,比亚迪腾势N7近日宣布启动新年首次OTA升级。此次升级覆盖了城市领航(CNOA)、车道领航(ICC)以及自动紧急制动(AEB)等多项功能
2025-01-19 14:28:00
日产汽车全球裁员9000人 董事高管职位同步削减
快科技1月19日消息,日产汽车计划在全球范围内裁员约9000人,其中包括日本本土员工,同时将在4月对现有的63名高层管理人员进行缩减
2025-01-19 14:28:00
江西省人大代表郑波:为江西高质量发展增添“智慧引擎”
本文转自:人民网-江西频道江西省人大代表、江西迅特通信技术有限公司董事长郑波在“代表通道”上接受采访。人民网记者 时雨摄人民网南昌1月19日电(记者时雨)19日
2025-01-19 16:20:00
AI助力:男子用3000美元在家实现核聚变
快科技1月19日消息,据媒体报道,近日一位加拿大男子声称在AI的帮助下,仅花费3000 美元就在家中成功实现了核聚变。该男子化名Hudzah在其Substack上分享了实验过程
2025-01-19 10:58:00
雷军晒三十多年前“大哥大”:一台两三万 比现在的手机贵多了
快科技1月19日消息,今日,雷军在微博晒出一组“大哥大”的照片称:“大家见过最早的手机吗?三十多年前,当时叫大哥大,一台两三万
2025-01-19 10:58:00
雷军来宁德时代开着小米SU7 走的时候红光满面
快科技1月19日消息,近日,小米集团创始人兼CEO雷军亲自前往宁德时代总部进行拜访,受到了宁德时代董事长曾毓群的热情接待
2025-01-19 10:58:00
不愧是我爱的极氪
极氪系在这次懂车帝冬测里还挺给力的,冰雪弯道、70码制动等都名列前茅。我就说它家的智能驾驶很稳定吧~
2025-01-19 11:43:00
那些用开塞露涂脸的人:后来都怎么样了
关于“生活中便宜好用的护肤品”,之前我们讲了凡士林(可回顾往期文章),评论区有人问甘油,今天就来聊聊~图片来源:科普中国评论区相信很多人知道
2025-01-19 11:58:00
比亚迪多车已支持 博主:双枪充电含金量在25年会不断提升
快科技1月19日消息,对于电动车补能,目前主流的方法要么是超快充,要么是换电,也有车企有自己的坚持,比如比亚迪的双枪快充
2025-01-19 11:58:00
NVIDIA RTX 5090 Vulkan/OpenCL性能首曝!比RTX 4090提升37%
快科技1月19日消息,NVIDIA最新的GeForce RTX 5090显卡的Geekbench OpenCL和Vulkan API测试成绩首次曝光
2025-01-19 11:58:00