模态,模型,科技,模态,模型,场景头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...犀大模型，经过不断升级，已从单一的语言处理走向了多模态能力，涵盖了语言、语音、图像、视频和数字人等。这一跨越，得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多

2024-07-31 11:48:00京东,人工智能,院长,研究院,人工,模型

北京智源研究院发布原生多模态世界模型Emu3

...者刘峣）近日，北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成，成功验证了基于下一个token（词元）预测的多模态技术范式，释放其在大规模训练和推理上...……更多

2024-10-24 05:12:00模态,北京,研究院,模型,研究,世界

从技术变革到生态协同报告总结人工智能产业发展十个趋势

...事业”。报告总结出人工智能产业发展十个趋势，即：多模态预训练大模型是人工智能产业的标配；高质量数据愈发稀缺将倒逼数据智能飞跃；智能算力无处不在的计算新范式加速实现；人工智能生成内容应用向全场景渗透；人...……更多

2023-12-06 22:32:00人工智能,产业发展,变革,人工,生态,趋势

中信证券：谷歌Gemini模型发布 AI进入多模态时代

中信证券：谷歌Gemini模型发布 AI进入多模态时代【中信证券：谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电，中信证券研报指出，近日，谷歌宣布发布新一代大模型Gemini，再次引发市场对人工智能产业的持续关注。Gemi...……更多

2023-12-07 09:19:00中信证券,模态,中信,模型,时代,证券

西云算力举办AIGC沙龙,CTO梁峰分享“全系列全场景智算基

...从技术视角、落地实践、未来展望三个方面，就“领域多模态大模型的实践与创新”的话题展开分享。他介绍了“原生”多模态大模型（LLM）的典型架构和典型多模态Agent的具体案例。同时以营销场景为例分享了白海科技多模态...……更多

2024-04-15 19:00:00梁峰,全系列,基础设施,沙龙,场景,设施

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...张鹏则表示，对于Sora的出现，他并不吃惊，因为立足多模态领域的深耕，智谱也正在做这件事。如今，“清影”面世，让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态，也让没有视频制作基础的小...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

【新智元导读】全球首个支持多主体一致性的多模态模型，刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...3D空间领域生成式AI引擎，包括底层的超级算力中心、多模态的海量产业数据，以及自研空间AIGC大模型。在这个引擎之上，已经开始生长出丰富的，服务于不同场景和需求的AI应用，它们正在解决每个应用场景中的个性化问题。...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...性创新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...一款名为 LVAFusion 的模块，旨在更高效、更准确地融合多模态信息。图 | 徐冬阳（来源：徐冬阳）自动驾驶在路上应该具备学习优秀人类驾驶员的能力，因为人类在面对多数场景的时候，可以迅速地定位在关键区域。为了提高端...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

若愚科技推出九天机器人大脑，大模型总参数规模达130亿｜项

...商合作，提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向：一是负责感知层面的感知模型，二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多

2023-12-26 09:36:00九天,机器人,大脑,模型,机器,参数

智源评测体系发布国内外“百模”评估结果出炉

...系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

百灵大模型多模态能力全面提升

...IT之家从蚂蚁集团获悉，蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”，能“说”会“画”，可支持音、视、图、文等多模态理解与生成，可以让大模型更像人一样感知和互动，未来...……更多

2024-07-06 17:43:00模态,百灵,模型,能力,模态,助理

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

反击OpenAI，谷歌放出最强悍大模型Gemini

... CEO戴密斯·哈萨比斯在谷歌官网联名发文，官宣了最新多模态大模型Gemini 1.0（双子星）版本正式上线。这个上线时间早于外界猜测的明年1月，保密程度很高，仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

跨模态大模型“白泽”学会藏语

...新藏语内容理解与应用技术，人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后，显著提升了“白泽”对藏语内容的理解和处理能力，为网络空间藏语内容处理提供了全新的技术...……更多

2024-09-23 21:20:00藏语,模态,模型,藏语,模态,智能

联通元景大模型亮相2024年中国品牌日打造产业智能化新范式

...供互联网实时资讯问答以及更好的数学计算等服务。在多模态大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能...……更多

2024-05-13 15:00:00范式,中国,模型,智能,产业,品牌

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单

...联汇科技预训练大模型拥有国际领先的能力优势，自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一，在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军，大模型...……更多

2023-02-01 10:00:00联汇,之心,中国,重量,机器,年度

云知声荣登甲子光年榜单，彰显AI大模型商业潜力

...现出色，行业领先。2024年8月，云知声正式推出了山海多模态大模型，该模型通过整合跨模态信息，能够接收文本、音频、图像等多种形式的输入，并实时生成文本、音频和图像的任意组合输出，带来了实时多模态拟人交互体验...……更多

2024-12-13 16:22:00甲子,潜力,模型,商业,模型,山海

“解锁”AI云盘新体验！中国移动云盘通过3项AI算法备案

...中，中国移动云盘3项大模型算法成功通过备案，涵盖多模态大模型、文本生成算法等。去年9月，中国移动云盘启动AI智能工具内测，本次算法备案成功标志着中国移动云盘可正式对外提供深度合成人工智能服务，在国内AI云盘赛...……更多

2024-04-18 23:03:00云盘,中国,算法,中国移动,体验,移动

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-

...，无问芯穹今日宣布，开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示，Megrez-3B-Omni 是一个为端而生的全模态理解模型，同时具备图片、音频、文本三种模态数据的...……更多

2024-12-17 09:24:00模态,模型,全球,模态,模型,精度

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝