模态,缺陷,测试,模态,模型,心智头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

阿里云CTO周靖人：全面投入升级AI大基建

...模型Qwen2.5系列，同时上架语言、音频、视觉等100多款全模态模型，通义开源模型累计下载量已经突破4000万，通义原生模型和衍生模型总数超过5万，成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代，AI时代...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...对用户指令的忠实性。具体而言，AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰，忠实地完成用户预设的目标，是一个尚待研究的问题，也是实际应用之前必须回答的问题。针对上述问题，本文以图形用户界面智...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

... AI 发起挑战的高规格赛事落下了帷幕！这就是第二届多模态情感识别挑战赛（MER24），它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...数据泄露，从而反映模型的真实性能。研究团队测试了多模态大模型（LMMs）和纯文本大模型（LLMs）。对于LLMs的测试，输入时不提供任何与图像相关的信息给模型，仅提供文本。所有评估均采用零样本（zero-shot）思维链（Chain of ...……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

“试用完谷歌的新AI模型，再也不爱GPT”

...越 GPT-4 ， Gemini 最特殊的一点是，它是谷歌带来的首个多模态大模型，也就是能不光能打字互动，也能进行语音、视频、图片的互动。按照谷歌的说法，现有的所谓多模态大模型，都是单独训练了文本、视觉和音频等模型，再把...……更多

2023-12-12 00:22:00模型,模态,模型,答案,大杯,能力

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...布，“大杀器”Gemini 1.0，正式上线。Gemini是一个原生多模态大模型，谷歌在今年5月的I/O大会宣布开始研发后，Gemini的传说不断：将谷歌大脑和DeepMind部门合并，数百人攻坚，几乎耗尽谷歌内部计算资源……如此种种，只为和OpenA...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

Gemini 开启大模型路线之争，新战场将“数流成河”

...一种可能性：具有原生数据优势的互联网巨头，可能在多模态大模型竞争中占据优势。这意味着，谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局，进入...……更多

2023-12-15 10:02:00成河,战场,模型,路线,马斯,马斯克

阿里达摩院发布业内首个遥感ai大模型，支持多模态交互

...业应用。IT之家归纳总结该遥感大模型特点如下：支持多模态交互，如输入“提取影像中的耕地农田”，会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别，并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多

2023-10-21 17:12:00达摩,模态,遥感,阿里,模型,业内

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...zhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

松鼠Ai智适应教育大模型全新升级

...与科技融合的盛宴。松鼠Ai举行发布会，不仅展示了其多模态智适应教育大模型及系统的全方位升级，还推出了多款前沿的智适应教育硬件产品，为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多

2024-06-19 10:57:00松鼠,模型,全新,升级,教育,松鼠

全球首个多模态地理科学大模型“坤元”发布：可据指令生成专业地

...，中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型，“坤元”不仅精通地理学的精髓，更在“懂地理”、“精配图”、“知人心”、“智生...……更多

2024-09-19 19:53:00坤元,地理,模态,图表,指令,生成

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...像与语音识别能力。本月初，微软更是公布了 166 页的多模态版 GPT-4V 的相关文档，详细探讨了 GPT-4V 的功能和使用情况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

智源评测体系发布国内外“百模”评估结果出炉

...系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

解密星辰大模型·软件工厂软件开发迈入智能化全流程新阶段

...AI 领域的一家，从去年至今，从星辰语义大模型到星辰多模态大模型和星辰语音识别大模型，中国电信旗下大模型始终保持着快速迭代，且完成了语义、语音、视觉、多模态的全模态大模型布局。7月5日，中电信人工智能科技有...……更多

2024-07-15 19:52:00软件工厂,软件,星辰,软件开发,模型,流程

Bengio团队提出多模态新基准，直指Claude 3.5和

...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

北京人工智能数据运营平台发布

...大量通用数据、行业数据，支持文本、图像、视频等多种模态，并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练，同时，4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据