模态,模型,文心,模型,哪吒,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝

五连板苏州科达：公司的KD-GPT大模型相对于谷歌Gemin

...板苏州科达：公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别【五连板苏州科达：公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电，苏州科...……更多

2023-12-13 17:47:00科达,模型,模态,苏州,对象,服务

【2025数博会】“月球科学多模态专业大模型V2.0”正式发

...行业大模型成果发布暨供需对接活动”上，“月球科学多模态专业大模型V2.0”正式发布，并将全面赋能“数字月球云平台”，加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多

2025-08-30 04:58:00月球,模态,模型,数字,科学,专业

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要，是实现AGI的必经之路。”对大模型的下一步发展，李璟表示，阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习，提高模型...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

猎豹CEO傅盛2024年预言：千亿大模型过半凋零，人形机器人

...景划分，AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多

2024-01-23 09:58:00猎豹,人形,机器人,预言,模型,现状

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型（MLLMs）在各个排行榜上展现的性能不断提...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

东方证券：谷歌发布多模态模型Gemini，多模态应用前景广阔

...办公、法律、医疗有望率先落地。东方证券：谷歌发布多模态模型Gemini，多模态应用前景广阔12月6日晚，谷歌正式发布了Gemini大模型，是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多

2023-12-11 19:30:00模态,前景,模型,应用,证券,模态

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...音乐理解和生成结合在一起的想法比较新颖，论文也是多模态大模型领域的先期工作之一。并且，除了大模型本身，我们提出的针对模型训练的数据集制作流程和整理的数据集，对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

百灵大模型多模态能力全面提升

...IT之家从蚂蚁集团获悉，蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”，能“说”会“画”，可支持音、视、图、文等多模态理解与生成，可以让大模型更像人一样感知和互动，未来...……更多

2024-07-06 17:43:00模态,百灵,模型,能力,模态,助理

理想汽车多模态认知大模型Mind GPT正式上线

理想汽车多模态认知大模型Mind GPT正式上线【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电，理想汽车今日宣布，全自研多模态认知大模型Mind GPT已正式上线，成为首个通过备案的汽车厂商自研大模型。（财联社...……更多

2024-03-28 13:14:00模态,认知,模型,理想,汽车,模态

润建股份：公司曲尺平台开发的AI行业模型支持多模态

润建股份：公司曲尺平台开发的AI行业模型支持多模态【润建股份：公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电，润建股份在互动平台表示，公司曲尺平台开发的AI行业模型支持多模态，多模态底座具备文生图...……更多

2023-12-20 22:23:00曲尺,模态,模型,股份,支持,开发

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。随便上传一张图，...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

李未可科技正式推出WAKE-AI多模态AI大模型

...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型，具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互，同时多模态问答技术的加...……更多

2024-04-19 14:30:00模态,模型,科技,模态,模型,场景

云鼎科技：公司盘古矿山大模型自然语言处理和多模态能力方面应用

云鼎科技：公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段【云鼎科技：公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电，云鼎科技发布股价异动公告，...……更多

2023-12-12 19:34:00盘古,模态,自然语言,矿山,模型,场景

深化战略合作三星携手百度共同打造Galaxy S24 系列

...的场景会更加丰富多样，凭借对文字、图像、音视频等多模态数据的深刻理解，以及挖掘用户个性化需求的精准能力，文心大模型将打造出更多贴近用户个性化需求的AI产品。三星Galaxy S24系列大模型能力被看好，百度智能云成智...……更多

2024-01-29 15:00:00三星,生成,战略,体验,合作,三星

跨模态大模型“白泽”学会藏语

...新藏语内容理解与应用技术，人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后，显著提升了“白泽”对藏语内容的理解和处理能力，为网络空间藏语内容处理提供了全新的技术...……更多

2024-09-23 21:20:00藏语,模态,模型,藏语,模态,智能

大华股份：星汉大模型以视觉为核心支持多模态分析

...里!公司回答表示：公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解，还能根据用户提示完成特定分析功能，同时也支持文本等其它模态数据的理解，支持人机交互等...……更多

2025-01-10 15:48:00大华,模态,星汉,模型,视觉,核心

微软新专利：构建多模态3d面部模型

...单，微软公司获得了一项新的专利，通过深度学习构建多模态3D面部模型，可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪，生成富有表现力的虚拟肖像》，该系统涉及处理器和存储系统，处理器负...……更多

2024-04-24 12:03:00模态,微软,面部,模型,专利,面部

网达软件：公司“视联网数字化智能平台”不涉及多模态模型

网达软件：公司“视联网数字化智能平台”不涉及多模态模型【网达软件：公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电，网达软件发布异动公告，近日市场对于AI视频生成、多模态模型等相关概念较为...……更多

2023-12-08 20:40:00网达,模态,模型,数字,智能,平台

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

百度世界2023剧透丨百度将发布国内首个生成式商业智能产品

...现了从图形界面交互到自然语言交互的转变，还增强了多模态信息理解。用户只需要一句话，就能对网盘内的文件、图片、视频等进行操作，方便用户在网盘里、视频里“找东西”。值得一提的是，百度网盘“云一朵”还可以帮...……更多

2023-10-12 21:00:00商业智能,生成,智能,商业,世界,产品

国际首个，我国团队开发糖尿病诊疗多模态大模型 DeepDR-

...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM，成果于 2024 年 7 月 19 日在 Nature Medicine 发表（题为 Integrated image-based deep learning and language models for primary diabetes care）……更多

2024-07-26 09:27:00糖尿,模态,诊疗,糖尿病,模型,团队