模态,指令,框架,模态,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中，「有效加速」和「超级对齐」已经成为两个主要的发展动向，...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时，该版本包含代码和权重，但仅供研究使用，而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

文本、图像、点云任意模态输入，AI能够一键生成高质量CAD模

...同完成，是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计（CAD）生成大模型。计算机辅助设计（Computer-Aided Design，简称 CAD）软件是工业软件的重要分支，也是工业设计流程中的核心工具。然而，目前...……更多

2024-11-26 09:46:00一键,模态,高质量,生成,模型,图像

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...数字空间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和产业竞争的新焦点。然而，目前缺少一篇能够全面解析具身智能发展现状的综述。因此，鹏城实验室多...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...或者语音的交互。这促使我们思考：如何构建具有更丰富模态的3D自主角色呢?要实现这个目标，主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息，并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...对用户指令的忠实性。具体而言，AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰，忠实地完成用户预设的目标，是一个尚待研究的问题，也是实际应用之前必须回答的问题。针对上述问题，本文以图形用户界面智...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

全球首个多模态地理科学大模型“坤元”发布：可据指令生成专业地

...，中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型，“坤元”不仅精通地理学的精髓，更在“懂地理”、“精配图”、“知人心”、“智生...……更多

2024-09-19 19:53:00坤元,地理,模态,图表,指令,生成

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...示，这个生成速度在业内已经算非常快了。张鹏认为，多模态模型的探索还处于非常初级的阶段。从生成视频的效果看，对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都有非常大的提升空间。从模型本身角度...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

...统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活的输入信号，以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

全国首个成都创新团队发布机器人多模态模型

中国首个机器人多模态模型，可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果，根据语音指令，机器人会把苹果送到你手上；如果想收拾干净桌面，机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多

2024-08-13 09:51:00模态,人多,成都,模型,团队,机器

苹果大模型，不藏了

...模型领域的步伐。上个月，苹果先是推出了名为Ferret的多模态大语言模型，图像处理技术堪称惊艳；而后又发布了一篇题为《闪存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-modal Large Language Models, MLLMs）以文本模态为基础，将其它...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...径。为什么这样认为。对此，王鹤在具身智能大会具身多模态大模型论坛上给出了解释，科技行者就这一演讲关键内容进行了不改变原意的整理：机器人从动嘴到动手有多难最近，具身多模态大模型非常火，我们看到了OpenAI和Fig...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

机器人多模态模型及双臂协作系统在川发布

●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素，综合判断、生成任务并执行任务，是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多

2024-08-13 06:37:00模态,人多,双臂,协作,模型,机器

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

吉利星睿AI大模型正式发布引领中国汽车进入全场景AI时代

...用的智能生态闭环。星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型，并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多

2024-01-11 11:18:00吉利,中国,模型,场景,时代,汽车

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...究团队及其合作者旨在为足球视频理解开发一个全面的多模态框架。具体来说，他们做出了以下贡献：（1）他们提出了 SoccerReplay-1988，这是迄今为止最大的多模态足球数据集，其中包括来自 1988 场完整比赛的视频和详细注释，...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍，融资主要用于多模...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。随便上传一张图，...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

page 1/2000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

当AI裁缝遇上3D织梦机走进“所想即所见”的时尚未来

7月31日下午，一场科技与美学的奇幻碰撞正在上演，孩子们的手指轻划屏幕，一件又一件充满设计感的服装瞬间“穿”在虚拟模特身上

2025-08-02 08:14:00

250万元撬动2000万元！六盘水：“小”券激活“大”经济

7月31日晚七点，金鸿购物超市人潮涌动。王女士的购物车里放着刚挑选好的榴莲和小龙虾，手机里一张“满100减30”的消费券即将核销

2025-08-02 13:57:00

德州扒鸡：在传承与创新中焕发新生

鲁网8月2日讯（记者吴美琳实习记者费书慧）8月1日，德州市举行第二场“产业链上的山东好品牌”系列记者见面会，邀请山东德州扒鸡股份有限公司副董事长

2025-08-02 14:13:00

从清晨到日暮恩博力以“冠军标准”定义健康家居新体验

（广告）在碧波与奖牌的背后，一位花样游泳世界冠军的日常，由无数个对细节的精准把控和对健康的不懈追求构筑而成。作为恩博力品牌代言人

2025-08-02 14:25:00

深国际·太原智慧物流制造项目主体完工

8月2日，深国际·太原智慧物流制造项目主体建设已经完工，目前，正在进行内部平台的改造，部分设备已进场。

2025-08-02 18:21:00

振健科技布局全国八大直营生产基地，引领行业高质量发展

近日，广东振健生物科技股份有限公司(以下简称：振健科技)宣布，企业已在全国范围内成功建立八大直营生产基地，主要分布在广州

2025-08-02 19:24:00

《聊斋志异·崂山道士》系列数字资产首发上线乐数通

由人民美术出版社正版授权，云栖博悟(杭州)文化传播有限公司设计发行的首款文化数字资产——《聊斋志异·崂山道士》，于2025年7月31日在浙江文化产权交易所长三角文化数字资产交易平台“乐数通”正式首发

2025-08-02 19:24:00

寻找会“讲故事”的声音展品！三诺AI+智造博物馆老物件征集

导语：在你的记忆中，是否有这样一些物件，它们曾用独特的“声音”在时光里留下印记？或许是流淌着咿呀戏曲的老式收音机，是旋转时沙沙低语的黑胶唱片

2025-08-02 19:24:00

从＂智能硬件＂到＂泛健康生态＂：倍轻松加码智能实感交互技术，

8月1日晚,倍轻松(股票代码:688793.SH)发布公告,将“信息化升级建设项目”的节余募集资金,用于面向实感交互智能的传感器矩阵搭建与应用研究

2025-08-02 19:24:00

数千万资金注入！中京云智加速“京店长”全链路解决方案落地

近日，重庆中京云智人工智能科技有限公司宣布完成数千万天使轮融资。本轮资金将重点投入核心项目“京店长”的技术研发与全国布局

2025-08-02 19:24:00

当家 APP 与龙牌集团达成战略合作，共筑家装行业新生态

7月30日上午，国内领先的互联网装修平台当家APP与建材行业龙头企业北新建材龙牌集团正式签署战略合作协议。双方宣布将在龙骨

2025-08-02 19:24:00

即小评丨“混搭”潮出圈蚂蚁市集何以成为即墨“新地标”？

大众网记者朱晓娟青岛报道“混搭”一词来源于时尚界，从服饰营销策略扩展到一种文化符号，特指通过巧妙的平衡的协调，创造出新颖

2025-08-02 14:19:00

河北开具首张数据知识产权公证存储证明

创新服务企业模式，为数字资产保护提供新的解决方案河北开具首张数据知识产权公证存储证明河北日报讯（记者马彦铭）7月28日

2025-08-02 08:54:00

燕赵新青年｜石家庄食草堂文化饰品有限公司总经理牛睿仪：“选择

石家庄食草堂文化饰品有限公司总经理牛睿仪：“选择一行，就要脚踏实地干下去”7月，牛睿仪又打卡了三个城市。作为石家庄食草堂文化饰品有限公司总经理

2025-08-02 09:01:00

“All in AI”的探索数字化转型厦企如何破题？

厦门网讯（厦门日报记者张珺）夏日鹭岛，骄阳似火。比气候更炽热的，是厦门企业在数字化转型浪潮中，对人工智能（AI）应用的破釜沉舟与积极探索

2025-08-02 09:10:00

头条订阅服务