模态,指令,框架,模态,模型,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中，「有效加速」和「超级对齐」已经成为两个主要的发展动向，...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时，该版本包含代码和权重，但仅供研究使用，而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

文本、图像、点云任意模态输入，AI能够一键生成高质量CAD模

...同完成，是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计（CAD）生成大模型。计算机辅助设计（Computer-Aided Design，简称 CAD）软件是工业软件的重要分支，也是工业设计流程中的核心工具。然而，目前...……更多

2024-11-26 09:46:00一键,模态,高质量,生成,模型,图像

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...数字空间和物理世界的交互来完成复杂任务。近年来，多模态大模型和机器人技术得到了长足发展，具身智能成为全球科技和产业竞争的新焦点。然而，目前缺少一篇能够全面解析具身智能发展现状的综述。因此，鹏城实验室多...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...或者语音的交互。这促使我们思考：如何构建具有更丰富模态的3D自主角色呢?要实现这个目标，主要面临两个挑战:1. 3D角色需要准确观察和理解用户行为信息，并基于上下文和角色设定通过语音、肢体动作和表情做出合适的回应...……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...对用户指令的忠实性。具体而言，AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰，忠实地完成用户预设的目标，是一个尚待研究的问题，也是实际应用之前必须回答的问题。针对上述问题，本文以图形用户界面智...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

昆仑万维SkyReels团队正式发布并开源SkyReels-

...fusion-forcing)框架的无限时长电影生成模型，其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优化。回顾过去……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

全球首个多模态地理科学大模型“坤元”发布：可据指令生成专业地

...，中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型，“坤元”不仅精通地理学的精髓，更在“懂地理”、“精配图”、“知人心”、“智生...……更多

2024-09-19 19:53:00坤元,地理,模态,图表,指令,生成

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...示，这个生成速度在业内已经算非常快了。张鹏认为，多模态模型的探索还处于非常初级的阶段。从生成视频的效果看，对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都有非常大的提升空间。从模型本身角度...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

...统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活的输入信号，以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

全国首个成都创新团队发布机器人多模态模型

中国首个机器人多模态模型，可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果，根据语音指令，机器人会把苹果送到你手上；如果想收拾干净桌面，机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多

2024-08-13 09:51:00模态,人多,成都,模型,团队,机器

【2025数博会】“月球科学多模态专业大模型V2.0”正式发

...行业大模型成果发布暨供需对接活动”上，“月球科学多模态专业大模型V2.0”正式发布，并将全面赋能“数字月球云平台”，加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多

2025-08-30 04:58:00月球,模态,模型,数字,科学,专业

苹果大模型，不藏了

...模型领域的步伐。上个月，苹果先是推出了名为Ferret的多模态大语言模型，图像处理技术堪称惊艳；而后又发布了一篇题为《闪存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-modal Large Language Models, MLLMs）以文本模态为基础，将其它...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

银河通用王鹤：用三维视觉小模型+基础大模型实现具身智能

...径。为什么这样认为。对此，王鹤在具身智能大会具身多模态大模型论坛上给出了解释，科技行者就这一演讲关键内容进行了不改变原意的整理：机器人从动嘴到动手有多难最近，具身多模态大模型非常火，我们看到了OpenAI和Fig...……更多

2024-04-15 10:13:00模型,三维,银河,视觉,智能,基础

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

机器人多模态模型及双臂协作系统在川发布

●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素，综合判断、生成任务并执行任务，是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多

2024-08-13 06:37:00模态,人多,双臂,协作,模型,机器

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助多模态大模型对实时信息进行...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...究团队及其合作者旨在为足球视频理解开发一个全面的多模态框架。具体来说，他们做出了以下贡献：（1）他们提出了 SoccerReplay-1988，这是迄今为止最大的多模态足球数据集，其中包括来自 1988 场完整比赛的视频和详细注释，...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

吉利星睿AI大模型正式发布引领中国汽车进入全场景AI时代

...用的智能生态闭环。星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型，并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多

2024-01-11 11:18:00吉利,中国,模型,场景,时代,汽车

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍，融资主要用于多模...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

新智元报道编辑：LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

page 1/2000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

“数字之城”杭州如何驶入文旅发展新赛道？

中新网杭州12月18日电(曹丹)近日，《AI涌现——2025杭州数字文旅产业发展年度报告》在浙江杭州发布。报告显示，该市数字文旅骨干企业2025年前三季度营收同比增长10

2025-12-19 08:24:00

天立教育与腾讯教育达成战略合作，携手推动K12教育智能化升级

2025年12月16日，天立教育与腾讯教育达成战略合作。双方将深度融合腾讯的前沿AI技术能力，与天立启鸣在K12教育领域积累的教学经验与实践场景

2025-12-19 08:26:00

特步签约全运会冠军刘景扬，从耐力赛道到速度赛场的战略延伸

12月18日，中国领先体育用品品牌特步正式宣布第十五届全运会女子100米栏冠军刘景扬成为特步体育代言人。此次合作不仅是特步运动资源矩阵的拓展

2025-12-19 08:26:00

西交利物浦大学启用沉浸式球幕影院，MEGA创意媒体盛典与国际

12月18日，西交利物浦大学影视与创意科技学院揭幕沉浸式球幕影院，并举办第五届MEGA国际创意媒体盛典，同时宣布国际沉浸媒体联盟正式成立

2025-12-19 08:26:00

协同作战、共创大美食材节，良之隆集团328百天倒计时动员会举

12月18日，是良之隆・2026第十四届中国食材电商节的倒计时100天。在此之际，良之隆集团举办了3·28百天倒计时动员会

2025-12-19 08:26:00

东湖评论：社科+AI，马克思主义理论学科大有可为

马克思曾指出：“生产力是社会发展的最终决定力量。”AI作为第四次工业革命的重要推动力量，正用数据、算法和算力重构生产力的模样

2025-12-19 10:56:00

虚拟数字人“国标”让智能服务迈上新台阶

我国虚拟数字人领域首个国家标准《信息技术客服型虚拟数字人通用技术要求》近日正式发布。该标准的出台填补了行业技术规范的空白

2025-12-19 12:14:00

烟草证变“信用凭证”！建行上饶分行“善营贷”为商户注入经营活

“有烟草证就能办纯信用贷款，50万元额度随借随还，这下旺季订烟的资金缺口彻底补上了！”上饶市余干县一家超市负责人李先生

2025-12-19 12:14:00

无锡移动以用户体验重塑服务价值

在数字经济与日常生活深度融合的今天，优质的服务体验已成为衡量企业核心竞争力的重要标尺。中国移动通信集团江苏有限公司无锡分公司（下称“无锡移动”）再次荣获国家级“用户满意服务”认证

2025-12-19 13:15:00

米连科技布局多元社交矩阵，满足不同情感连接场景

当提及线上社交平台时，许多人脑海中首先浮现的仍是“婚恋”或“约会”的单一标签。然而，米连科技通过其创新实践，正在系统性地打破这一固有印象

2025-12-19 13:58:00

之江实验室021科学基础模型开发迈出重要一步为科研培养智慧

浙江日报杭州12月18日讯（记者何冬健通讯员肖乐）记者18日从之江实验室举办的021科学基础模型创新合作大会上获悉

2025-12-19 08:54:00

聚焦“共享用工”与“数字人” 填补产业管理空白高新区（滨江

在共享经济与人工智能技术加速融合、新就业形态不断涌现的当下，如何规范发展、保障权益、激发创新活力成为关键。近日，由杭州高新区（滨江）市场监督管理局牵头起草的两项团体标准——《共享

2025-12-19 06:51:00

小镇工厂在拼多多掀起产业浪潮︓宠物经济如何催生﹃猫窝革命﹄?

本报记者程宬3000元本金、一张百货柜台、十来个工人，这是彭广杰2020年春天的全部家底；三年半后，他的PAOFU宠物用品旗舰店在拼多多日出5000单

2025-12-19 07:18:00

具身智能加速融入千行百业

在工厂轻松搬运物料、在医院为患者做预诊、在赛场上竞速奔跑……2025年即将收官，“具身智能”以高票入选年度十大流行语榜单第二名

2025-12-19 07:18:00

南京企业青睐创新联合体

出门问问打造的AIGC产品服务用户数已超1500万、江苏奥赛康研制的新型抗感染药物加速攻关……时至今日，在南京，一个个令人瞩目的成果背后

2025-12-19 07:18:00

头条订阅服务