模态,模型,科技,模态,模型,场景头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

百度与优必选合作，人形机器人“大脑”有了AI大模型

...r S在具身智能理应用等方面又迎来了新进展，在已有的多模态感知与运动控制能力上，通过接入文心大模型，获得了高级的意图理解能力和细粒度规划能力。从视频来看，接入了AI大模型的Walker S在语义理解与交互、智能任务管...……更多

2024-04-02 11:23:00人形,机器人,大脑,模型,机器,合作

微软新专利：构建多模态3d面部模型

...单，微软公司获得了一项新的专利，通过深度学习构建多模态3D面部模型，可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪，生成富有表现力的虚拟肖像》，该系统涉及处理器和存储系统，处理器负...……更多

2024-04-24 12:03:00模态,微软,面部,模型,专利,面部

网达软件：公司“视联网数字化智能平台”不涉及多模态模型

网达软件：公司“视联网数字化智能平台”不涉及多模态模型【网达软件：公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电，网达软件发布异动公告，近日市场对于AI视频生成、多模态模型等相关概念较为...……更多

2023-12-08 20:40:00网达,模态,模型,数字,智能,平台

空间智能新进展：教机器人组装家具，实现操作步骤与真实视频对齐

...的视频教程！具体来说，团队提出了用于机器人的大型多模态数据集IKEA Video Manuals，已入选NeurIPS。数据集涵盖了6大类IKEA家具，每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细，拆解出的安装子步骤多...……更多

2024-11-27 09:57:00新进,机器人,步骤,机器,家具,智能

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...对用户指令的忠实性。具体而言，AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰，忠实地完成用户预设的目标，是一个尚待研究的问题，也是实际应用之前必须回答的问题。针对上述问题，本文以图形用户界面智...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

打造全球智能消费决策社区，「阿尔特科技」希望提供“像闺蜜一样

...评测和信息验证；在需求端，这款App以团队内部开发的多模态模型为支撑，能捕捉细微的用户行为，进而根据用户的实际需求和消费习惯精准推送用户可能感兴趣的产品，帮助用户挑选更合适的、更高性价比的产品，降低客户遇...……更多

2023-11-15 08:15:00阿尔,阿尔特,决策,消费,针对性,辅助

软通智慧数智成果发布暨战略合作签约仪式举行

...算力灵畅服务体系、卧龙策渊人工智能平台，以及基于多模态感知的多元共治产品体系。活动现场。软通智慧供图正式发布“AI算力灵畅服务体系”，助力算力从“可用”走向“好用”，为人工智能产业区域发展带来全新解决方...……更多

2024-08-30 13:23:00成果发布,仪式,成果,智慧,战略,合作

国内首个极速超拟人交互向全民开放可在星火大模型中体验

...模型算法持续演进，国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案，已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络，实现语音到语音的“端到端”建模，大幅...……更多

2024-09-03 11:00:00中体,星火,拟人,全民,可在,模型

京东发布AI全景图，未来三年持续投入构建万亿人工智能生态

...用同时亮相物流全新升级的物流超脑大模型2.0全面走向多模态，标志着物流的“超脑”正在从辅助决策到具身执行。通过多个智能设备协作，大幅提升物流供应链作业效率，标准化操作水平提升15%，人机协同作业效率提升20%；首...……更多

2025-09-25 18:10:00京东,全景,人工智能,人工,投入,生态

苹果公司公布“mm1”多模态大模型

...omMultimodalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

【新智元导读】Meta首个理解图文的多模态Llama 3.2来了！这次，除了11B和90B两个基础版本，Meta还推出了仅有1B和3B轻量级版本，适配了Arm处理器，手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月，全新升级后的Llama 3....……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

CARES Copilot 1.0大模型发布并开放

...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布，现已面向香港神经外科医生开放使用。据悉，CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统，实现了对图像、文本、...……更多

2024-04-01 02:22:00模型,开放,中国科学院,香港,模型,医疗

讯飞星火V3.5春季上新，科大讯飞首发星火图文识别大模型

...你也能化身法律专家。越来越多的从业者已经认识到，多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环，可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃，为未...……更多

2024-04-29 21:00:00讯飞,星火,模型,图文,模型,星火

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...“证明了R1方法的通用性，不止文本领域玩得转”“为多模态AI带来全新思路”“或许能够引领一种全新的视觉语言模型训练潮流”……业内人士纷纷对 VLM-R1表示高度认可。“视觉版DeepSeek”为什么是VLM-R1？VLM-R1爆火，看似意料...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球

BEV“超融合”感知部署轻舟智航迈出量产从0到1的关键一步

...先的数据闭环能力，并创新构建了离线点云大模型，为跨模态的数据标注、数据挖掘和模型训练提供强大支持，大幅提高数据价值和利用效率，提升长尾场景处理能力。在数据标注方面，轻舟智航可实现2D图像和3D图像的自动化...……更多

2023-11-01 20:27:00轻舟,关键,轻舟,模型,场景,数据

蔚蓝 BabyAlpha A2 机器狗发售：国内首发多模态交

...yAlpha Dev 定价 6699 元起。BabyAlpha A2 号称是国内首款具备多模态交互能力的 AI 机器人，可定制、支持绘本功能，支持多模态音视频通话、远程遥控拍照，内置大语言模型，支持中英文双语无缝切换，以及搭载智能体操作系统 Agent O...……更多

2024-10-22 09:49:00模态,元起,发售,机器,定价,元起

欢瑞世纪与阶跃星辰达成战略合作，共建“麟跃”AI联合实验室

...“麟跃”AI联合实验室，并接入阶跃星辰两款最新开源多模态模型——Step-Video-T2V视频生成模型和Step-Audio语音交互模型，以AI技术赋能影视内容生产。此次合作标志着欢瑞世纪加速AI领域的布局，推动影视产业智能化转型，并与其...……更多

2025-02-21 11:52:00星辰,实验室,战略,实验,联合,合作

蔚来 NOMI GPT 端云多模态大模型上线

蔚来 NOMI GPT 端云多模态大模型正式上线，并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉，NOMI GPT是为NOMI打造的端云多模态大模型，基于自研的端云融合架构，拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多

2024-04-12 13:09:00模态,模型,模态,多维度,多维,模型

年轻人的好友列表，AI越来越多

...字人，还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程，会有延时，Soul 现在语音对话延迟不到 200 毫秒，因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音，现在能将...……更多

2024-10-22 13:53:00越来,越来越,年轻人,好友,模型,社交

马斯克 xAI 展示首个多模态模型 Grok-1.5V

...下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。xAI ...……更多

2024-04-13 16:20:00马斯,马斯克,模态,模型,模态,模型