模态,模型,科技,模态,模型,场景头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

北大等出品，首个多模态版o1开源模型来了——代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...qizhixin.com随着大模型研究的深入，如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力，LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...大模型以及丰富第三方模型（如Llama、百川等）。支持多模态模型服务，提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中，通义方面发布了最强开源模...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

「千诀科技」推出通用感知大模型，专注机器人全脑研发｜早期项

...大产品突破。丘脑是一个多功能的脑区，用于将动物的多模态感官信息进行提取，传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站，它除了收发感官信息以外，还要对其进行一定的处理，包括压缩、解析以及调节生理...……更多

2023-12-26 19:41:00机器人,模型,机器,项目,科技,丘脑

AI大模型加速迭代产业链公司获机构重点布局

...为，从Pika、Gemini1.0到Sora和Gemini1.5，支持AI视频生成的AI多模态模型不断突破，特别是Sora能够理解和模拟现实世界的模型基础，有望成为实现AGI（通用人工智能）的重要突破节点。AI视频生成等多模态模型有望在影视、动画、游戏...……更多

2024-02-19 07:17:00迭代,产业链,布局,模型,重点,机构

百度与优必选合作，人形机器人“大脑”有了AI大模型

...r S在具身智能理应用等方面又迎来了新进展，在已有的多模态感知与运动控制能力上，通过接入文心大模型，获得了高级的意图理解能力和细粒度规划能力。从视频来看，接入了AI大模型的Walker S在语义理解与交互、智能任务管...……更多

2024-04-02 11:23:00人形,机器人,大脑,模型,机器,合作

微软新专利：构建多模态3d面部模型

...单，微软公司获得了一项新的专利，通过深度学习构建多模态3D面部模型，可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪，生成富有表现力的虚拟肖像》，该系统涉及处理器和存储系统，处理器负...……更多

2024-04-24 12:03:00模态,微软,面部,模型,专利,面部

网达软件：公司“视联网数字化智能平台”不涉及多模态模型

网达软件：公司“视联网数字化智能平台”不涉及多模态模型【网达软件：公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电，网达软件发布异动公告，近日市场对于AI视频生成、多模态模型等相关概念较为...……更多

2023-12-08 20:40:00网达,模态,模型,数字,智能,平台

鬼手操控着你的手机？大模型GUI智能体易遭受环境劫持

...对用户指令的忠实性。具体而言，AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰，忠实地完成用户预设的目标，是一个尚待研究的问题，也是实际应用之前必须回答的问题。针对上述问题，本文以图形用户界面智...……更多

2024-09-03 09:59:00模型,环境,智能,手机,环境,干扰

打造全球智能消费决策社区，「阿尔特科技」希望提供“像闺蜜一样

...评测和信息验证；在需求端，这款App以团队内部开发的多模态模型为支撑，能捕捉细微的用户行为，进而根据用户的实际需求和消费习惯精准推送用户可能感兴趣的产品，帮助用户挑选更合适的、更高性价比的产品，降低客户遇...……更多

2023-11-15 08:15:00阿尔,阿尔特,决策,消费,针对性,辅助

软通智慧数智成果发布暨战略合作签约仪式举行

...算力灵畅服务体系、卧龙策渊人工智能平台，以及基于多模态感知的多元共治产品体系。活动现场。软通智慧供图正式发布“AI算力灵畅服务体系”，助力算力从“可用”走向“好用”，为人工智能产业区域发展带来全新解决方...……更多

2024-08-30 13:23:00成果发布,仪式,成果,智慧,战略,合作

国内首个极速超拟人交互向全民开放可在星火大模型中体验

...模型算法持续演进，国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案，已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络，实现语音到语音的“端到端”建模，大幅...……更多

2024-09-03 11:00:00中体,星火,拟人,全民,可在,模型

苹果公司公布“mm1”多模态大模型

...omMultimodalLLMPre-training》的论文，其中介绍了一款“MM1”多模态大模型，该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

【新智元导读】Meta首个理解图文的多模态Llama 3.2来了！这次，除了11B和90B两个基础版本，Meta还推出了仅有1B和3B轻量级版本，适配了Arm处理器，手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月，全新升级后的Llama 3....……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

CARES Copilot 1.0大模型发布并开放

...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布，现已面向香港神经外科医生开放使用。据悉，CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统，实现了对图像、文本、...……更多

2024-04-01 02:22:00模型,开放,中国科学院,香港,模型,医疗

讯飞星火V3.5春季上新，科大讯飞首发星火图文识别大模型

...你也能化身法律专家。越来越多的从业者已经认识到，多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环，可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃，为未...……更多

2024-04-29 21:00:00讯飞,星火,模型,图文,模型,星火

BEV“超融合”感知部署轻舟智航迈出量产从0到1的关键一步

...先的数据闭环能力，并创新构建了离线点云大模型，为跨模态的数据标注、数据挖掘和模型训练提供强大支持，大幅提高数据价值和利用效率，提升长尾场景处理能力。在数据标注方面，轻舟智航可实现2D图像和3D图像的自动化...……更多

2023-11-01 20:27:00轻舟,关键,轻舟,模型,场景,数据

蔚蓝 BabyAlpha A2 机器狗发售：国内首发多模态交

...yAlpha Dev 定价 6699 元起。BabyAlpha A2 号称是国内首款具备多模态交互能力的 AI 机器人，可定制、支持绘本功能，支持多模态音视频通话、远程遥控拍照，内置大语言模型，支持中英文双语无缝切换，以及搭载智能体操作系统 Agent O...……更多

2024-10-22 09:49:00模态,元起,发售,机器,定价,元起

蔚来 NOMI GPT 端云多模态大模型上线

蔚来 NOMI GPT 端云多模态大模型正式上线，并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉，NOMI GPT是为NOMI打造的端云多模态大模型，基于自研的端云融合架构，拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多

2024-04-12 13:09:00模态,模型,模态,多维度,多维,模型

年轻人的好友列表，AI越来越多

...字人，还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程，会有延时，Soul 现在语音对话延迟不到 200 毫秒，因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音，现在能将...……更多

2024-10-22 13:53:00越来,越来越,年轻人,好友,模型,社交

马斯克 xAI 展示首个多模态模型 Grok-1.5V

...下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。xAI ...……更多

2024-04-13 16:20:00马斯,马斯克,模态,模型,模态,模型