• 我的订阅
  • 头条热搜
百度与优必选合作,人形机器人“大脑”有了AI大模型
...r S在具身智能理应用等方面又迎来了新进展,在已有的多模态感知与运动控制能力上,通过接入文心大模型,获得了高级的意图理解能力和细粒度规划能力。从视频来看,接入了AI大模型的Walker S在语义理解与交互、智能任务管...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
打造全球智能消费决策社区,「阿尔特科技」希望提供“像闺蜜一样”有针对性的消费决策辅助 | 早期项目
...评测和信息验证;在需求端,这款App以团队内部开发的多模态模型为支撑,能捕捉细微的用户行为,进而根据用户的实际需求和消费习惯精准推送用户可能感兴趣的产品,帮助用户挑选更合适的、更高性价比的产品,降低客户遇...……更多
软通智慧数智成果发布暨战略合作签约仪式举行
...算力灵畅服务体系、卧龙策渊人工智能平台,以及基于多模态感知的多元共治产品体系。活动现场。软通智慧供图正式发布“AI算力灵畅服务体系”,助力算力从“可用”走向“好用”,为人工智能产业区域发展带来全新解决方...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
京东发布AI全景图,未来三年持续投入构建万亿人工智能生态
...用同时亮相物流全新升级的物流超脑大模型2.0全面走向多模态,标志着物流的“超脑”正在从辅助决策到具身执行。通过多个智能设备协作,大幅提升物流供应链作业效率,标准化操作水平提升15%,人机协同作业效率提升20%;首...……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
...所和中国科学院香港创新研究院联合研发的医疗领域AI多模态大模型CARES Copilot 1.0日前在香港正式发布,现已面向香港神经外科医生开放使用。据悉,CARES Copilot 1.0是一款专为医疗领域设计的大型模型系统,实现了对图像、文本、...……更多
讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型
...你也能化身法律专家。越来越多的从业者已经认识到,多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环,可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃,为未...……更多
...“证明了R1方法的通用性,不止文本领域玩得转”“为多模态AI带来全新思路”“或许能够引领一种全新的视觉语言模型训练潮流”……业内人士纷纷对 VLM-R1表示高度认可。“视觉版DeepSeek”为什么是VLM-R1?VLM-R1爆火,看似意料...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
蔚蓝 BabyAlpha A2 机器狗发售:国内首发多模态交互,6099 元起
...yAlpha Dev 定价 6699 元起。BabyAlpha A2 号称是国内首款具备多模态交互能力的 AI 机器人,可定制、支持绘本功能,支持多模态音视频通话、远程遥控拍照,内置大语言模型,支持中英文双语无缝切换,以及搭载智能体操作系统 Agent O...……更多
欢瑞世纪与阶跃星辰达成战略合作,共建“麟跃”AI联合实验室
...“麟跃”AI联合实验室,并接入阶跃星辰两款最新开源多模态模型——Step-Video-T2V视频生成模型和Step-Audio语音交互模型,以AI技术赋能影视内容生产。此次合作标志着欢瑞世纪加速AI领域的布局,推动影视产业智能化转型,并与其...……更多
蔚来 NOMI GPT 端云多模态大模型正式上线,并同步对搭载Banyan·榕智能系统的车型陆续开启推送。据悉,NOMI GPT是为NOMI打造的端云多模态大模型,基于自研的端云融合架构,拥有图像、音频、车身传感器等多模感知能力的NOMI可以...……更多
年轻人的好友列表,AI越来越多
...字人,还可以实时进行沉浸式语言、肢体互动。“以前多模态交互是一个连续生成过程,会有延时,Soul 现在语音对话延迟不到 200 毫秒,因为我们已经推出了端到端大模型能力——过去先生成文本/图像再转换为语音,现在能将...……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...千帆平台上线。据介绍,文心大模型4.5是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调...……更多
猎豹CEO傅盛2024年预言:千亿大模型过半凋零,人形机器人必定不能量产【附AIGC市场现状分析】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
...有的智能座舱助手理想同学将基于Mind GPT打造新一代的多模态人机交互技术体系,在111个领域提供了超过1000种以上的专属功能,并且还在不断进化和成长之中。更多的车企选择与科技企业合作,联合开发大模型。2023年3月,百度...……更多
蚂蚁数科能源电力时序大模型EnergyTS发布 预测精度超谷歌、亚马逊
...大模型技术创新带来了传统行业的变革机遇,大模型的多模态感知理解能力将引发新交互、新服务,AI链接物理世界成为可能。在新能源领域,新能源光伏和风力发电环节,容易受到太阳辐照、风速、云量、温度、设备性能等多...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...请求时,响应可能会延迟或中断。此外,像视频生成、多模态识别这类复杂的任务也会消耗大量计算资源,导致暂时性宕机。目前,DeepSeek、OpenAI等企业正致力于设计人工智能专用芯片。这些芯片通过优化架构与信号传输效率,...……更多
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...做呢,月之暗面Kimi发布视觉思考模型k1;腾讯微信推出多模态大模型POINTS1.5;巨人网络发布千影有声游戏生成大模型,还有不胜枚举的初创公司带着自家模型的新进展试图刷个脸熟。所以呢,豆包又又又更新了。(图源:雷科技...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会,阿里云CTO周靖人发布多项重磅技术更新在大语言模型中,阿里通义旗舰模型Qwen3-Max全新亮相,性能超过GPT5、Claude Opus 4等,跻身全...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
更多关于科技的资讯:
家装测量难搞定?Fanttik激光测距仪帮你解决烦恼
在日常家装、看房验收或DIY创作中,精准与高效的测量至关重要。然而,传统工具常局限于单一功能,面对多种测量需求,用户不得不反复切换设备
2025-12-23 08:56:00
“前往杭州参加阿里巴巴的‘真牛奖’,全情投入,期待美好发生!”张英俊在朋友圈写道。工业化4.0时代,人要怎么跑赢机器?关于这个问题
2025-12-23 06:44:00
刘雨彤摘要:随着数字化进程的加速推进,大数据技术在风险管理中的作用愈发突显。传统风险管理依赖静态数据与人工判断,难以适应当前风险多变
2025-12-23 07:04:00
在日前举行的2025浙江省机器人行业发展大会上,由浙江大学机器人研究院(杭州市余杭区海创人形机器人产业创新中心)牵头,浙江省质量科学研究院
2025-12-23 07:14:00
12月17日至19日,惠购商盟“新零售数字化合规运营”高级人才研修班在国家市场监督管理总局行政学院(深圳南山)成功举办
2025-12-23 06:44:00
家委必藏!毕业照别乱找!忆学堂封神级拍摄,给娃留一辈子的青春纪念
在毕业季影像服务赛道,“专业”与“可靠”是始终不变的核心诉求。忆学堂从一间工作室成长为全国连锁品牌,凭借实打实的硬实力
2025-12-22 14:13:00
喜茶携手泡泡玛特星星人,首次全球同步联名活动正式上线
鲁网12月22日讯12月22日,喜茶与泡泡玛特(POP MART)旗下人气IP星星人的联名活动正式登陆喜茶全球门店,不少喜茶门店开业后就迅速进入制茶繁忙状态
2025-12-22 14:14:00
正雅于法国巴黎迪士尼成功举办早期矫治学术峰会
2025年12月13日,正雅齿科在法国巴黎迪士尼乐园酒店成功举办了"儿童早期矫治学术研讨会"。本次会议吸引了来自法国、瑞士
2025-12-22 14:20:00
2025游戏公益+研究报告在沪发布:公益是游戏体验的“加分项”
有多少游戏企业在游戏产品里做公益?他们做的公益活动被多少玩家接触过?在游戏里做公益是否会影响玩家游戏体验?在12月19日举办的2025中国游戏产业年会游戏公益+论坛上
2025-12-22 14:21:00
青岛城市传媒广场发布2026业态升级战略,携手多元品牌共筑“潮趣换新,自在未来”
12月20日,“潮趣换新,自在未来——青岛城市传媒广场新起点暨2026业态升级发布会”在青岛西海岸隆重举行。活动标志着这座扎根区域八年的文化商业地标正式开启全面焕新阶段
2025-12-22 14:49:00
年底前一项大利好政策来了!刚刚,央行发布《关于实施一次性信用修复政策有关安排的通知》,这意味着个人信用救济的重磅政策落地
2025-12-22 14:57:00
【宅男财经|专家面对面】据看看新闻报道,12月21日,俞敏洪在讲话中谈及董宇辉离职,仍亲切地喊他“孩子”,表示对目前结果感到满意
2025-12-22 15:00:00
安踏儿童携手广州亲子跑,足弓PRO跑鞋「萌芽」配色首发亮相
近日,2025广州亲子跑在广州天河体育中心活力开跑,约600组家庭、近2000名大小跑者携手出发。现场安踏儿童将“足弓成长计划”与广州亲子跑深度融合
2025-12-22 15:21:00
大力神杯“打卡”青岛!海信RGB-Mini LED电视提前解锁2026年世界杯极致观赛
鲁网12月22日讯12月21日,象征足坛最高荣耀的大力神杯“空降”青岛,2026世界杯定制电视海信RGB-Mini LED电视同步亮相
2025-12-22 15:26:00
近日,动力锂电池专列从四川宜宾港鸣笛启程,一路驰骋奔赴上海,这一历史性时刻,如同一束强光,照亮了动力锂电池运输领域全新的发展方向
2025-12-22 15:36:00