• 我的订阅
  • 头条热搜
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals,已入选NeurIPS。数据集涵盖了6大类IKEA家具,每种家具都包含完整的3D模型、组装说明书和实际组装视频。而且划分精细,拆解出的安装子步骤多...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
生成式AI收入增超2.5倍!商汤上半年减亏两成,总算力突破两万P
...来,商汤先后发布了日日新大模型的5.0及5.5两大版本,多模态能力全面加强,实时交互体验对标GPT-4o,同时还推出了云、端、边全栈大模型产品矩阵。商汤董事会执行主席兼CEO徐立27日在业绩会上再次强调了聚焦端侧,他表示该...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
人形机器人进厂“实习”,汽车制造还需要工人吗?
...的执行成功率,需要机器人拥有自主可靠的决策能力、多模态感知能力以及实时精准的运控能力,这些能力离不开大量的数据采集、模型训练、仿真测试。只有这样,才能真正将大模型适配到人形机器人的“大脑”。此前,人形...……更多
AI大模型应用商机:“AI+”还是“+AI”
...nAI公司最新发布的GPT-4o,就通过对文本、音频和视觉三种模态统一进行混合训练,带来了更大的泛化能力,可实时对音频、视觉和文本进行推理,标志着AI大模型应用向更自然的人机交互持续迈进。GPT-4o的推出进一步推动了AI应...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...AI搜索,相比New Bing搜索和谷歌AI搜索,它的最大特色是多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
AI PC是噱头还是更快的马车?
...有了AI助手,这就是一句话的事。理解较长的上下文、多模态输入等等,这些都必须依赖大语言模型的能力,但其实是在本地运行的,而非借助云端的推理能力。讲真,应该没有人会认为整理文件名这种本地文件系统的操作还需...……更多
PC产业驶入创新超车道,英特尔蓉城撬动AI新引擎
...了最新的 GLM-Edge 系列端侧大模型,涵盖语言大模型、多模态大模型,并包含不同参数规模,支持意图理解、智能对话、文本创作与视觉理解等多场景。英特尔为GLM-Edge端侧大模型提供推理加速,实测推理速度超过70 tokens/s。双方...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大...……更多
Hugging Face发布SmolVLM开源 AI 模型:20 亿参数,用于端侧推理
...lVLM AI 视觉语言模型(VLM),仅有 20 亿参数,用于设备端推理,凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效,并且完全开源,所有模型检查点、VLM 数据集、训练...……更多
高通aihub正式发布:支持75个ai模型
...示了全球首个在搭载第三代骁龙8的安卓手机上运行的多模态大模型(LMM)。在这一演示中,高通展示了一个超过70亿参数的LMM,其支持文本、语音和图像输入,并能够基于输入的内容进行多轮对话。同时高通还在搭载全新骁龙XEl...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
大厂又盯上这块肥肉了
...产品“纳米搜索” App,支持文字、语音、拍照、视频等模态搜索方式。11月15日,腾讯推出AI搜索ima,除综合检索全网信源外,还整合了微信公众号文章的生态资源。11月5日,昆仑万维旗下“天工”APP发布了天工AI高级搜索功能。...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...车型形成竞争关系。近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,...……更多
深圳:“深目”AI模盒发布  “深目2.0”生态联盟成立
...目”AI模盒的大模型能力,来源于云天励飞自主研发的多模态大模型“云天天书”。云天天书大模型包含语言大模型、多模态大模型等不同系列。 ……更多
加速落地 京东云大模型已支持数百个场景
...态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生图、语音识别等多模态组件,以及检索增强生成、智能体等AI应用框架,分钟级即可启动AI Agent构建,帮助企业高敏、高效地进行AI应用的开发...……更多
联想王传东:2027年AI PC将成为市场主流
...IPC产品,应具备五大特征:首先是内嵌个人智能体实现多模态自然语言交互;其次是内嵌由本地大模型和个性化本地知识库构成的个人大模型;第三是全面标配CPU+GPU+NPU的本地混合AI算力;第四是连接开放的AI应用生态;第五是供...……更多
不到半年,Figure AI发布第二代人形机器人,称为“地表最先进AI硬件”
...“行走的ChatGPT”,预计将会把OpenAI最新发布的GPT-4o等多模态大模型继续集成在其中,打造能推理、看、听、说的人形实体ChatGPT机器人。目前,其竞争对手Agility Robotics的人形机器人Digit,以及Apptronik公司的机器人Apollo都已部署到...……更多
AI如何落地智慧交通?网新IN-TRANS产品给你答案
...十倍级效率提升的核心优势。 网新系统研发总监沈巍多模态交通算法引擎In-TransAI,通过图像识别和语义理解算法,将基石化为沃土,赋予数据意义。能对海量异构数据进行高效、智能地识别分析,将静态数字转变为动态知识...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,检测是否发生危害。 研究过程Anthropic在工具使用和多模态的工作,为AI识别和解释图像奠定了基础。在此基础上,Claude还需要推理如何以及何时根据屏幕内容执行操作。为此,研究者训练Claude准确计算像素,从而完成命令,...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的...……更多
大的要来了:谷歌Bard被曝将更名为Gemini,Ultra 1.0更强但收费、安卓App也会来
...ini Ultra 1.0 终于要来了去年 12 月,谷歌正式推出了原生多模态大模型 Gemini 系列,标志着谷歌 Bard 问世以来的最大更新。Gemini 有三个版本,分别是适用于端侧的 Gemini Nano,适用于多任务的 Gemini Pro,以及能力最强的 Gemini Ultr……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...一难题,“空天·灵犀” 遥感智能训推一体机集成遥感多模态数据、轻量化基础模型、智能解译软件系统,具有多任务高精度、模型高效训练推理、低成本灵活部署及自主创新四大核心特色。其中,在多任务高精度方面,模型支...……更多
...代面向智慧园区场景的智能服务器AIS 4.0。集成领先的多模态大模型能力,实现软硬件全面国产化,为各类园区综合管理效能提升提供更安全、更智能、更易用的AI新智引擎。自2019年首版推出以来,商汤星云AIS智能服务器以算法...……更多
突破遥感基础模型关键技术!我国科研人员研发出遥感智能训推一体机
...需求。“空天·灵犀”遥感智能训推一体机集成了遥感多模态数据、轻量化基础模型、智能解译软件系统,具有多任务高精度、模型高效训练推理、低成本灵活部署及自主创新四大核心特色。其中,在多任务高精度方面,模型支...……更多
骁龙 8 至尊版到底有多强?我们总结了三大关键问题
...程,减少游戏中1%fps卡村,同时改善手机发热的状况。多模态AI支持有什么意义? 简单来说,指令无需预处理,响应更快速。在骁龙8至尊版中,高通通过升级的HexagonNPU和AI引擎,进一步增强了设备端AI的多模态处理能力。这意味...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...s 软件框架可以为PyTorch 2.0 和最新的 AI 模型和技术(如多模态模型、视觉转换器、专家混合和扩散)提供原生支持。Cerebras 仍然是唯一为动态和非结构化稀疏性提供本机硬件加速的平台,相比英伟达的DGX-100计算机系统,将训练...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00