• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
2024国际汽车智能座舱大会在苏州市相城区隆重召开!
...和交互体验需求。智能座舱未来将向全场景智慧交互、多模态感知融合、智慧互联及高精度传感方向发展,实现千人千面和千车千面高品质座舱体验,他希望通过行业共创共享,构建万物互联汽车生态体系,共同推动智能座舱技...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。Sora 终于来了!只要是 ChatGPT Plus/Pro 用户,直接就能用上。至于效果 ......看完官方放出的 demo,网友大呼:不太行 !当人们对「超级应用」的热情被 Sora 浇上一盆凉水时,多模态应用已经悄咪...……更多
消博放大镜 | “新”风扑面 “质”感满满 从消博会看“新质生产力”
...学能力、语音交互能力上有出色的表现,在代码能力、多模态理解方面也不甘示弱。相关测评结果显示,讯飞星火V3.5代码能力达到了GPT-4 Turbo的96%,多模态理解也达到了GPT-4V的91%。可在恶劣环境下工作的小型机器人。记者 汪承...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni
...,无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示,Megrez-3B-Omni 是一个为端而生的全模态理解模型,同时具备图片、音频、文本三种模态数据的...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
...生成式人工智能产品回答问题的比例最高达80.9%,AIGC的多模态能力与内容创作等场景深度融合,全民智媒时代的到来将极大的丰富互联网内容生产各类主体的生成工具与手段。网络舆情知识生产与AIGC多模态内容创作场景深度重...……更多
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
大模型重塑智能硬件!人手一个智能助手的时代来了?
...一起聊聊烦恼、疑惑和心事……可以预见,更智能化的多模态大模型赋予了智能硬件新的生命。就在上周六,RTE 2024第十届实时互联网大会IoT分论坛圆满结束。多位AI智能硬件赛道的资深人士齐聚一堂,共同探讨如何让“智能硬...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
全球几十种大模型评测,如何甄别可信度?
...秤)大语言模型评测体系,该评测体系覆盖语言模型、多模态模型、语音语言模型等多种模态,并针对不同模态设计相应的评测指标和方法。12月19日,智源再次发布了迭代后新版本的FlagEval,目前FlagEval已覆盖全球800多个开闭源...……更多
【2025数博会】“月球科学多模态专业大模型V2.0”正式发布,全面赋能“数字月球云平台”
...行业大模型成果发布暨供需对接活动”上,“月球科学多模态专业大模型V2.0”正式发布,并将全面赋能“数字月球云平台”,加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
小米SU7前车识别功能除了识别车辆 还可以干啥
...别更加精准、功能更加丰富。同时,小米也会持续探索多模态大模型在各类产品上的应用落地,挖掘更多有趣的、好玩的功能,给用车生活带来更多惊喜互动,敬请期待。据了解,小米汽车的“前车识别”功能主要基于小米自研...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...,来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多
荣耀MagicOS 8.0发布,定义新一代人机交互
...法OS8.0的IUI支持自然语言、语音、图片、手势、眼动等多模态的交互方式,可智能识别用户意图,进行快速推理决策,主动提供个人化服务,高效完成复杂场景任务闭环,大大降低OS的使用门槛,带来了交互效率的提升。IUI这一...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
更多关于科技的资讯:
炎黄盈动重磅发布企业级AI平台,全面加速企业AI价值落地
随着AI技术的飞速发展,企业正面临从技术试点到全面应用的关键转折点。技术加速:Gartner报告显示,当前AI智能体和AI就绪型数据发展最快
2025-12-08 11:12:00
路边放一台南迪售货机,打造全时段消费新主张
还在为寻找稳定、低风险的增收渠道而烦恼吗?将一台南迪自动售货机放置在路边,它不仅是24小时不休的“金牌销售”,更是能创造被动收入的坚实资产
2025-12-08 13:35:00
人人租亮相2025中国企业家博鳌论坛平行论坛-创新探索、生态共筑
十年博鳌潮海阔,百舸争流共进发。12月2日至5日,2025企业家博鳌论坛系列活动在海南博鳌举办。围绕“链接全球,引领未来
2025-12-08 13:39:00
鲁网12月8日讯在制造业转型升级与企业全球化布局的双重浪潮中,科技型小微企业正成为激活新质生产力的重要引擎。近日,兴业银行济南分行精准对接企业需求
2025-12-08 14:14:00
布鲁可携丰富产品矩阵首次亮相巴西圣保罗动漫展览会,圣斗士星矢系列新品全球首发
12 月 4 日至 7 日,巴西圣保罗动漫展览会(Comic Con Experience)正式举行,作为世界领先的以漫画
2025-12-08 14:56:00
廊坊开发区新增一家省级工业设计中心
河北新闻网讯(杨自立)近日,河北省工业和信息化厅公示2026年河北省工业设计拟支持项目名单,廊坊华安汽车装备有限公司工业设计中心成功入选省级工业设计中心
2025-12-08 15:00:00
TDK持续赋能第十九届iCAN大赛,助力青年创新创业梦
11月30日,第十九届iCAN大学生创新创业大赛全国总决赛在杭州圆满落幕。作为大赛战略合作伙伴,TDK连续第五年深度参与赛事
2025-12-08 15:26:00
编者按:继国家发改委发展战略和规划司与云河都市研究院共同编制的《中国城市综合发展指标2016》发布之后,云河都市研究院持续每年对全国297个地级及以上城市进行经济
2025-12-08 15:51:00
以革新破局数智未来,思特奇携手运营商开拓AI赋能新范式
2025年作为“十四五”规划收官之年,人工智能发展已迈入全域赋能新阶段。为积极落实国务院“人工智能+”行动的重大战略部署
2025-12-08 16:01:00
中国电信柯瑞文:智能领航 智惠共生
12月4日至7日,2025数智科技生态大会在广州举办。12月5日上午,在大会主论坛上,中国电信董事长柯瑞文作题为《智能领航 智惠共生》的主旨演讲
2025-12-08 16:02:00
国锐生活收购春雨医生 约78%股权,实现向医疗科技转型
为把握“健康中国2030”战略机遇,国锐生活有限公司宣布以2.69亿元对价收购春雨医生天下软件有限公司78.2898%股权
2025-12-08 16:03:00
思必驰首席科学家俞凯教授当选2026年度IEEE Fellow
日前,全球最大的专业技术组织国际电气电子工程师协会(The Institute of Electrical and Electronics Engineers
2025-12-08 16:04:00
山东移动打造AI智慧体育体系,助力山东构建青少年体质健康提升新路径
随着国家“体育强国”和“健康中国2030”战略深入推进,青少年体质健康日益受到重视。山东移动积极响应我省相关部署,结合自身信息技术能力
2025-12-08 16:04:00
这个电影季,探索人工智能如何重塑影像美学与创作生态
中国青年报客户端讯(中青报·中青网记者 沈杰群)12月7日,第七届海南岛国际电影节·联想AI电影季在海南三亚开幕。本届AI电影季以“AI技术为刃
2025-12-08 16:05:00
以AI为钥,以生态为桥:思特奇赋能运营商数智化跃迁
当前,人工智能已迈入与产业深度融合的关键阶段,正从单点技术突破转向系统性生态赋能。在数据、算法、算力等核心要素持续迭代的驱动下
2025-12-08 16:05:00