• 我的订阅
  • 头条热搜
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
【2025数博会】“月球科学多模态专业大模型V2.0”正式发布,全面赋能“数字月球云平台”
...行业大模型成果发布暨供需对接活动”上,“月球科学多模态专业大模型V2.0”正式发布,并将全面赋能“数字月球云平台”,加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要,是实现AGI的必经之路。”对大模型的下一步发展,李璟表示,阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习,提高模型...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
大江东丨走近科学大咖⑤迈克尔·I·乔丹:我一直在追随“下一步是什么”
...AI进化的速度,远远超越了任何其他现存的技术。”这是马斯克在ALL-IN峰会上说的一句话,当我们问及乔丹对这句话的看法,他笑着回应:的确如此。迈克尔·I·乔丹。刘唱摄在乔丹看来,AI领域如今就像一台高速运转的引擎,装...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
大华股份:星汉大模型以视觉为核心支持多模态分析
...里!公司回答表示:公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解,还能根据用户提示完成特定分析功能,同时也支持文本等其它模态数据的理解,支持人机交互等...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
百度发布两款大模型,对标DeepSeek、聚焦多模态
3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...说要做端到端,大家还是以不信为主,说实话我们得谢谢马斯克,特斯拉 FSDv12 给了大家很大的冲击。到了今年年中,端到端就已经「泛滥」了,大家都争相恐后挤到这条赛道上。至于统一模型,端到端的共识形成尚且如此困难...……更多
连发两款模型“补课”,百度AI成色如何?
...箱底的技术实力?按百度说法,文心4.5定位新一代原生多模态基础大模型,在多个基准测试中超过GPT-4o,得分最高的则是DocVQA,该基准主要测试文档图像的问答能力。在文本能力方面,文心4.5则在多个主流基准测试中超过DeepSeek-...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
更多关于科技的资讯:
12月3日上午,一票跨境电商网购保税进口商品经杭州海关所属义乌海关审核验放后,从义乌保税物流中心发往购买的消费者手中。值得注意的是
2025-12-04 09:42:00
腾讯游戏魔方工作室迎来十五周年,《暗区突围》手游爆料地图更新
12月3日,腾讯游戏魔方工作室迎来十五周年庆。魔方多款游戏主创来到直播现场爆料,为玩家带来产品最新进度,备受玩家关注的《洛克王国》IP新作《洛克王国
2025-12-04 14:20:00
从日常随拍到户外探索 年轻人用手持设备定格热爱
脚踩陆冲板的年轻人手持全景相机,以第三人称视角“跟拍”运动瞬间;旅行博主捕捉下360°无死角的风景,剪辑时通过手动调整视角制作出炫酷转场
2025-12-04 14:20:00
在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
中国移动AI听障康复智能体落地 为2780万听障人士架起沟通桥梁
12月3日是国际残疾人日。当日早间,央视财经频道《第一时间》重磅报道了中国移动自主研发的全国首个AI听障康复智能体——“中移无障碍”
2025-12-04 15:22:00
防沉迷+护安全,墨宝·AI学生机成未成年人用机优选
在数字化设备快速发展的当今,未成年教育正面临着网络沉迷、电子产品使用导致近视等前所未有的挑战。那么,究竟有没有科学、有效且合理的解决方案呢
2025-12-04 15:23:00
当地时间12月3日,国际权威财经媒体英国《银行家》(The Banker)杂志在伦敦揭晓年度银行榜单,中信银行荣膺“2025年中国年度银行”(Bank of the Year China 2025)大奖
2025-12-04 15:37:00
重新定义测序技术 “金标准”! Sequel® II CNDx三代测序仪正式上市
近日,贝瑞基因与PacBio在京举行三代Sequel® II CNDx基因测序仪上市发布会,正式宣布这款基于三代测序技术平台的产品获得国家药品监督管理局批准的医疗器械注册证
2025-12-04 16:38:00
165无限满帧体验,一加 Ace 6T首销到手价2399元起
2025 年 12 月 3 日,一加正式发布「性能旗舰新选择」一加 Ace 6T。作为一加Ace系列全新力作,一加 Ace 6T全球首发搭载第五代骁龙8移动平台
2025-12-04 19:41:00
“质造+智创”领航户外照明赛道
当前,国内户外照明市场呈现明显的区域集群效应,长三角(江浙沪)与珠三角(广东)形成双核引领格局。其中,高杆路灯作为重要细分品类
2025-12-04 22:41:00
南京作为我国软件产业发展的先行区和重要聚集地,产业规模居全国前列。在迈向高质量发展的过程中,软件企业普遍出现研发周期长
2025-12-04 20:11:00
国内首个AI钢管智能检测模型在中油宝世顺公司投入运用
河北新闻网讯(张辉、李少波)“焊缝影像在屏幕如放电影一样一帧接一帧闪过,1分钟能完成4米钢管检测,两分钟能审核1000张检测影像并标注疑似缺陷的位置
2025-12-04 17:15:00
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00