• 我的订阅
  • 头条热搜
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
中国石油发布700亿参数昆仑大模型建设成果
...数从330亿升级到700亿,自然语言处理、语音视觉识别、多模态交互、科学计算等专业能力大幅提升;视觉大模型训练数据进一步丰富,新增的岩石识别功能有效提升了地质研究智能化水平;新训练的160亿参数多模态大模型为“人...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
...的前沿技术研究,打造和提升高质量、国际领先水平的多模态交通大模型技术能力,高标准打造人工智能应用场景,全面开展人工智能产品应用创新生态建设,致力于将人工智能前沿技术成果广泛应用于智慧交通、车路协同、自...……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
【2025数博会】“月球科学多模态专业大模型V2.0”正式发布,全面赋能“数字月球云平台”
...行业大模型成果发布暨供需对接活动”上,“月球科学多模态专业大模型V2.0”正式发布,并将全面赋能“数字月球云平台”,加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要,是实现AGI的必经之路。”对大模型的下一步发展,李璟表示,阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习,提高模型...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
出门问问入选「中国AI大模型平台排行榜TOP10」
...技术为核心业务的AI企业,拥有全栈式语音交互能力及多模态大模型自研能力,能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司,出门问问在自研多模态、可...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...训练模型的主要范式是模仿学习,学习的主要目标是各种模态的表征,下一步是培养模型能够解决复杂问题的能力。人脑对复杂问题的解决是启动系统2的模式,通过问题拆解不断探索。“如何让模型也能够学会这种探索的过程...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
大华股份:星汉大模型以视觉为核心支持多模态分析
...里!公司回答表示:公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解,还能根据用户提示完成特定分析功能,同时也支持文本等其它模态数据的理解,支持人机交互等...……更多
...汤科技等新老股东一同跟投。所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用,打造高灵活度、高性能的智算基础设施,构建技术壁垒,进一步在人工智能物联网领域的国际竞争格局...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
更多关于社会的资讯:
国际领先!天瑞重工高效磁悬浮真空系统在氧化铝行业中的应用通过专家鉴定
鲁网12月20日讯2025年12月19日,中国有色金属工业协会在山东潍坊组织召开了“高效磁悬浮真空系统在氧化铝行业中的应用”科技成果评价暨有色金属行业技术交流会
2025-12-20 17:04:00
临沂四中举行“探索民族吹管乐的奇妙世界”家长讲堂活动
鲁网12月19日讯12月15日下午,临沂四中博雅厅内乐声悠扬,一场别开生面的“探索民族吹管乐的奇妙世界”家长讲堂如期开展
2025-12-20 10:59:00
患者被送入手术室门扉后,精密协作的守护机制即刻启动。主刀医师展现娴熟技艺之时,另一群无形守护力量正在同步运作,这是由手术室护理团队构建的防护体系
2025-12-20 05:18:00
近日,北山街道沿山河社区的助老员小韦像往常一样敲响杭大新村27幢1单元高龄空巢老人韩阿姨和黄叔叔的家门,准备为他们订餐
2025-12-20 06:51:00
翻阅社交平台,独居常常与“自由”“精致”等概念系在一起,然而在享受空间自主的同时,独居者也承担着健康与安全的隐性风险,背后隐藏的是孤独与脆弱交织的现实
2025-12-20 06:51:00
新华社北京12月19日电 记者12月19日从财政部了解到,山西省、青海省自2026年1月1日起,按照有关规定实施境外旅客购物离境退税政策
2025-12-20 06:54:00
“点一个‘赞’赚13元,抄一次‘作业’60元,加上刷广告‘增流’,减去要扣的税,一天轻轻松松就能挣158元……”12月18日下午
2025-12-20 07:49:00
19日,总台记者获悉,台北车站和捷运中山站的攻击事件共造成包括行凶者在内的4死5伤。综合台北市消防部门、警察部门消息,27岁的张姓行凶者于19日下午5时30分左右
2025-12-20 07:52:00
感恩奋进 双争有我丨蔚县益海助学中心主任孙秀梅家庭:以爱为家,为困境儿童撑起一片天
蔚县益海助学中心主任孙秀梅家庭以爱为家,为困境儿童撑起一片天“孙妈妈,我们回来啦!”12月15日下午5时,一群孩子蹦蹦跳跳地从学校走到隔壁的蔚县益海助学中心
2025-12-20 07:33:00
海宁皮革城这位店主还有另一个身份!男孩店内晕厥,她抢回一命
“这几天一下子好多人都来问我,搞得我都有点不好意思了。”昨天上午,联系到朱海娟的时候,她一直说,自己就是出于本能做了一件普通的小事
2025-12-20 07:22:00
“南孔圣地赋华章”人大书画展开幕 衢州市人大书画院揭牌成立
12月19日,“南孔圣地赋华章”人大书画作品展在衢州美术馆隆重开幕。衢州市人大常委会党组书记、主任吴国升出席并致辞。市人大常委会原主任黄锡南
2025-12-19 15:51:00
《自贸港十二时辰》
从子到亥,十二时辰轮转;由夜至夜,一片热土不息。这里是海南自贸港,此刻,未来已来。
2025-12-19 16:02:00
教育家精神万里行|张雅茹:律动编织青春梦 改革赋能体育魂
张雅茹,新疆维吾尔自治区乌鲁木齐市体育运动学校教师,2024年全国模范教师。从教二十余载,张雅茹始终坚守在职业教育一线
2025-12-19 16:03:00
文联艺家亲 书画润童心——泰安市文联志愿服务队走进万境水岸小学
鲁网12月19日讯为弘扬中华优秀传统文化,进一步提升师生艺术素养与审美情趣,12月18日,泰安市文联志愿服务队走进泰安市实验学校万境水岸小学开展“文联艺家亲 书画润童心”活动
2025-12-19 16:09:00
河北38岁病危爸爸给孩子剪指甲温柔告别 令人泪目
近日,河北一位病重的爸爸在被下病危通知书后,给孩子最后一次剪指甲的一幕令很多人落泪。妻子宋女士告诉记者,丈夫今年10月份因为肝脓肿去医院检查
2025-12-19 16:18:00