• 我的订阅
  • 头条热搜
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
商汤绝影在行业内率先实现了原生多模态大模型的车端部署
...家王晓刚17日宣布,商汤绝影在行业内率先实现了原生多模态大模型的车端部署。车载端侧8B模型首包延迟在300毫秒以内,推理速度40Tokens/秒,覆盖主流算力平台。商汤绝影为多模态大模型打造计算引擎“HyperPPL”,目前扩展并支...……更多
...事业”。报告总结出人工智能产业发展十个趋势,即:多模态预训练大模型是人工智能产业的标配;高质量数据愈发稀缺将倒逼数据智能飞跃;智能算力无处不在的计算新范式加速实现;人工智能生成内容应用向全场景渗透;人...……更多
深圳:“深目”AI模盒发布  “深目2.0”生态联盟成立
...目”AI模盒的大模型能力,来源于云天励飞自主研发的多模态大模型“云天天书”。云天天书大模型包含语言大模型、多模态大模型等不同系列。 ……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
中国石油发布700亿参数昆仑大模型建设成果
...数从330亿升级到700亿,自然语言处理、语音视觉识别、多模态交互、科学计算等专业能力大幅提升;视觉大模型训练数据进一步丰富,新增的岩石识别功能有效提升了地质研究智能化水平;新训练的160亿参数多模态大模型为“人...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
...的前沿技术研究,打造和提升高质量、国际领先水平的多模态交通大模型技术能力,高标准打造人工智能应用场景,全面开展人工智能产品应用创新生态建设,致力于将人工智能前沿技术成果广泛应用于智慧交通、车路协同、自...……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
全面叫板OpenAI!谷歌发布多模态大模型全家桶:从AI助手到文生视频模型
...先一天后,科技巨头谷歌不甘示弱,推出了自己的最新多模态AI(人工智能)产品。当地时间5月14日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
出门问问入选「中国AI大模型平台排行榜TOP10」
...技术为核心业务的AI企业,拥有全栈式语音交互能力及多模态大模型自研能力,能够通过各种软硬件解决方案为全球内容创作者、企业级客户及消费者提供AICoPilot服务。作为业内稀缺的产模结合公司,出门问问在自研多模态、可...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
大华股份:星汉大模型以视觉为核心支持多模态分析
...里!公司回答表示:公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解,还能根据用户提示完成特定分析功能,同时也支持文本等其它模态数据的理解,支持人机交互等...……更多
...汤科技等新老股东一同跟投。所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用,打造高灵活度、高性能的智算基础设施,构建技术壁垒,进一步在人工智能物联网领域的国际竞争格局...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
更多关于科技的资讯:
国家人工智能应用中试基地(医疗)·浙江开放服务12月20日,国家人工智能应用中试基地(医疗)·浙江(以下简称“浙江基地”)多项年度成果发布
2025-12-21 08:22:00
“厦门制造”发力长时储能赛道
海辰储能生产线。(资料图)厦门网讯(厦门日报记者 李晓平)当下,新能源汽车、数据中心等场景电力需求快速增长,全球能源结构正向可变可再生能源加速转型
2025-12-21 09:02:00
2025泉州跨境电商供应链焕新大会在晋江举行,助力泉州优品更好地拓展国际市场链接全产业,打造出海新航道东南网12月21日讯(福建日报记者 肖蔚男)如何让泉州九大千亿产业集群的优品更好地扬帆出海
2025-12-21 12:54:00
在金融服务日益多元化的今天,银行网点如何突破传统业务边界,更好地融入社区居民的日常生活,成为行业探索的重要方向。近日,镇江农商银行润兴路支行创新“社区团购”服务模式
2025-12-21 21:31:00
随着年初杭州deepseek的横空出世,各种好用的AI应用层出不穷,其中AI问答无疑是人们接触最广泛,使用最频繁的功能
2025-12-21 13:27:00
江南时报讯 近日,在金科创新社组织举办的“2025年度农村金融机构科技创新优秀案例评选”中,江苏昆山农商银行凭借在数据中心级流量分析与智能营销模式科技创新方面的卓越实践
2025-12-21 21:23:00
20日,国家人工智能应用中试基地(医疗)·浙江正式开园并发布系列重大成果。其中,浙江省推出的全国首个数实融合的“安诊儿”医疗智能体升级至3
2025-12-21 07:20:00
河北日报讯(见习记者康晓博)12月19日,中国气象局在雄安新区发布气象人工智能科学模型“风源”(以下简称“风源”)。该模型将通过提供开源开放科创平台底座
2025-12-20 08:21:00
2025年,港交所成为中国机器人企业的上市“热土”。据不完全统计,年初至今,超30家机器人相关企业向港交所递交申请表,业务范围覆盖核心零部件
2025-12-20 08:23:00
鲁网12月19日讯为加快数字人民币业务拓展,提升数字钱包渗透率,抢占支付市场与同业市场,工商银行泰安分行精心组织、强力推进数字人民币单位钱包拓展工作
2025-12-20 09:07:00
中国科大提出视觉与波动特征融合的异常检测框架
大皖新闻讯 城市地面下的空洞、裂缝和其他隐蔽灾害如若未被及时发现,会存在一定的安全隐患。12月20日,大皖新闻记者从中国科学技术大学获悉
2025-12-20 11:05:00
12月15日,工信部正式公布我国首批L3级有条件自动驾驶车型准入许可,两款分别面向城市拥堵场景和高速公路场景的车型将在北京
2025-12-20 12:13:00
鲁网12月20日讯为进一步提高服务水平,提升业务竞争力,莱芜农商银行高新区公司业务营销中心优化办贷流程,坚持“我们多跑趟
2025-12-20 15:11:00
这支年轻团队在合肥逐梦星辰 致力打造国内首款电循环液体运载火箭
大皖新闻讯 几天前,关于合肥要造火箭的消息引发外界广泛关注,背后则是合肥星火空间科技有限公司(以下简称星火空间)落户合肥新站高新区
2025-12-20 15:13:00
莱芜农商银行钢城区公司业务营销中心:提升厅堂质效 强化精准赋能
鲁网12月20日讯为进一步深化“以客户为中心”的服务理念,提升金融产品渗透率与客户满意度,近日,莱芜农商银行钢城区公司业务营销中心精心策划并开展了一场主题为“金融惠民进厅堂
2025-12-20 15:13:00