• 我的订阅
  • 头条热搜
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
“人工智能”首次写入政府工作报告,平治信息等公司纷纷加大布局
...工智能时代全球性的紧缺战略资源。从ChatGPT到Sora,从单模态到多模态,从单一智能到通用智能,人工智能大模型技术正在引领新一轮全球人工智能创新热潮,也带来了智能算力需求激增。去年以来,全国多地掀起了智算中心建...……更多
《金融大模型应用评测指南》发布,系全国首个以金融业务能力...
...能,指南定义了包括文本分类、信息抽取等在内的11项单模态、图文检索、视频问答等在内的6项多模态指标要求。金融安全与价值对齐能力方面,围绕模型的可靠性、可解释性以及隐私保护,指南设计了内容合规、文化价值、伦...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...为 Llama 3 开发过程的一部分,Meta 团队还开发了模型的多模态扩展,使其具备图像识别、视频识别和语音理解的能力。这些模型仍在积极开发中,尚未准备好发布,但论文展示了对这些多模态模型进行初步实验的结果。7、Meta 更...……更多
张亚勤:无人驾驶比人类驾驶安全性至少高10倍
...的发展趋势,他认为,大模型发展将有多个方向,包括多模态、自主智能、边缘智能、物理智能、生物智能以及新算法新架构。“现在架构很好,但是效率很低,不管是Transformer还是Diffusion,这些新的算法和框架比起人的大脑,...……更多
赋予人工智能更多温度
...据驱动的服务对象精准认知与最优决策技术,以及基于多模态的机器人主动服务与精准交互技术这三大核心技术,链接了物联网、精准服务分析、深度学习计算三大云端平台,实现了‘云、边、端’技术一体化和行业应用的深度...……更多
阿里加速AI To C赛道布局:世界顶级人工智能科学家加入啦!
...阿里巴巴了,担任阿里集团副总裁,负责 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案。据知情人士透露,许主洪将专注于 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案,提升阿里巴...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...包含复杂跳转逻辑、通过全面测试且没有bug的网页;在多模态方面除了支持长文本文件,也支持视频、音频、图片等理解能力,同时支持生成图文音并茂的作品;还能通过MCP扩展、来完成做动画、广告片、PPT等任务……MiniMax Agen...……更多
...过手机移动端望舌面、问信息,采用人工智能算法进行多模态特征分析,即可出具详细的中医体质辨识报告,还能借助中医体质辨识理论增强大模型,提供健康信息的在线咨询服务,并给出体质与疾病(如肿瘤等)的专业资料参...……更多
亮相2025CES 海信“AI+智慧城市”大步走上世界舞台
...通途”AI大模型在交通管理行业知识问答、智能问数与多模态问题感知等领域均开发了相应产品。其中在交通安全防控场景应用方面,海信打造的道路交通安全防控专家APP,能够针对道路交通隐患排查工作量大的问题,突破多模...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
智谱落地模力社区,助力浦东构建大模型产业生态圈
...执行超过50步智能体任务。AutoGLM背后有GLM大语言模型、多模态理解模型、Agent、语音模型等多个模态的模型。未来,AutoGLM和GLM全系列模型将在“模力社区-智谱大模型MaaS平台”上面向模力社区开放。仪式现场,张江集团党委书记...……更多
北大、快手开源视频生成模型Pyramid Flow,1分钟生成5秒视频
...2M、SA-1B以及WebVid-10M和OpenVid-1M等。1、LAION-5B:一个用于多模态AI研究的大型数据集。2、CC-12M:一个由网络爬虫收集的图像文本对的数据集。3、SA-1B:具有高质量、无模糊图像的数据集。4、WebVid-10M和OpenVid-1M:两个被广泛用于文……更多
展现数字化发展硬实力 济南能源集团亮相2025国际数字能源展
...建“源-网-荷-储”全流程的知识图谱,具备时空预测、多模态推理与自主进化能力,可精准应用于负荷预测、故障诊断、低碳管理等核心场景,推动供热系统向 “数据驱动+智能决策”转型。智慧水务水利平台,响应国家水利战...……更多
...团队采用红外动捕、肌电、惯性传感器、足底压力垫等多模态技术,构建健康步态以及多种异常步态数据集,建立算法模型,实现跨人群、跨模态、跨类型的连续步态轨迹高性能追踪,为脑脊接口技术奠定基础。步态轨迹多模态...……更多
...补充提到,中国科学院香港创新院AI中心今年又研发了多模态手术大模型CARES Copilot,该系统能够与智能医疗设备高度集成,并可快速精确地提取手术教材、专家指南、医学论文等专业文档的信息,并保持高达95%的准确率,就像手...……更多
大湾区AI玩具创新发展论坛举行 全球市场步入千亿赛道
...真化交互体验;杰理科技AIoT总监殷波强调芯片技术对多模态交互的支撑作用,其低功耗芯片已应用于智能教育玩具,成本降低30%。九学王集团董事长刘衍兵透露,生成式AI正推动教育硬件向服务化转型,旗下智能终端2025年预计...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售,库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
...。 但与此同时,Google将发布一个应用程序接口(API)--多模态实时应用程序接口(Multimodal Live API),以帮助开发人员创建具有实时音频和视频流功能的应用程序。Google表示,通过使用多模态实时 API,开发人员可以创建实时、多...……更多
哈工大(深圳)成功举办第八届全国青年人工智能创新创业大会
...域的广泛应用,着重讲解了点云配准的难点和多视角、多模态情景下的处理方法,并提出了将演化计算应用于点云配准的创新性解决方案。武越老师进行报告分享17日下午,本次大会正式进入各团队的汇报与评审环节。大会参赛...……更多
模力通聚焦智能办公“蓄势待发” 蜜度让“大模型赋能”更便捷
...,实现文档核心内容的快速提炼,还支持多语言翻译与多模态文件处理,更在智能写作、审校、公文校对及文本润色方面表现出色。值得一提的是,蜜度为满足不同行业用户的需求,将提供模力通一体机版和SaaS版两种配置。模...……更多
2月十大牛股出炉:克来机电超207%涨幅问鼎榜首
...。维海德在回复深交所关注函中表示,公司自主研发的多模态白平衡算法,并非是当前市场关注的与OpenAI相关的多模态AI大模型,多模态白平衡算法与多模态AI大模型存在本质区别。资料显示,维海德主要从事高清及超高清视频...……更多
...火认知大模型正式发布以来,开放式问答、代码能力、多模态交互能力不断突破,涵盖金融、农业、科技文献等12大行业模型发布。未来,科大讯飞将进一步专注科研和科技成果转化,构建上下游产业生态,打造人工智能产业集...……更多
Sora概念引爆A股!谁在布局AI视频
...技、会畅通讯、博汇科技等个股均涨停收盘。盘面上,多模态AI板块领涨A股,板块涨幅高达11.11%,板块内32只个股全部飘红,其中14只个股涨停;此外AIGC概念、Web3.0等板块同样涨幅居前。消息面上,近日,OpenAI推出了新的文生视...……更多
拓斯达新一代X5机器人控制平台如何突破具身智能的“小脑”瓶颈?
...策,并向控制模块发出指令。该环节以中央计算单元与多模态决策算法为核心。【小脑】负责运动控制、感知外界状态,在大脑的策略下实现机器人动作的执行和反馈。控制:将决策指令转化为实际操作,实现与物理世界的互动...……更多
...研院所及企业等,孵化出许多大模型——全球首个面向跨模态遥感数据的生成式预训练大模型“空天·灵眸”,能让遥感卫星的“千里目”变得更加精准;新一代短时临近气象预报基础模型“蓉城·夔牛”在成都大运会期间亮相...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...文件上传,而此前是只能进行文字输入,也就是新增了多模态理解,不过网页搜索功能仍未上线,这点倒是让人感到遗憾。对于o1满血版的提升,OpenAI的CEO奥特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
谷歌在AI赛道加速
...图像-文本预训练、视觉问答、图像描述、视觉推理、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高...……更多
更多关于科技的资讯:
蚂蚁集团大动作!“阿福”APP来了:新增健康陪伴功能 问答能力升级
12月15日消息,蚂蚁集团宣布旗下AI健康应用AQ品牌升级为“蚂蚁阿福”,并发布APP新版本,升级健康问答、健康陪伴、健康服务三大功能
2025-12-17 10:18:00
项目卡壳90%是资源管理“掉链子” ?易趋教你四步破局
“张总,研发部李工被临时抽去支持紧急项目,咱们的核心模块开发得延期了”,“设备组反馈,原定下周到位的测试服务器,现在还在另一个项目组占用着”
2025-12-17 11:10:00
远见协同:解码米连科技稳健发展的深层动能
在互联网行业潮起潮落、监管环境持续完善的背景下,一家企业如何锚定航向,实现可持续的稳健增长?这不仅考验着创始团队的初心
2025-12-17 11:10:00
赋能印度农业现代化丨潍柴雷沃亮相第33届印度浦那国际农业展
鲁网12月17日讯日前,第33届印度浦那国际农业展KISAN在浦那国际展览中心举办。作为印度西部规模最大、最具影响力的农业展会
2025-12-17 11:18:00
面对“哪些中国企业全球化做的不错?”这一问题,联想集团无疑是具有代表性的答案之一。作为出海时间早、全球化程度深的中国企业
2025-12-17 11:52:00
京东产发与日日顺达成全球战略合作 共建超级供应链新生态
近日,京东产发与日日顺供应链正式达成全球战略合作,建立共创共赢的生态战略合作关系。 双方在物流基础设施、仓配网络、供应链管理等良好的合作基础上
2025-12-17 10:11:00
【宅男财经|专家面对面】当前许多年轻人热衷于“谷子”、棉花娃娃等小众二次元文化产品。针对年轻人为何更偏爱此类小众消费,中国广告协会会长
2025-12-17 10:12:00
“我喜欢我”:vivo S50系列携“告白”美学与长焦Live,开启自我表达新旅程
2025年12月15日,vivo正式发布全新 vivo S50系列,包括 vivo S50 与 vivo S50 Pro mini 两款新品
2025-12-17 10:18:00
聚焦企业福祉与跨境管理 百年人寿协办德国商会专题论坛共话创新解决方案
2025年12月5日,一场聚焦于在华企业福利创新与人力资源挑战的高端论坛于北京成功举行。本次活动由中国德国商会与安顾方胜联合主办
2025-12-17 10:18:00
为积极响应全民消费热潮,充分发挥金融服务实体经济的重要作用,江苏银行围绕 “双十二” 消费节点,精心部署多项线上促消费举措
2025-12-17 10:18:00
王志顺最近,社交平台被一批“装修博主”刷屏了——清一色的夫妻站在新家门口微笑合影,有的怀里还抱着婴儿,配文都是“装修已定”“聊聊感受”
2025-12-17 10:40:00
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00