• 我的订阅
  • 头条热搜
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
首个免费多模态大模型API:GLM-4V-Flash上线智谱开放平台
...技术普惠的理念,在今天上线备受期待的第一款免费的多模态模型——GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。这一多模态免费模型将进一步降低开发者在各个领域深入...……更多
多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停 【多模态模型概念股集体高开 苏州科达、网达软件双双竞价涨停】财联社12月8日电,苏州科达、网达软件双双竞价涨停,当虹科技涨超10%,博汇科技、声迅股份涨...……更多
商汤启动智慧医院建设示范样板工程
...第一医院、北京清华长庚医院,在行业内率先启动医疗多模态大模型赋能的智慧医院创新示范共创,打造由大模型“智慧中枢”驱动的智慧医院建设示范样板。2024世界人工智能大会(WAIC)期间,多方正式签约。作为医疗多模态...……更多
把大模型做实 把供应链做透:京东推出言犀大模型
...种参数达到千亿级的新一代模型。京东的大模型将面向多模态应用,并深入应用于零售、物流、工业等产业场景。此外,自2017年,京东云就布局人机交互、多模态智能等AI前瞻技术,在多模态领域的26项国际赛事中夺魁,并在2023...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...,零一万物已经启动100B以上参数规模的模型训练,而多模态大模型团队已经集结了十多个人。“几周之内我们就有新的发布和大家分享。”李开复透露,“Yi”的定位是通用底座,同时,Yi系列量化版本、对话模型、数学模型、...……更多
创新推进算力网络AI注智赋能 宁波移动点亮数字经济新时代
...创新服务,提供包括语言、视觉、语音、结构化数据、多模态等智能分析能力,打造了工业、医疗、教育、反诈等领域的本地行业大模型平台,并通过行业平台能力规模孵化了一系列属地标杆“AI+”创新,取得专利超20项。安全...……更多
DeepSeek+百度千帆“双模”驱动,山东省交通运输厅完成多模态大模型部署
近日,山东省交通运输厅完成基于DeepSeek的多模态混合大模型本地化部署。依托在建的“山东省交通运输智慧大脑”项目,通过百度智能云千帆大模型平台接入DeepSeek大模型,适配山东交通运输实际业务需求,深度融合DeepSeek大...……更多
公路水路交通基础设施数字化转型升级,卓视智通准备好了
...012年成立以来就一直专注于交通视频识别及智能分析、多模态融合感知、多模态大模型等前沿技术的原创研发,并在智慧公路与交通基础设施数字化领域实现了广泛的应用落地,公司连续多年获评“AI+智慧交通”十大优秀企业、...……更多
让现实场景成为大模型最佳“练兵场”
...须在现实的生产生活中打磨,才能成其“大”。“基于多模态的预训练大模型,将成为人工智能基础设施”,这一观点已成为业内共识。建立统一、跨场景、多任务的多模态基础模型正成为人工智能研究的关键课题。据微软研究...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
千行百业加速拥抱大模型(AI前沿观察)
...语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB,包含超5亿个文本、2200万个图文交错文档、1000个影像视频。在11月举行的2023人工智能计算大会上,智源研究院联合阿里云、...……更多
Manus和DeepSeek的差别是什么 谁更厉害:一文秒懂!
...用成本仅为同类产品的1/15,支持企业级规模化应用。多模态兼容:可处理高分辨率图像输入,但视觉模块尚未完善。Manus:执行型“全能打工人”技术架构:采用多智能体协作架构,通过虚拟机运行子Agent,整合工具链(如浏览...……更多
携手全球龙头企业,商汤科技与罗氏诊断达成合作
...决方案——“易问e答”。该系统以商汤自研的日日新多模态大模型为技术底座,融合罗氏诊断数十年积累的专业知识,为体外诊断行业量身打造出一位“真正懂行”的AI助手,全面提升客户服务体验与工作效率。聚焦专业,精准...……更多
多模态模型、短剧游戏盘中逆市走强,文娱传媒ETF涨0.11%
2月20日,三大股指低开,多模态模型、短剧游戏盘中逆市走强,截至10:23,文娱传媒ETF(516190)翻红涨0.11%,持仓股中文在线、国脉文化、新华网纷纷涨停。消息面上,春节假期期间,OpenAI发布首个AI视频模型Sora,可生成长达60...……更多
...谱构建、智能推荐等领域的应用,具备大模型预训练、多模态理解与生成、多任务学习和迁移等能力。 星火一体机基于华为鲲鹏CPU+昇腾GPU,另外联合华为存储和网络提供整机柜方案。图片来源:科大讯飞据悉,星火一体机基于...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
打破视觉壁垒!GPT-4发布,概念股走低,对产业有何影响?企业回应
...低。当地时间3月14日,ChatGPT开发商Open AI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4“给它看张草图,一秒生成网站”的惊人表现被称为“王炸”产品。GPT-4发布后,A股市场的ChatGPT概念股并没有延续数月前的疯...……更多
...单前三!阿里通义千问Qwen2.5-Omni凭“能看能听能说”的全模态能力登顶全球开源模型榜首,深度求索DeepSeek的V3-0324在代码生成上碾压GPT-4.5,群核科技的SpatialLM把三维空间认知玩出了花。如今,杭州已经成了全球范围内少有的,...……更多
生成式AI大爆发后,2024年人工智能行业有哪些新趋势
...(人工智能)发展史的一个转折点,活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实,人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势,行业专家们也给出了一些...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
...语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,为全球游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。大阪世博会中国馆“孙悟空”遇上自主可控AI大模型:让中国文化“活”起来“...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片...……更多
上海:加速实施“模塑申城”
...潮的特点是训练和推理的成本更低、模型能力更强以及多模态融合。其中,随着整体推理成本的降低,我们可以在相同硬件上部署更大、更通用的模型,这也是我们在产业落地上非常重要的关键点。”商汤科技产品总监、小浣熊...……更多
...【汉王科技:正深度分析如何更好的转化“紫东太初”多模态大模型的应用成果】财联社6月27日电,汉王科技在互动平台表示,公司脱胎于中科院自动化所,其为公司持股5%以上的股东,公司与自动化所在前沿技术研发、产业化...……更多
更多关于科技的资讯:
大皖新闻讯 日前,合肥低速无人车生态大会暨场景生态合作伙伴签约仪式在合肥市政务中心举行,全国首个“体验式无人接驳商用项目”签约落地
2025-08-11 19:42:00
首年即盈亏平衡,音频AI芯片出货3000万片,波洛斯获数千万融资|硬氪首发
作者:欧雪硬氪获悉,深圳波洛斯科技有限公司(下称“波洛斯”)近日完成数千万A轮融资,由瀚联半导体产业基金(下称“瀚联基金”)独家战略投资
2025-08-11 09:45:00
德州银行上半年场景化金融交易突破12亿元
支付结算是银行核心基础服务。在数智化浪潮下,德州银行推动支付“动起来”的同时,聚焦与群众生活关系密切的民生服务行业,潜心系统研发与搭建
2025-08-11 19:15:00
周末补贴“战火”平息,行业回归理性竞争角逐“下半场”,即时零售谋“共生共赢”□南京日报/紫金山新闻记者 江芬芬 实习生王子衿8月9日下午
2025-08-11 07:14:00
何以中国·和合共生 天津是一座幸福感充盈的宝藏城市,无论常住还是旅居,浓浓的烟火气、饱满的松弛感常常疗愈凡人心。乐观豁达的态度、追求幸福的生活是天津休闲文化的本质。
2025-08-11 07:52:00
“你看,一点这些店铺招牌,实时路径就出现了。”9日,站在杭州湖滨步行街的繁华路口,江苏游客唐薇打开手机应用,千余米的东坡路瞬间化作虚实共生的数字孪生空间——实时街景“跃”出屏幕
2025-08-10 09:11:00
□南京日报/紫金山新闻记者 张安琪 实习生饶嘉萱7月18日,宝马集团国内唯一、全球六大信息技术研发中心之一——宝马信息技术全球研发中心项目落地南京
2025-08-10 09:54:00
□南京日报/紫金山新闻特派记者徐宁在世界级“舞台”上,来自南京的十多家机器人企业充分展示最新成果,与全球200余家企业同场“竞技”
2025-08-10 09:55:00
宠物食品迈入“云监工”时代 金故透明工厂重塑行业安全标准
2025年8月9日,山东省沂南县铜井镇宠物食品工业园内礼炮鸣响,高端宠物品牌金故斥巨资打造的“猪根真美透明工厂”正式投产运营
2025-08-10 17:26:00
?揭秘2025纳豆激酶十大品牌王者!十大品牌综合实力排行,效果、安全、性价比全解析!
在当代健康管理领域,纳豆激酶凭借其独特的心血管保护机制,已成为科学界和消费者共同关注的焦点成分。面对市场上良莠不齐的产品
2025-08-10 17:52:00
WRC 2025 | 破局机器人规模化落地难题,睿尔曼打造具身智能坚实基座
8月8日,全球顶级机器人盛会——2025世界机器人大会(WRC)在北京经济技术开发区北人亦创国际会展中心正式启幕。WRC世界机器人大会作为全球机器人领域的顶级盛会
2025-08-10 17:52:00
老国营押注“质价比”,贵州藏酒三大新品中酒展首发,获刘员、甘权点赞!
摘要:老国营酱酒的势与谋。文| 顿河从酒都仁怀到泉城济南,一场跨越1600多公里的酱香共鸣正上演。8月8日,“共生共赢2025贵州藏酒新品上市发布会”在济南润华皇冠假日酒店盛大举行
2025-08-10 17:52:00
2025版郎牌郎升级开启订购,看郎酒的国民酱香进化论
八月的酒业市场,即将被一抹熟悉又新颖的“郎酒红”点燃。7月31日,郎酒官微发布消息称:2025版郎牌郎8月11日起接受销售订单
2025-08-10 17:52:00
中新经纬8月10日电 (林琬斯)10日,话题#百果园称不会迎合消费者#登上微博热搜。8日,有媒体截取来源为“百果余惠勇”的一段视频发布
2025-08-10 16:06:00
产学研齐聚杭州 共话AI赋能香氛行业发展新未来
为深入探讨人工智能技术在香氛产业中的应用前景与创新路径,推动香氛行业与前沿科技的深度融合,促进产业升级与高质量发展,8月7日至8日
2025-08-10 10:44:00