• 我的订阅
  • 头条热搜
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别 【五连板苏州科达:公司的KD-GPT大模型相对于谷歌Gemini的通用多模态大模型在服务对象上存在明显区别】财联社12月13日电,苏州科...……更多
【2025数博会】“月球科学多模态专业大模型V2.0”正式发布,全面赋能“数字月球云平台”
...行业大模型成果发布暨供需对接活动”上,“月球科学多模态专业大模型V2.0”正式发布,并将全面赋能“数字月球云平台”,加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要,是实现AGI的必经之路。”对大模型的下一步发展,李璟表示,阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习,提高模型...……更多
猎豹CEO傅盛2024年预言:千亿大模型过半凋零,人形机器人必定不能量产【附AIGC市场现状分析】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
百灵大模型多模态能力全面提升
...IT之家从蚂蚁集团获悉,蚂蚁集团自研的百灵大模型的多模态能力全面提升。多模态能力让大模型能“看”会“听”,能“说”会“画”,可支持音、视、图、文等多模态理解与生成,可以让大模型更像人一样感知和互动,未来...……更多
理想汽车多模态认知大模型Mind GPT正式上线 【理想汽车多模态认知大模型Mind GPT正式上线】财联社3月28日电,理想汽车今日宣布,全自研多模态认知大模型Mind GPT已正式上线,成为首个通过备案的汽车厂商自研大模型。(财联社...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
多模态检索增强生成(mRAG)也有o1思考推理那味儿了!阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch,它能模拟人类解决问题的思维方式,将复杂问题逐步拆解进行智能检索规划。随便上传一张图,...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...qizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-NeXT、MiniCPM、InternVL 等开源领域模型也展现...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段 【云鼎科技:公司盘古矿山大模型自然语言处理和多模态能力方面应用场景处于研发阶段】财联社12月12日电,云鼎科技发布股价异动公告,...……更多
深化战略合作 三星携手百度共同打造Galaxy S24 系列生成式AI体验
...的场景会更加丰富多样,凭借对文字、图像、音视频等多模态数据的深刻理解,以及挖掘用户个性化需求的精准能力,文心大模型将打造出更多贴近用户个性化需求的AI产品。三星Galaxy S24系列大模型能力被看好,百度智能云成智...……更多
跨模态大模型“白泽”学会藏语
...新藏语内容理解与应用技术,人民网人民中科“白泽”跨模态大模型与青海师范大学的“班智达”藏语识别与翻译引擎深度融合后,显著提升了“白泽”对藏语内容的理解和处理能力,为网络空间藏语内容处理提供了全新的技术...……更多
大华股份:星汉大模型以视觉为核心支持多模态分析
...里!公司回答表示:公司星汉大模型是以视觉为核心的多模态大模型。不仅能对视频图片中的目标、场景和事件等进分析分析理解,还能根据用户提示完成特定分析功能,同时也支持文本等其它模态数据的理解,支持人机交互等...……更多
百度世界2023剧透丨百度将发布国内首个生成式商业智能产品
...现了从图形界面交互到自然语言交互的转变,还增强了多模态信息理解。用户只需要一句话,就能对网盘内的文件、图片、视频等进行操作,方便用户在网盘里、视频里“找东西”。值得一提的是,百度网盘“云一朵”还可以帮...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
网达软件:公司“视联网数字化智能平台”不涉及多模态模型 【网达软件:公司“视联网数字化智能平台”不涉及多模态模型】财联社12月8日电,网达软件发布异动公告,近日市场对于AI视频生成、多模态模型等相关概念较为...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
苹果公司公布“mm1”多模态大模型
...omMultimodalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各...……更多
...“证明了R1方法的通用性,不止文本领域玩得转”“为多模态AI带来全新思路”“或许能够引领一种全新的视觉语言模型训练潮流”……业内人士纷纷对 VLM-R1表示高度认可。“视觉版DeepSeek”为什么是VLM-R1?VLM-R1爆火,看似意料...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
...据交易所(以下简称“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高...……更多
更多关于科技的资讯:
一句话、一张图,共绘古祠新名片!陈家祠商圈标识及宣传语邀您来设计
为提升陈家祠商圈品牌形象与文化内涵,扩大商圈影响力,进一步彰显岭南文化商圈特色,打造文化消费新地标,现面向全社会公开征集陈家祠商圈标识(LOGO)及宣传语
2025-12-12 09:23:00
晚上6点半,杭州遥望科技大楼的直播间里,灯光亮如白昼。小五对着镜子最后检查了一下妆容,深吸一口气,走向镜头。五年前,她站在黑龙江齐齐哈尔的寒风中
2025-12-12 08:08:00
如果未来的高速公路能像人一样“思考”,预判几公里外的风险;如果跨海大桥有“专属医生”,能飞檐走壁进行体检;如果服务区不再只是简简单单的驿站
2025-12-12 08:09:00
河北新闻网讯(杨春辉)如何深化信贷业务专业化能力,推动一线员工全面掌握产品体系与营销策略,从而为“一池两新万企”行动提供坚实支撑
2025-12-12 06:53:00
12月10日-12日,由浙江传媒学院主办、浙江传媒学院实践教学与艺术创作中心协办的 “剧想天开”——《儿童剧人物造型设计创新人才培训》成果展在杭州时尚中心正式展出
2025-12-12 07:07:00
站在4K摄像机前,主播“俍一”落落大方,此刻她站在演播室里,但直播间的观众们看到的却是由AI实时生成的背景。这样的场景在以前是不可想象的
2025-12-12 07:08:00
家电业创新驱动拓蓝海
家电业正朝着绿色、智能化方向升级,既精准匹配消费者需求,也开拓了市场新空间从电视、冰箱、洗衣机的传统“三大件”到智慧互联
2025-12-12 07:14:00
今年“双12”,南京企业捧出主题多元、内容丰富的促消费活动,推动消费市场提质扩容据悉,今年南京将“双12”作为南京市“四季有约·暖冬跨年庆”促消费活动的重要节点
2025-12-12 07:14:00
在直播间买了商品退货难、赔付慢等情况一直是困扰消费者的难题,临近“双12”,由杭州高新区(滨江)市场监管局联合辖区内头部直播电商企业共同起草的团体标准《放心消费直播间管理与运营规范》(以下简称《规范》)正式发布
2025-12-12 07:38:00
鲁网12月11日讯近日,建设银行泰安分行高效推进网点服务数字化转型,顺利完成泰安花园支行、新泰向阳支行、新汶翟镇支行、东平白佛山支行等4家网点的排队机轻量化叫号模式试点改造
2025-12-11 14:40:00
意大利ICA意卡亮相大湾区设计论坛:以色彩、技术与资源,赋能设计师
2025年广州设计周于12月5日至8日盛大开幕,在广州保利世贸博览馆、广州国际采购中心及海珠国际会展中心三馆共18个展厅同时举行
2025-12-11 14:53:00
苏大课堂来了位虚拟数字人老师
近日,在苏州大学传媒学院副教授程曦的《新媒体运营》课堂上,迎来了一位与她外型一模一样的虚拟数字人老师,只要是关于课程中的问题
2025-12-11 14:57:00
中新经纬12月11日电 11日,“网信中国”微信号发布汽车行业网络乱象专项整治行动公开曝光第二批典型案例。近期,国家网信办会同工业和信息化部等部门持续开展汽车行业网络乱象专项整治行动
2025-12-11 15:10:00
鲁网12月11日讯走进建行青岛市分行瞿塘峡路支行,大堂经理正俯身协助客户核对账单、同步讲解线上查询技巧;城阳支行营业部里
2025-12-11 15:17:00
【儒商风采】德州市恩锋企业管理咨询有限公司董事长李媛媛:先做朋友,再做生意
鲁网12月11日讯(记者 赵洪斌 通讯员 赵慧)“让一个企业家在半小时内,向陌生人交底,说出自己公司的核心难题——这事儿
2025-12-11 15:17:00