• 我的订阅
  • 头条热搜
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
OpenAI推出GPT5模型引爆AI竞赛,微软/谷歌/微美全息加码千亿市场竞逐AGI
...应。目前,GPT-5有四个版本,针对逻辑、多步骤任务和多模态企业应用程序进行了优化。开发人员可以通过AzureAIFoundry利用GPT-5,利用其模型路由器来确保AI驱动的应用程序中特定于任务的精度。另一边,近日,谷歌(GOOG.US)Deepmind...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...混元API服务调用,可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初,腾讯混元就宣布在国内率先采用MoE架构模型,总体性能比上一代密集模型提升50%。此后,腾讯混...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...码开发等领域的丰富工具链,支持文本、图像、视频等多模态输入输出,为企业提供全面智能支持;还通过自研多智能体协同引擎,多个智能体可在对话规划、推理上协同工作,通过自我对话优化策略。 在 GAIA Benchmark 的 Level 1-...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
阿里巴巴CEO吴泳铭:AI或改变物理世界!先进模型投入门槛将提升至上百亿美金
...代码,但今年,大模型已经具备了文本、语音、视觉的多模态能力,能够开始完成复杂指令。早期受到诸多吐槽的“不会解数学题”问题也得到很大改善,“在物理、化学、生物等多方面学科接近博士水平。” 成本方面,模型...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...言,这又是波澜壮阔的一年。Sora掀起视频生成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍在狂飙,但价格战、...……更多
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...精力进行解析,能够识别出其中的文本、图表、图片等多模态内容,同时将这些图表、图片信息做了相应的检索库。此外,天工AI还构建并搭载了分钟级的信源收录系统,能够更快地收集全网高价值信息;构建了自研搜索引擎、...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
科大讯飞股价跌停,市值蒸发120亿元
...升9%,其次是逻辑推理(8%),文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时,七大能力大幅度提升,其中语言理解能力提升78%,文本生成、知识问答、数学能力等提升也超70%,逻辑推理能...……更多
华为AI存储助力中国移动构建超大规模智算集群
...发展进步的重要力量。从计算机视觉到自然语言处理、多模态等基础大模型研究,再到面向自动驾驶、生命科学等重点行业的专用大模型研发,各行各业都展示出对智能算力的巨大需求。中国移动抢抓数字经济发展新机遇,立足...……更多
高德地图全面AI化,因时因地推理最优出行攻略 高德地图2025正式发布:10亿人的AI出行助手
...-行动-反馈”的空间智能架构深度融合,以物理世界的多模态信息为基石素材,以真实时空为核心介质,推理出当下空间内最优且极具个性化的决策服务,从而让传统地图导航APP,也学会了“思考”。这也是全球首个基于地图的1...……更多
苹果展示ferret-uiai系统可理解应用程序
...够让AI模型能够理解图像、视频和音频等非文本内容,多模态大语言模型(MLLMs)因此孕育而生。只是现阶段MLLMs还无法有效理解移动应用程序,这主要有以下几个原因:1.手机屏幕的宽高比,和大多数训练图像使用的屏幕宽高比...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
...源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...索(DeepSeek)又抛出新模型。1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...现扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围等目标,并利用环境反馈推进强化学习以进行长周期推理。实际上,这也是目前国内外大模型正在追求的重点方向,如最近先后更新GPT-4o和o3的OpenAI,在多模态和...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...2023年3月,朱军团队在全球首发并开源基于U-ViT架构的多模态大模型UniDiffuser;5月提出文生3D新算法Prolific Dreamer;今年1月,生数发布4D框架Animatable Dreamer并实现可生成4秒视频的文生视频模型。如今,朱军团队再发布的原创自研U-Vi...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型,在一系列多模态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新闻稿在chatGPT发布一周年之际,谷歌通过 Gemini 赶了个晚集,想要再度...……更多
百度史上最好!文心大模型4.5/X1正式发布:免费用
...模型4.5和文心大模型X1。文心大模型4.5是百度首个原生多模态大模型,多模态理解、文本和逻辑推理能力提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%。百度创始人李彦宏此前表示,文心大模型4.5将是百度有史以...……更多
【2025数博会】阶跃星辰副总裁赵海涛:多模态是通向AGI的必经之路
...动产业跃迁”主题活动上,阶跃星辰副总裁赵海涛以“多模态是通向AGI的必经之路”为主旨,分享了阶跃星辰在多模态大模型方面的前沿探索,展示了未来人机交互与产业智能化的新范式。赵海涛强调,多模态是通往AGI的必经之...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始人Russell D...……更多
更多关于科技的资讯:
一缕发丝织就“头上帝国”丨链接世界的河南力量
编者按:从中原大地到全球市场,一批来自河南的新服务新供给品牌企业正加速“出海”,以优质产品为全球消费者提供更多选择。12月12日起
2025-12-19 14:36:00
在国家持续推进税收现代化、优化营商环境的大背景下,企业合规经营与诚信纳税已成为衡量其可持续发展能力的重要标尺。新疆瑞源乳业有限公司作为巴州地区乳制品行业的领军企业
2025-12-19 14:47:00
浙江新昌:一家县属国企的低空经济腾飞记
在2025年公路交通行业数据要素应用创新大赛中,“基于异构低空飞行器协同的智慧巡检与低空运营解决方案”项目,荣获全国三等奖
2025-12-19 14:47:00
在数字化转型与精益管理深度融合的当下,电子商城作为企业物资采购、资源配置的核心载体,其运营效率与服务质量直接影响企业整体运营成本与发展活力
2025-12-19 14:47:00
浙江飞流科技创新模式成就“飞”速度
12月1日,河南省辉县市,河南共城智通低空经济有限公司正式开业,今年8月,该公司以“品牌加盟”形式获得浙江飞流科技有限公司(以下简称“飞流科技”)在河南省新乡市的品牌授权
2025-12-19 14:47:00
全省唯一入选,就在常州高新区新桥街道!
近日,工信部发布《再制造机电产品典型应用案例》公示名单,常州市新北区新桥街道企业常州越新传动系统有限公司(以下简称“越新传动”)的“再制造风电增速齿轮箱及其应用——以华奥新能源
2025-12-19 14:48:00
常州高新区企业向全球“行业第一”发起冲击!
从打桩到投产仅13个月、20万平方米超级工厂高速运转、首款量产产品订单已排至明年……在常州高新区,江苏睿恩新能源科技有限公司正以惊人速度
2025-12-19 14:48:00
从“流量”到“留量”的深水区航行——对话臣良商贸副总王景涛,解码八年增长三倍的“慢”哲学
鲁网12月19日讯(记者 吴美琳)在德州商贸流通领域,“臣良商贸”是一个颇有分量的名字。这不仅因为它与古贝春携手二十六载的风雨同舟
2025-12-19 15:00:00
拨打运营商热线转接4次才接通人工,电商维权遭遇AI客服循环套话,金融咨询“答非所问”却难寻人工入口……本应是提升服务效率的AI客服
2025-12-19 15:22:00
又是首个出海,海尔三筒洗衣机亮相马来西亚
12月17日,海尔智家第七届全球粉丝节在马来西亚正式启幕,这场连接全球粉丝的品牌盛典,打造了为期五天的沉浸式快闪体验空间
2025-12-19 16:08:00
第十次荣获“五星钻石奖”!青岛银行隐藏着什么获奖秘籍?
12月17日,本年度全球服务领域最高荣誉——2025年(第十九届)“五星钻石奖”(Five Star Diamond Brand)在香港举行的“世界经理人峰会”上隆重揭晓
2025-12-19 16:12:00
青岛球迷狂喜!大力神杯首降,海信冰箱将携锁鲜黑科技赴约
鲁网12月19日讯时隔多年,象征足球最高荣誉的大力神杯将再度造访中国!12月21日,这座全球球迷魂牵梦萦的奖杯将在青岛进行24小时免费公展
2025-12-19 16:13:00
今年以来,魏县联社始终坚守“立足县域、服务三农”的初心使命,锚定县域经济发展需求,聚焦服务提质增效核心目标,通过健全服务体系
2025-12-19 17:02:00
鲁网12月19日讯近年来,中国银行临沂分行紧跟临沂市委市政府战略规划,锚定商贸物流西部新城建设和商城出海战略任务,积极做出支持地方经济社会发展的金融贡献
2025-12-19 17:23:00
罗庄农商银行:科技金融为新质生产力“蓄势赋能”
鲁网12月19日讯新质生产力的培育和发展要立足实体经济根基,罗庄农商银行坚守服务实体经济本职,通过深入开展“千企万户大走访”
2025-12-19 17:23:00