模态,推理,北大,视觉,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...展现每一个动作的流畅过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

商汤科技发布日日新5.0大模型

...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力，与此同时，在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售，库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-

...，无问芯穹今日宣布，开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。官方表示，Megrez-3B-Omni 是一个为端而生的全模态理解模型，同时具备图片、音频、文本三种模态数据的...……更多

2024-12-17 09:24:00模态,模型,全球,模态,模型,精度

“国产大模型第一股”冲刺IPO 杭州资本提前布局

...室的技术成果转化，智谱AI构建了覆盖预训练、推理、多模态及智能体的完整大模型矩阵。2025年4月，智谱AI发布新一代开源模型GLM-4-32B-0414系列，其中推理模型GLM-Z1-Air-0414的推理速度高达200 Tokens/秒（实测），成本仅为同类产品...……更多

2025-04-20 08:29:00杭州,布局,模型,资本,国产,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

...一年，人工智能领域风起云涌，模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方？3月24日，在2024全球开发者先锋大会的大模型前沿论坛上，上海人工智能实验室领军科学家林达华...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

真香！智谱大模型，有了首个免费的API

...，是直面应用的底层逻辑。新一代大语言模型继续保持多模态、长上下文等方面的性能优势，又因为速度和效率的大幅提升获得了更多开发者的青睐。在实际应用场景中，新模型适用于处理高频次、相对简单的任务，禁得起人们...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

华中科技大学白翔教授发布多模态大模型

...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”，对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注：多模态大模型是一类可...……更多

2023-12-15 01:14:00华中科技大学,华中,模态,模型,教授,大学

OpenAI推出GPT5模型引爆AI竞赛,微软/谷歌/微美全

...应。目前，GPT-5有四个版本，针对逻辑、多步骤任务和多模态企业应用程序进行了优化。开发人员可以通过AzureAIFoundry利用GPT-5，利用其模型路由器来确保AI驱动的应用程序中特定于任务的精度。另一边，近日，谷歌(GOOG.US)Deepmind...……更多

2025-08-12 19:07:00全息,微软,竞赛,模型,市场,模型

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...混元API服务调用，可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初，腾讯混元就宣布在国内率先采用MoE架构模型，总体性能比上一代密集模型提升50%。此后，腾讯混...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

推动终端侧AI发展 MWC2024高通带来多项全球首发

...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型（LMM）。多模态指AI模型不仅能够接受文本输入，还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM，其支持文本、语音和...……更多

2024-02-29 10:14:00高通,终端,发展,全球,高通,模型

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...和案例大部分都是基于大语言模型。面向未来，他认为多模态大模型，抑或是文字、图片、语音、视频等多模态的融合，是基础模型非常重要的长期发展方向，是通往AGI（通用人工智能）的必经之路。而百度在这些领域有着长期...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

京东云：智能体大规模“上岗”，企业深度应用正当时

...码开发等领域的丰富工具链，支持文本、图像、视频等多模态输入输出，为企业提供全面智能支持；还通过自研多智能体协同引擎，多个智能体可在对话规划、推理上协同工作，通过自我对话优化策略。在 GAIA Benchmark 的 Level 1-...……更多

2025-05-20 14:47:00京东,大规,大规模,深度,智能,应用

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

阿里巴巴CEO吴泳铭：AI或改变物理世界！先进模型投入门槛将

...代码，但今年，大模型已经具备了文本、语音、视觉的多模态能力，能够开始完成复杂指令。早期受到诸多吐槽的“不会解数学题”问题也得到很大改善，“在物理、化学、生物等多方面学科接近博士水平。” 成本方面，模型...……更多

2024-09-20 18:11:00阿里巴巴,阿里,美金,门槛,模型,投入

智源评测体系发布国内外“百模”评估结果出炉

...系，发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测，分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多

2024-05-17 17:26:00评测,评估,体系,结果,模型,评测

【产业互联网周报】字节回应被曝秘密利用OpenAI；英特尔预

...，但其中未见蔡英华的动向。（36氪）贾佳亚团队推出多模态大模型LLaMA-VID据介绍，该模型可支持单图、短视频，还可以将3个小时的电影或视频精简为数个Token，直接使用大语言模型进行理解和交互。（36氪）蚂蚁集团回应职级...……更多

2023-12-18 22:02:00马斯,英特,英华,马斯克,英特尔,阿里

若愚科技推出九天机器人大脑，大模型总参数规模达130亿｜项

...商合作，提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向：一是负责感知层面的感知模型，二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多

2023-12-26 09:36:00九天,机器人,大脑,模型,机器,参数

年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

...言，这又是波澜壮阔的一年。Sora掀起视频生成热潮，多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世，带来的思维链CoT+强化学习这一新范式，正推动生成式AI迈入新的阶段。大语言模型仍在狂飙，但价格战、...……更多

2024-11-26 09:38:00上海站,上海,嘉宾,生成,阶段,大会

昆仑万维重磅发布天工AI高级搜索功能，做最懂金融投资、科研学

...精力进行解析，能够识别出其中的文本、图表、图片等多模态内容，同时将这些图表、图片信息做了相应的检索库。此外，天工AI还构建并搭载了分钟级的信源收录系统，能够更快地收集全网高价值信息；构建了自研搜索引擎、...……更多

2024-11-05 14:56:00天工,万维,昆仑,科研学术,搜索,重磅

全自动组装家具！斯坦福发布IKEA Video Manua

...主组装IKEA家具，或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令：说明书提供了任务的整体分解和关键步骤；视频展示了详细的组装过程；而3D模型则定义了部件之间的精确空间关系。I...……更多

2024-12-04 09:53:00斯坦,斯坦福,指令,全自动,场景,家具

科大讯飞股价跌停，市值蒸发120亿元

...升9%，其次是逻辑推理（8%），文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时，七大能力大幅度提升，其中语言理解能力提升78%，文本生成、知识问答、数学能力等提升也超70%，逻辑推理能...……更多

2023-10-24 16:15:00跌停,讯飞,市值,股价,蒸发,讯飞

华为AI存储助力中国移动构建超大规模智算集群

...发展进步的重要力量。从计算机视觉到自然语言处理、多模态等基础大模型研究，再到面向自动驾驶、生命科学等重点行业的专用大模型研发，各行各业都展示出对智能算力的巨大需求。中国移动抢抓数字经济发展新机遇，立足...……更多

2024-12-19 18:16:00华为,集群,中国,中国移动,存储,规模

高德地图全面AI化，因时因地推理最优出行攻略高德地图202

...-行动-反馈”的空间智能架构深度融合，以物理世界的多模态信息为基石素材，以真实时空为核心介质，推理出当下空间内最优且极具个性化的决策服务，从而让传统地图导航APP，也学会了“思考”。这也是全球首个基于地图的1...……更多

2025-08-04 17:06:00高德,出行,地图,推理,助手,攻略

苹果展示ferret-uiai系统可理解应用程序

...够让AI模型能够理解图像、视频和音频等非文本内容，多模态大语言模型（MLLMs）因此孕育而生。只是现阶段MLLMs还无法有效理解移动应用程序，这主要有以下几个原因：1.手机屏幕的宽高比，和大多数训练图像使用的屏幕宽高比...……更多

2024-04-11 02:30:00应用程序,苹果,程序,应用,系统,模型

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

文｜武静静编辑｜邓咏仪36氪获悉，多模态大模型公司「若愚科技」完成超5000万天使轮融资，本轮融资由东方精工领投，昆仲跟投，源合资本担任独家融资顾问。公司称，资金将主要用于产品研发，业务拓展以及团队搭建等方...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

北京智源研究院创始人张宏江：大模型背后的核心是一个新的操作系

...源研究院创始人、创始理事长张宏江表示，今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察，可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多

2024-03-25 20:31:00张宏,北京,创始人,研究院,模型,背后

“重创”美科技股后，DeepSeek除夕再发新模型，文生图测

...索（DeepSeek）又抛出新模型。1月28日，DeepSeek发布开源多模态模型Janus-Pro，其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社……更多

2025-01-28 09:10:00文生,科技股,模型,测试,科技,模型