模态,推理,北大,视觉,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

架构优先、先易后难，华为的制造业生成式AI方法论

...模型包括视觉大模型、自然语言大模型、预测大模型、多模态大模型、科学计算大模型等；L1行业大模型是针对汽车、生命医药、电子等行业需求特点而构建的；L2场景模型则面向细分的应用场景，比如传送带异物检测、焊点质...……更多

2024-05-22 15:37:00方法论,华为,架构,制造业,生成,方法

字节发布豆包1.5深度思考模型：“实拍级”图像生成

...型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中，它能够精准高效地处理复杂问题；在创意写作等通用任务方面，同样表现出色。该模型采用MoE架构，总参数为200B，激活参数是20B ，相较于业界同类...……更多

2025-04-17 11:54:00豆包,字节,深度,生成,模型,图像

2025腾讯全球数字生态大会：腾讯云互联网行业“云+AI”全

...智能体开发平台、混元大模型，到图文、语音、视频等多模态处理能力，均已形成标准化能力封装，企业可基于RAG、Workflow与Agent框架快速构建专属智能体，嵌入旅游规划、内容生成、智能客服、用户服务等业务链路，全面提升...……更多

2025-09-17 14:25:00腾讯,行业,落地,生态,大会,互联网

金融大模型LightGPT升级版亮相

...深耕场景。”他说，“能连接各类实时业务数据，融合多模态的内容，生成并打通原有的多媒体交互能力，成为所有流程的第一助手，这是我们对大模型在证券公司未来应用的展望。”“一项新技术是否能实现有效落地，可以从...……更多

2023-11-06 03:06:00模型,恒生,金融,应用,新技,智能

透视2025丨中国AI模型厂商已在特定领域形成一定优势

...统等等。而在AI大模型方面，最主要事件则是OpenAI推出多模态大模型ChatGPT-4o，这一版本具有实时处理和生成文本、音频以及图像等多种模态的能力，被誉为技术上一个巨大突破。事实上，中国在AI大模型方面也已有足够竞争力。...……更多

2024-12-26 21:56:00中国,模型,厂商,优势,领域,模型

大模型降价背后，国产大模型的竞争逻辑变了

...服务完成备案，各类国产大模型，更是超过了200多个，多模态的大模型应用场景正在不断拓展。然而，随着大模型的快速发展，算力成本日益成为影响人工智能推广应用的重要因素，大模型产品的价格居高不下，更是长期制约着...……更多

2024-05-29 09:29:00模型,逻辑,背后,国产,竞争,模型

未来医院变形记：生成式AI将病历书写从8小时缩短至25分钟

...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术，老年患者通过文本或语音与AI陪诊师互动，就能获得清晰的语音版和文本版就医指导，缩短数字鸿沟。第二，服务流程复杂，患者晕头转向。就医过程中，...……更多

2024-07-09 09:30:00变形记,病历,生成,小时,医院,医院

星火大模型v3.5发布，带来七大能力提升

...为教师的“AI助手”。据官方介绍，星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”，教师使用粉笔在智慧黑板旁边的传统黑板上书写时，板书内容可以同步...……更多

2024-01-31 04:11:00星火,七大,模型,能力,星火,黑板

DeepSeek大胆披露：理论利润率高达545%！

...画布功能，然而还不支持语音模式、视频和屏幕共享等多模态功能。而更令人瞠目结舌的是其API价格的飙升，GPT-4.5的API价格为每百万Tokens 75美元，这比其前一代产品GPT-4o的2.5美元上涨了整整30倍。这一价格变动引起了业界的广泛...……更多

2025-03-01 15:08:00利润率,高达,利润,理论,价格,成本

揭示Transformer「周期建模」缺陷！北大提出新型神经

...中的商业周期、物理学中的电磁波，以及数学运算和逻辑推理等。因此，在许多任务和场景中，人们希望对周期进行建模，以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功，但是它...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

智谱发布电脑智能体大模型GLM-PC：回车即用协助完成各类

...新研发的电脑智能体GLM-PC正式开放体验。这款基于智谱多模态大模型CogAgent的智能体，是全球首个面向公众开放的电脑智能体，能够模拟人类的“观察”和“操作”行为，协助用户高效完成各类电脑任务。GLM-PC的“深度思考”模...……更多

2025-01-24 19:34:00电脑,模型,任务,智能,智能,认知

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...性创新的今天，OpenAI公司隆重宣布，其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能，更在实时对话、图文分析等方面实现了质的飞跃，被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...基于预训练GPT-2提出了一种新的注意力机制，来衔接不同模态之间的语义差异，无需大量图像-文本数据训练，就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造，基于新的编解码器架构C-V...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

中国科技创新“乘”数直上

...火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方面的能力均显著提升。同时，讯飞还发布了星火语音大模型和开源大模型。“大模型带来了语音技术发展的全新机会。”刘聪说。让机器具备学习、推理和决策的...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

腾讯大模型战略全景亮相！混元大模型、知识库、智能体开发平台一

...话AI体验。今年以来，混元的迭代速度明显加快。在多模态生成领域，混元图像 2.0 率先实现“毫秒级”生图，混元3D v2.5凭借业界首创的稀疏3D原生架构，实现了可控性与超高清生成能力的代际飞跃。凭借技术的领先性和开放的...……更多

2025-05-26 17:47:00全景,模型,好用,开发平台,腾讯,知识库

“眼里有活”的斯坦福机器人来一个？数十种家务全包成本约3万

...和平台的发展：1、以机械臂作为物理输入/输出设备的多模态大模型：VIMA、PerAct、RvT（英伟达）、RT-1、RT-2、PaLM-E（谷歌）、RoboCat（DeepMind）、Octo（伯克利、斯坦福、CMU）等；2、弥合 System 1（负责低级控制）和 System 2（负责高.……更多

2024-01-07 11:00:00斯坦,斯坦福,机器人,家务,成本,机器

OpenAI发布最强模型o1满血版！史上最贵订阅费1450元

...能和准确性上相较于预览版有了显著提升，同时新增了多模态输入功能，允许用户上传图片以获得更准确的回答。OpenAI表示，满血版o1模型的“思维”速度提高了约50%，在回答困难现实问题时出现重大错误的概率减少了34%。在演...……更多

2024-12-06 12:10:00订阅费,模型,订阅,模型,用户,订阅

价格便宜75%！亚马逊推出全新大模型系列，3纳米自研芯片明年

...容。该系列包括六种型号，从纯文本模型Micro、低成本多模态模型Lite、高性能多模态模型Pro到预计于2025年第一季度推出的Premier，以及两款尚未确定发布时间的更先进模型Canvas和Reel。据介绍，Nova 系列能够支持200种语言，Micro、L...……更多

2024-12-04 22:47:00亚马,亚马逊,价格便宜,纳米,芯片,模型

“杜甫很忙”梗图变视频！智谱AI生成视频模型上线

...过半，经过一轮“价格战”后，各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点，大模型行业本身也正经历从单模态到多模态，再到全模态的演进。就在本月初的世界人工智能大会上，腾讯集团副总裁...……更多

2024-07-27 14:18:00视频,杜甫,生成,模型,模型,模态

在商言商无可非议！亚马逊高管：DeepSeek对客户和我们都

...，我们相信几乎所有大型生成式人工智能应用都将使用多模态技术，而且客户会针对不同类型的工作负载使用不同的人工智能模型。亚马逊需要尽可能提供更多领先的前沿模型供客户选择，这也是亚马逊基岩（Amazon Bedrock）服务...……更多

2025-02-07 11:14:00亚马,亚马逊,非议,有利,客户,亚马

“3D视频版Sora”来了！

...-Diag和FV4D）方面都击败了此前的模型。结语：Stability AI多模态再添新布局Stability AI以文生图开源模型起家，在文本、视频、3D等多个模态上都有所布局。此次开源SV4D，是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多

2024-07-26 09:30:00视频,视频,模型,视图,生成,视角

史上首个实时AI视频生成技术：DiT通用，速度提升10.6倍

...注意力表现出与视频中的运动和动态相关的中频变化；跨模态注意力是最稳定的，将文本与视频内容联系起来，类似于反映文本语义的低频信号。基于此，研究团队提出金字塔式注意力广播来减少不必要的注意力计算。在中间部...……更多

2024-06-28 09:32:00实时,生成,速度,技术,视频,注意力

阳光保险完成DeepSeek-R1模型私有化部署

...、对外经贸大学发起的《面向科技保险的内生统一架构多模态大模型技术研究及应用》课题，入选北京市科学技术委员会2024年度“中央引导地方”专项金融科技方向立项课题。这是较早涉足保险多模态大模型技术研究的课题，...……更多

2025-02-22 20:24:00私有,模型,阳光,阳光,科技,智能

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...行的技术开放日上发布了其最新的“日日新SenseNova”5.0多模态大模型系列。该产品采用了混合专家（MoE）架构，并支持高达10TTokens的中英文训练数据与推理合成数据，数量达到数千亿Tokens。其推理时上下文窗口可有效达到200K左...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

联汇科技发布最新智能体应用——第二代多模态智能体OmAgen

...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品，实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业，打造 MaaS & AaaS产品与服务，为行...……更多

2024-07-18 14:51:00联汇,二代,模态,智能,应用,科技

OpenAI未来猛料全曝光！奥特曼承认自己最大弱点是产品

...品，那么的确可能很难获得投资回报。 OpenAI将对o1进行多模态改进；在o1新范式下，预计基于图像的模型将迅猛发展。对OpenAI最自豪的事情，是反复去做一些新的、完全未经验证的事情。世界上很多有才的人因为他们在糟糕的...……更多

2024-11-06 09:42:00奥特,奥特曼,弱点,产品,模型,事情

对话商汤王晓刚：自动驾驶借助强化学习将超越人类，今年商业化迎

...或算力会上来。“DeepSeek只是语言大模型，接下来就是多模态。我觉得要找到有价值的、高难度的数据，这样才能产生很多有价值的知识出来。”王晓刚说。以下是对话精编：搜狐科技：商汤的世界模型“开悟”，跟杨立昆说的...……更多

2025-02-27 11:36:00商汤,驾驶,对话,人类,商业,学习

国泰君安首席信息官俞枫：AI大模型驱动证券行业步入“智能认知

...模型底座，“1” 是基于通用大模型，国泰君安打造了多模态垂类大模型—— 君弘灵犀大模型，并辅以 N 个场景模型协同，实现开源、闭源融合以及模型组合；二是全栈自主构建自有算力池，开展国产芯片替代，创新算力合作，...……更多

2025-03-11 16:14:00君安,国泰,认知,首席,模型,驱动

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GP

...模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。紧随其后一天，年度Google I/O开发者大会如期而至，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新，...……更多

2024-05-17 14:26:00实测,巅峰,选手,记者,明星,模型

每月141元的ChatGPT Plus订阅重新开放，背后发生

...pMind CEO Demis Hassabis 代表 Gemini 团队正式推出了全新一代多模态大模型 Gemini，拥有「视觉」和「听觉」，还有强大的学习和推理能力。其中，Gemini Ultra 直接对标公认最强大的 GPT-4 模型，行业推测参数超万亿。更耐人寻味的是，在...……更多

2023-12-15 11:26:00订阅,背后,开放,英伟,芯片,模型