推理,模型,直播,推理,模型,时间头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升 100%，推理成本降低 50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多

2024-09-14 14:04:00金鼎,腾讯,模型,腾讯,模型,推理

从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新M

...模型的精度，同时保持了线性注意力优越的并行计算与高推理速度。论文链接：https://arxiv.org/abs/2405.16605 代码链接：https://github.com/LeapLabTHU/MLLA 视频讲解：https://www.bilibili……更多

2024-12-11 09:53:00阿里,清华,线性,视角,注意力,模型

腾讯版Sora发布即开源！130亿参数，模型权重、推理代码全

...，成为目前参数量最大的开源视频生成模型。模型权重、推理代码、模型算法等全部上传GitHub与Hugging Face，一点没藏着。实际效果如何呢？目前该模型已上线腾讯元宝APP，用户可在AI应用中的“AI视频”板块申请试用。API同步开...……更多

2024-12-04 09:50:00腾讯,权重,推理,模型,参数,代码

杨元庆谈AI PC：支持运行个人大模型

...能设备或家庭服务器上，使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容，而且更精准、贴切，甚至根据用户的思维模式预测任务，并自主寻找解决方...……更多

2023-11-22 19:04:00杨元庆,模型,运行,支持,个人,模型

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

OpenAI o1强推理能提升安全性？长对话诱导干翻o1

最近，以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升，在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称，推理可以让模型更好的遵守安全政策，是提升模型安全的新路径。然而，推理能力的提升真的能解决...……更多

2024-11-08 09:46:00诱导,推理,安全性,对话,安全,攻击

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

小模型越级挑战14倍参数大模型，谷歌Test-Time端新的

...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法，根据给定的prompt难度，动态地分配测试时（Test-Time）的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多

2024-09-12 09:58:00模型,参数,模型,训练,测试,时计

国内首个！百度文心大模型X1 Turbo斩获信通院最高评级证

...息，在5月20日的百度AI Day 上，中国信通院公布了大模型推理能力评估结果。百度文心大模型X1 Turbo在24项能力评估中，16项达5分，综合评级获当前最高级“4+级”，成为国内首款通过该测评的大模型。其中，文心X1 Turbo在逻辑推理...……更多

2025-05-21 07:20:00信通,文心,模型,证书,文心,模型

李开复：现在卖AI大模型的方式行不通，需考虑技术和业务成本、

...标化、定制重、交付重的商业模式；另一方面则是要考虑推理成本，能够帮助企业客户核算 ROI，在不赔钱的前提下做规模增长，是模型能力在 ToB 方向落地的基础。当前，中国大模型初创公司的应用生态和融资环境与美国有着一...……更多

2024-11-09 09:50:00李开复,模型,成本,客户,方式,业务

NVIDIA RTX显卡AI推理提速5倍！

...得更好的加速和应用。其中，TensorRT-LLM是一款用于加速LLM推理的库，可大大提升AI推理性能，还在不断更以支持越来越多的语言模型，而且它还是开源的。就在10月份，NVIDIA也发布了面向Windows平台的TensorRT-LLM，在配备RTX30/40系列GP...……更多

2023-11-16 20:13:00提速,推理,显卡,微软,模型,性能

阿里发布全球最强开源模型千问3 通义App第一时间已上线

...布的千问3开源模型包含8款不同尺寸，均为全新的“混合推理模型”，智能水平大幅提升的同时也更省算力。其中，千问3旗舰模型Qwen3-235B-A22B是一款混合专家（MoE）模型，该模型创下所有国产模型及全球开源模型的性能新高；而...……更多

2025-04-29 11:35:00通义,阿里,模型,全球,通义,模型

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...模型，一举创造了很多历史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法看」直接上升到优秀水平，不专门训练直接数学奥赛金牌，甚至...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

字节猛踩油门

...型3.0、视觉理解模型，并推出OS Agent解决方案及AI云原生推理套件，用于企业客户构建与部署Agent应用。其中，豆包1.5深度思考模型作为字节首款推理模型，具备“边想边搜”能力，同时借助视觉推理能力，可以综合理解图片中的...……更多

2025-04-18 22:26:00油门,字节,模型,火山,引擎,豆包

Anthropic再反击！发布Claude 3.5吊打GPT

...本Claude 3.5 Sonnet。从官方披露的测试数据来看，其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言，“太卷了，现在AI竞争是要以周为单位了吗？” 从官方介绍来看，Claude 3.5全家桶仍会有3款系列模型，分别...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

英特尔推出新款AI芯片：推理性能比英伟达H100快50%

...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型，以及1750亿参数GPT-3模型的训练时间。英特尔表示，Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

李飞飞团队“50美元”复现DeepSeek R1？真相是…

...0美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹，真相究竟如何？《科...……更多

2025-02-07 06:25:00真相,团队,模型,通义,训练,基座

DeepSeek第二炸：开源首个用于 MoE 模型训练通信库

...码库DeepEP王炸。据了解，DeepEP是首个用于 MoE 模型训练和推理的开源 EP 通信库，它填补了MoE模型专用通信工具的空白，为大规模分布式AI训练和实时推理场景提供了更高效的底层支持。在这里，简单介绍一下DeepEP的技术性能特点...……更多

2025-02-25 11:33:00模型,训练,通信,推理,通信,场景

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

...」。模型升级：Baichuan4-Turbo两张4090即可部署，Baichuan4-Air推理成本下降99%接下来，如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中？从名字中不难看出，它们都是Baichuan 4系列基础模型的升级。对于企业来说，在不同场景阶段……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

通义App全面上线千问3 第一时间体验全球最强开源模型

...布的千问3开源模型包含8款不同尺寸，均为全新的“混合推理模型”，智能水平大幅提升的同时也更省算力。其中，千问3旗舰模型Qwen3-235B-A22B是一款混合专家（MoE）模型，该模型创下所有国产模型及全球开源模型的性能新高；Qwe...……更多

2025-04-29 11:28:00通义,模型,体验,全球,通义,模型

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型

...相对低配的GPU和显卡内存，就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后，这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数，激活参数为370亿，在14.8万亿token（词元）上进行了预训练，生成速度比...……更多

2025-01-29 21:29:00上海,下岗,模型,智能,开发,企业

综述｜5月全球人工智能领域新看点

...版本升级，当前版本为DeepSeek-R1-0528，模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

方寸之间算力无边，华硕隆重推出Ascent GX 10

...达1000AITOPS处理能力和128GB统一内存，实现无缝模型开发和推理先进架构：NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术，可有效提升AI工作负载扩展互联：配置为独立或私有云系统，以在桌面上驱动AI……更多

2025-03-31 08:42:00华硕,方寸,隆重推出,之间,计算机,模型

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...这个思路，我们开始思考：视觉模型是否也能实现类似的推理能力？”与传统大模型训练的 SFT（Supervised Fine-Tuning）方法不同，R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学，而R1方法则通过强化学习，...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球