边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

英伟达没有慌，黄仁勋再谈DeepSeek：“推理”的计算需求

...于DeepSeek、Grok、OpenAl等冲击，AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能，而增加深度思考的计算能力则能让答案更精准，与一次性推理相比...……更多

2025-02-27 11:55:00英伟,推理,需求,英伟,增长,推理

成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

...现突破，于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM（Denoising Diffusion Implicit Robot Model）。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM（Denoising Diffusion Proba……更多

2024-11-25 09:49:00成都,人形,机器人,推理,模型,机器

推动前沿大模型技术应用这只浙股去年营收净利双增

...司利用自主研发的训练框架和量化算法显著提升了训练和推理速度，并优化了模型精度与推理吞吐量；在智能安全保障上，公司采用RLHF方案对齐安全认知，创新的热修复技术确保了大模型的安全性，提供安全、可靠的用户体验...……更多

2025-02-26 09:09:00净利,技术应用,模型,应用,技术,模型

DeepSeek“点燃”国产芯片 FP8能否引领行业新标准？

...然没有资本市场那么高亢。技术派更关注FP8在模型训练、推理及生态标准化上的实际价值与挑战。▍FP8是什么，有哪些提升？在AI训练与推理过程中，为提升计算效率，数值精度的降低是一个常见的技术路径。摩尔线程AI Infra总...……更多

2025-08-24 11:58:00芯片,国产,标准,行业,精度,科创

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降8

...将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出...……更多

2025-02-13 19:51:00豆包,字节,推理,架构,模型,团队

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

DeepSeek，大消息

...伟达开源了首个在Blackwell架构上优化的DeepSeek-R1，实现了推理速度提升25倍，并且每token成本降低20倍的惊人成果。这一新模型的推出，标志着英伟达在人工智能领域的又一次重大进展。开源周第三天，DeepSeek宣布开源Optimized Paralle...……更多

2025-02-27 15:51:00消息,英伟,模型,推理,训练,通信

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

...ion模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。新模型具体如何推理，直接上实例，比如问题是：减去所有的小亮球和紫...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

Hugging Face发布SmolVLM开源 AI 模型：

...lVLM AI 视觉语言模型（VLM），仅有 20 亿参数，用于设备端推理，凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效，并且完全开源，所有模型检查点、VLM 数据集、训练...……更多

2024-11-28 09:47:00推理,模型,参数,模型,吞吐量,吞吐

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...AI大模型与操作终端深度结合后,必将带来大模型扩展能力边界、终端设备更加智能的“双赢”前景。而随着越来越多原生智能领域的技术专家和行业精英加入OpenHarmony社区,也必将推动OpenHarmony生态枝繁叶茂。期待更多伙伴加入Open...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

荣耀Magic V5发布，一文看懂YOYO到底有多强大

...各种美的设备。从AI模型底座的打磨，到技术、场景的边界突破，再到生态共赢，荣耀正以更强大的AI演进路径，重新定义终端智能边界，YOYO也在通过更智慧、可靠的AI体验打破地理、生理壁垒——偏远山村教师借助荣耀YOYO生...……更多

2025-07-04 13:11:00一文,荣耀,荣耀,智能,用户,模型

20多家车企接入DeepSeek：为啥没有“蔚小理华米特”

...上叫我给他们讲讲 AI 是怎么回事。由于同时具备强大的推理能力及开源模型两个特质，导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头，尽管都有各自自研的模型，但不...……更多

2025-02-14 12:52:00米特,接入,多家,模型,推理,智能

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...28日消息，AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference，号称“全球最快”。该服务已经在云端上线。据官网介绍，该推理服务在保证精度的同时，速度比英伟达的服务快20倍；其处理器内存带宽是英伟达...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...发力。一是在预训练的基础上加上强化学习，提高模型的推理能力。“强化学习还在早期，还会延续一长段时间。”第二个趋势是多模的理解生成一体化。李璟认为，文本领域已经实现生成理解任务的统一，语言模型的技术路线...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

算子开发到推理加速，一位00后开发者的“升级打怪”之旅

...框架降低了大模型训练的门槛，目前正在做大模型分布式推理加速，希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里，像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多

2024-04-27 19:00:00开发,算子,开发者,推理,之旅,升级

DeepSeek开源惠四方（科技名家笔谈）

...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献，必须坚持历史视角，将其放在人工智能创新发展的...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

超越YOLOv10/11、RT-DETRv2/3！D-FIN

...瓶颈，来自中科大的研究团队提出了 D-FINE，重新定义了边界框回归任务。不同于传统的固定坐标预测，D-FINE 创新了两种方法：细粒度分布优化 (FDR) 和全局最优定位自蒸馏 (GO-LSD)。通过将回归任务转化为细粒度的分布优化任务，...……更多

2024-10-30 09:52:00边界,任务,检测,目标,边界,进一

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...，随着 OpenAI o1 模型的推出，关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出，只要给模型一些干扰，最聪明的模型也会犯最简单的错误（参见《给小学数学题加句「废话」，OpenAI ...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

国产大模型第一梯队玩家，为什么pick了CPU？

...占绝对大头的因素——算力。现在提及大模型的训练和推理，很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势，但它所存在“硬伤”也是比较明显，那便是供应不足、价格昂贵。何以破局？国产大模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

摩尔线程新方法优化AI交互：显存节省最多82％

...nd Attention专为多轮对话场景推理需求设计，以轮次为自然边界划分KV缓存。研究发现，轮次粒度的Attention分布存在两个重要规律。其次，摩尔线程提出了Round Attention推理流水线；基于发现的两个规律，将稀疏性从Token级提升至块...……更多

2025-03-04 19:41:00摩尔,显存,线程,方法,摩尔,推理

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

...」。模型升级：Baichuan4-Turbo两张4090即可部署，Baichuan4-Air推理成本下降99%接下来，如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中？从名字中不难看出，它们都是Baichuan 4系列基础模型的升级。对于企业来说，在不同场景阶段……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

chatgpt低成本复现流程开源

...。相比原生PyTorch，单机训练速度最高可提升7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

pytorchtorchao正式发布,提供了一系列优化工具集

...将模型训练转换为float8，从而轻松实现模型高效训练。在推理方面，torchao提供多种量化方法，包括权重量化（Weight-OnlyQuantization）和动态激活量化（DynamicActivationQuantization），用户可以自有选择适合的量化策略，以获得最佳的模...……更多

2024-10-03 02:58:00工具集,工具,模型,可将,训练,推理