边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

让OpenAI o1逆天的慢思考，360两月前就做出来了？周鸿祎CoE媲美CoT，应用太前瞻

...读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea提出得更早，...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

国内首个通过主任医师评测的大模型，已在夸克AI搜索上线

...度越高、领先优势越明显的性能曲线，展现出在复杂医学推理任务中的突破。这揭示了在医学领域研发垂类模型的巨大潜力。夸克健康大模型以通义千问为基础，走出了一条面向垂直场景的深度工程化路线。“我们不是在训练AI...……更多

2025-07-23 15:07:00夸克,主任医师,医师,模型,评测,主任

DeepSeek首次披露：理论成本利润率545%

...层涟漪。3月1日，DeepSeek在知乎上发表题为《DeepSeek-V3/R1 推理系统概览》的文章，全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是，文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍，假定GPU租赁成本为2...……更多

2025-03-01 18:59:00利润率,利润,成本,理论,节点,模型

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

...用的多个公开Benchmark上，腾讯混元Turbo S在知识、数学、推理等多个领域展现出对标DeepSeek-V3、GPT-4o、Claude3.5等业界领先模型的效果表现。表格中，其他模型的评测指标来自官方评测结果，官方评测结果中不包含部分来自混元内...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

Llama版o1来了，来自上海AI Lab，强化学习代码已开

复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

百度智能云两大基础设施再升级！打造AI时代最开放的智能基础设

...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点：推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力，实现算力性能与成本的双重突破。本次大会...……更多

2025-04-25 16:27:00基础设施,设施,智能,基础,升级,开放

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

马斯克突然发布Grok-2！数学推理能力突出，攻克“9.9与

...上一代模型，Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。值得一提的是，Grok-2在数学推理（MathVista）方面表现登顶测试榜首。但细心网友不难发现，即便是Grok-2，在其他方面与前沿模型GPT-4o或Claude ...……更多

2024-08-15 09:56:00马斯,马斯克,推理,难题,大小,能力

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...78%～90%。检索增强（retrieval-augmented）的语言模型可以在推理时检索并集成外部知识源，从而缓解上述问题。然而，许多此类系统依赖于黑盒API或通用的LLM ，既没有针对文献综合的任务进行优化，也没有搭配适合科研的开放式...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

腾讯：已囤很多GPU 足够训练未来几代模型

...实基础。从需求端来看，当前腾讯对GPU更大的需求集中在推理侧。随着用户推理需求的逐步增长，推理token（词元）的需求远超此前预期。此外，腾讯还计划深度整合AI与游戏业务，在游戏中以多种形式灵活部署AI。腾讯高管也坦...……更多

2025-05-14 23:45:00腾讯,模型,训练,腾讯,推理,资本

IDC最新报告：2024中国AI基础设施市场份额，阿里云第一

...；在生成式AI基础设施领域，阿里云取得模型训练和模型推理市场的双项冠军。AI IaaS 是以GPU等AI专用芯片为算力支撑的基础设施，包括以大模型为核心的生成式AI IaaS（GenAI IaaS）和传统的非生成式AI IaaS。随着大模型加速发展，生...……更多

2025-07-01 11:53:00阿里,中国,基础设施,份额,设施,基础

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...tical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...这个思路，我们开始思考：视觉模型是否也能实现类似的推理能力？”与传统大模型训练的 SFT（Supervised Fine-Tuning）方法不同，R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学，而R1方法则通过强化学习，...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

...了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

... Yi-1.0 的持续预训练版本，使用 500B 个 token 来提高编码、推理和指令执行能力，并在 300 万个指令调优样本上进行了精细调整。刚一发布，就已经有开发者跃跃欲试：并收获了好评：与前序模型相比，Yi-1.5 系列模型进一步提升...……更多

2024-05-14 09:56:00万物,模型,国产,再次,排行榜,模型

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...拥有一个AI Agent。“如果说2024年是大模型落地应用之年，推理就会越来越重要。此前在训练芯片市场上，英伟达一骑绝尘，占有绝对的市场占有率，那么今天，推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

Anthropic再反击！发布Claude 3.5吊打GPT

...本Claude 3.5 Sonnet。从官方披露的测试数据来看，其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言，“太卷了，现在AI竞争是要以周为单位了吗？” 从官方介绍来看，Claude 3.5全家桶仍会有3款系列模型，分别...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能