推理,模型,思路,原理,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...等工具如何为部署模型提供支持，助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解，细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火，也带火了背后的 DiT（扩散 Transformer）...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

清华团队提出新型光计算架构，光训练速度提升1个数量级

...智能计算的“潜力股”，为后摩尔时代带来新的希望。推理和训练是 AI 大模型核心能力的两个重要阶段，正是看到了这一点，该团队在推理和训练方面进行了同期的并行研究。今年 4 月，他们在 Science 报道了通用智能光计算芯...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

对标OpenAI o1！Kimi发布新一代推理模型：中考高考

...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。据了解，在多项数学基准能力测试中，k0-math的...……更多

2024-11-18 08:22:00推理,新一代,模型,高考,模型,基准

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o1的出现标志着大模型研发者开始把集中在训练阶段的投入，开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea提出得更早，...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

...果比较有限。因此该研究想要探明，在使用比较少的额外推理计算时，就能能让模型性能提升多少？他们设计了一组实验，使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法：（1）迭代自我修订：让模型多次尝试回答一个问...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

... 3.5依旧答错了。LeCun在此嘲讽大模型一番，大模型竟可以推理...？问题在于，LLM没有常识，不理解现实世界，也不会规划和推理。LLM行不行，就看提示了一位网友分析总结了，以上LLM失败的原因。他表示，LLM本身就是个「哑巴」...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

科学家竞相破解大型语言模型背后的谜团

...复杂行为。面对复杂问题，人类在潜意识里会进行分步骤推理。受此启发，谷歌团队2022年引入了“思维链提示”，以描述一种让LLM展示其“思维”的方法。简单来说，思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多

2024-05-18 02:42:00谜团,科学家,模型,背后,语言,科学

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...较长的小说了。更重要的是，LLM真的能在这个长度上进行推理吗？近日，有两篇独立研究分别表明：长上下文水分很大！LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员，推出了一项针对性...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

NeurIPS 2024|水印与高效推理如何两全其美？最新理

... sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效果和生成速度上达到了现有最...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

中兴通讯引领算力时代：投资智能计算基础设施与大模型训练推理

...于算力领域，并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域，大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多

2023-12-04 10:08:00中兴通讯,推理,基础设施,模型,设施,训练

page 1/1000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

官方：鼓励小、散、低效的存量算力设施向集约化、高效率转变

中新经纬10月31日电国家发展改革委政策研究室副主任、新闻发言人李超表示，鼓励小、散、低效的存量算力设施向集约化、高效率转变

2025-10-31 13:34:00

企业选型终极指南：基于预算与行业，中国GEO服务商推荐（附T

在AI重构流量分配规则的2025年，生成式AI搜索优化（GEO）已成为企业不可或缺的战略投入。然而，面对市场上众多的GEO服务商

2025-10-31 11:00:00

增压好的热水器推荐：万和多款热水器待你选择

在城镇化加速与高层住宅普及的当下，老旧小区管道老化、高层建筑水压衰减等问题愈发突出，不少家庭正遭受 “细流澡”“忽冷忽热” 的沐浴困扰

2025-10-30 08:16:00

创新，是让世界重新认识中国制造

“创新”，这个词我们每天都在说。要让世界记住中国制造的创新，一定是要让人们能看得见、记得住、感受到。我给大家分享几个小故事

2025-10-30 08:35:00

团石家庄市委启动青年创业训练营百名青年开启小店创业之旅

河北日报讯（记者孙青）为激发青年创业活力，点燃青年创业梦想，日前，团石家庄市委正式启动“青年创业训练营——青年小店孵化计划”

2025-10-30 08:36:00

文化快评丨莫让文创“李鬼”伤了原创的心

当故宫的红墙金瓦凝缩成书签的精致纹路，当敦煌的飞天壁画跃然咖啡杯的杯身，博物馆中的千年文明正通过文创产品打开新的传承通道

2025-10-30 08:44:00

校宝智慧校园发布招生智能化解决方案，为民办教育注入增长新动能

2025年10月29日，校宝智慧校园正式推出面向民办、国际化学校的招生智能化解决方案，包含流量获取、线索转化、组织建设与数据决策四大核心板块

2025-10-30 09:10:00

Soul App开源播客语音合成模型SoulX-Podcas

近日,Soul App AI团队(Soul AI Lab)正式开源播客语音合成模型SoulX-Podcast。该模型是一款专为多人

2025-10-30 09:10:00

中宏保险发布2025年第三季度个险理赔服务报告

服务效能持续提升中老年多元化保障需求凸显近日，中宏保险正式发布了《2025年第三季度中宏保险个险理赔服务报告》（以下简称"报告"）

2025-10-30 09:10:00

AI+人工双核验：深瞳查重如何以精准核查守护科研诚信

在科研诚信日益重要的今天，图片查重已成为维护科研诚信的关键环节手段。作为国内首家推出图片查重服务的深瞳查重，深瞳查重始终将结果的准确性和可靠性放在首位

2025-10-30 09:10:00

德明利亮相安博会，推出面向智能安防的多维度存储解决方案

10月28日，深圳CPSE安博会在福田会展中心顺利开幕，展会聚焦AI与大数据的智能安防创新。德明利携工业级存储产品及多维矩阵方案亮相

2025-10-30 09:10:00

碧欧宝亮相2025德国品牌周，于外滩百年地标演绎德式健康美学

2025年10月23日，由德国工商总会主办的“Discover Germany 德国品牌周”在外滩百年地标老市府隆重启幕

2025-10-30 10:10:00

留学常用APP与交友软件推荐：学习、生活、社交一站式搞定

即将远赴海外求学，除了收拾行囊，在手机里提前装好实用的留学APP，也成了许多准留学生的必备功课。面对应用商店里海量的留学常用APP选择

2025-10-30 10:56:00

工商银行联合腾讯云发布《中国金融生成式AI多模态内容鉴伪与安

随着生成式人工智能浪潮全面兴起，金融行业在加速迈向“AI原生”时代的同时，也面临多模态深度伪造内容带来的新型安全挑战。利用生成式AI合成的语音

2025-10-30 12:08:00

片仔癀黄芩多肽洗护新品亮相漳州，以东方智慧开启舒缓新“净”界

10月23日，东方新国妆代表品牌——片仔癀化妆品，在品牌发源地漳州隆重举办黄芩多肽系列新品发布会。活动以“亮剑·向新而生”为主题

2025-10-30 12:11:00

头条订阅服务