推理,模型,思路,原理,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...等工具如何为部署模型提供支持，助力大模型更加高效地推理。赵一嘉首先分享了 Stable Diffusion 背后模型的原理详解，细致地阐述了 Clip、VAE 和 Unet 等关键组件的工作原理。随着 Sora 爆火，也带火了背后的 DiT（扩散 Transformer）...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

清华团队提出新型光计算架构，光训练速度提升1个数量级

...智能计算的“潜力股”，为后摩尔时代带来新的希望。推理和训练是 AI 大模型核心能力的两个重要阶段，正是看到了这一点，该团队在推理和训练方面进行了同期的并行研究。今年 4 月，他们在 Science 报道了通用智能光计算芯...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

20多家车企接入DeepSeek：为啥没有“蔚小理华米特”

...上叫我给他们讲讲 AI 是怎么回事。由于同时具备强大的推理能力及开源模型两个特质，导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头，尽管都有各自自研的模型，但不...……更多

2025-02-14 12:52:00米特,接入,多家,模型,推理,智能

对标OpenAI o1！Kimi发布新一代推理模型：中考高考

...的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型，采用全新强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，大幅提升解决数学难题的能力。据了解，在多项数学基准能力测试中，k0-math的...……更多

2024-11-18 08:22:00推理,新一代,模型,高考,模型,基准

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o1的出现标志着大模型研发者开始把集中在训练阶段的投入，开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea提出得更早，...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

ChatGPT o1满血版上线！实测中它竟然败给了国产AI？

...特曼用一个简单的柱状图给出了对比：可以看到o1在数学推理和编程领域的表现要明显优于o1-preview，提升幅度在50%左右，而在科研领域的测试里，o1相对于o1-preview的表现就提升有限了。图源：OpenAI考虑到o1模型不需要额外加钱就...……更多

2024-12-11 20:12:00实测,国产,模型,推理,文心,答案

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

...果比较有限。因此该研究想要探明，在使用比较少的额外推理计算时，就能能让模型性能提升多少？他们设计了一组实验，使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法：（1）迭代自我修订：让模型多次尝试回答一个问...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

首发！优刻得云平台上新DeepSeek-V3-0324模型

... 不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude3.5/3.7Sonnet相媲美。同时，模型的开源协议升级为更宽松的MIT许可，进一步降低了商业应用门槛。优刻得云平台始终密切关注A...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

... 3.5依旧答错了。LeCun在此嘲讽大模型一番，大模型竟可以推理...？问题在于，LLM没有常识，不理解现实世界，也不会规划和推理。LLM行不行，就看提示了一位网友分析总结了，以上LLM失败的原因。他表示，LLM本身就是个「哑巴」...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

科学家竞相破解大型语言模型背后的谜团

...复杂行为。面对复杂问题，人类在潜意识里会进行分步骤推理。受此启发，谷歌团队2022年引入了“思维链提示”，以描述一种让LLM展示其“思维”的方法。简单来说，思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多

2024-05-18 02:42:00谜团,科学家,模型,背后,语言,科学

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

交通类 AI 项目预演阶段，本地化部署的一些新思路

...模型；资源调度类：还有团队在考虑利用DeepSeek的深度推理能力，对历史流量、天气、事件等多源数据进行融合分析，开发出大模型能够动态地优化信号灯控制策略，提升路口通行效率和交通资源利用率。这其中，报告生成类...……更多

2025-04-24 18:00:00思路,阶段,交通,项目,模型,交通

page 1/1334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

联通客户日暖冬送温情——福建联通VIP客户答谢会在三明圆满

活动现场。东南网11月26日讯（通讯员肖锦雯）近日，以“联通客户日暖冬回馈季”为主题的福建联通VIP客户答谢会在三明市徐锦新城小区温馨启幕

2025-11-26 12:50:00

梦百合家居董事长倪张根亮相沈阳“梦粉见面会”，发布适老化智能

近日，知名睡眠品牌MLILY 梦百合在沈阳京东MALL发布适老化智能床系列新品，并针对沈阳大东区社会福利院展开公益捐赠

2025-11-26 13:04:00

BORCHERS®亮相中国国际涂料展，以本地化创新与全球技术

在今天开幕的 2025 中国国际涂料展上，美利肯涂料添加剂品牌BORCHERS®于 W2.F21 展位（展馆 W2）再次携核心解决方案亮相

2025-11-26 13:37:00

国际大咖为“南京故事”国际传播支招

国际大咖为“南京故事”国际传播支招在中国制作向世界传播南报网讯（记者乔雅萱）11月22日上午，南京国际传播中心揭牌仪式现场

2025-11-26 10:27:00

江苏南京：链接全球资本！宁企赴港上市热潮涌动

□南京日报/紫金山新闻记者曹丽珍今年以来，一股赴港上市浪潮正在全国范围内持续奔涌。相关数据显示，今年前三季度，中国企业境外首次公开募股（IPO）的活跃度大幅回升

2025-11-26 10:27:00

江苏南京：一张购物小票，掘出一座“数据金山”

南京加快释放数据要素价值培育壮大数据产业一张购物小票，掘出一座“数据金山”晓数通社区微数据中心。江苏荣泽信息科技股份有限公司供图数族科技

2025-11-26 10:27:00

以栖霞区为核心舞台中欧携手共寻机器人产业“合伙人”

南报网讯（记者朱旖旎通讯员刘芳）深秋的南京，一场跨越山海的双向奔赴正在发生。近日，2025中欧机器人产业合作（南京）对接会在栖霞区召开

2025-11-26 10:28:00

医疗器械“产学研医”对接会举办

近日，2025南京医疗器械“产学研医”对接会在高淳举办，高校、医院、企业等多方代表齐聚。活动搭建协同平台，助力产业创新与成果转化

2025-11-26 10:28:00

南京打造微短剧产业集聚高地

在长三角文博会上亮出“文化家底”和数字创新实力南京打造微短剧产业集聚高地□南京日报/紫金山新闻记者朱静近日，一场聚焦微短剧的产业合作交流活动在国家会展中心（上海）火热举办

2025-11-26 10:28:00

江苏南京：相约十年，让制造更聪明

相约十年，让制造更聪明——写在2025世界智能制造大会即将召开之际□南京日报/紫金山新闻记者徐宁实习生黄倩“作为南京智能制造产业的标杆力量

2025-11-26 10:28:00

智能工厂运营效率提升

近日，在南京天加环境科技有限公司今年5月投产的天加洁净基地内，高度自动化生产线正生产发泡板机、换热器等核心零部件。该生产基地建立了从客户需求到最终交付的“端到端”全流程数字化运营体系

2025-11-26 10:28:00

厦大团队激光打印技术获重大突破

东南网11月26日讯（福建日报记者李珂）记者从厦门大学获悉，日前，该校萨本栋微米纳米科学技术研究院吴德志教授团队在3D打印技术领域取得突破性进展——首创“激光原位诱导直写打印”技术

2025-11-26 10:34:00

我市跨境电商生态再添新支点 POD孵化平台落地银城智谷

厦门网讯（厦门日报记者张珺通讯员吴冰冰）我市跨境电商生态再添新支点，日前，POD（按需定制）专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园

2025-11-25 08:11:00

AI赋能千行百业一线故事（十七）：这位“农事专家”，让种地更

这位“农事专家”，让种地更聪明——AI赋能千行百业一线故事（十七）11月14日，雄安新区都市农业科技博览园温室大棚内，工作人员查看番茄长势

2025-11-25 08:41:00

荣耀加冕！锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒

2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上

2025-11-25 09:25:00

头条订阅服务