推理,模型,思路,原理,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

大模型推理与训练的边界之争

随着大模型的发展日新月异，其推理和训练的边界问题也引起了广泛讨论。近日，清程极智CEO汤雄超在一场行业活动中明确表示，尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限，但从技术角度来看，这两个阶段...……更多

2024-11-07 20:18:00边界,推理,模型,训练,推理,模型

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

GPT-4o的识图能力有多牛？四大维度深度体验

...，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅准确识别了手写体文字并遵照指示，且答题逻辑完全合...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

Scaling Law瓶颈，Cursor编程为什么这么强？新

...是从模型中重复抽取的。这种情况下，即使模型花费更多推理时间，也难以获得更好的搜索结果。通行的大模型排行榜，例如例如 LMSYS Chatbot Arena、LiveCodeBench、OpenLLMLeaderboard，很难反应模型在回答多样性方面的不足。这些排行榜...……更多

2024-09-12 09:47:00瓶颈,武器,秘密,编程,研究,模型

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...被展示过了，但我喜欢你添加的新细节，特别是强调了“推理”类任务比其他任务受影响更大！还有不少学者、工程师也表示强烈推荐。敢打赌，其中一些见解最终将会用于改进Transformer。其中的实验再次证实了：复制层对创...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

...ion模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。新模型具体如何推理，直接上实例，比如问题是：减去所有的小亮球和紫...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力，使其能够自我进化在传统 LLM 中，更新模型通常需要调整所有参数，而如果目的是处理个体数据，那这种操作明显不切实际。...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...很多不同的GPU型号和显存大小。再加上，目前广泛应用于推理阶段的量化技术，比如可以用FP16或FP8精度，这会改变推理和训练/微调成本的比重。以上这些限制因素，都让模型规模的选择成为一个非常具有挑战性的问题。总体而...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

阿里最新开源推理模型发布：性能比肩DeepSeek-R1

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o

快科技1月16日消息，今日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解，在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多

2025-01-16 14:56:00通义,阿里,推理,模型,尺寸,奖励

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...术分享直播活动的最后一天！周五，OpenAI发布了下一代的推理模型o3，这是今年早些时候发布的o1推理模型的升级版本。更准确地说，o3是一个模型系列——就像o1一样，同时有o3和o3-mini两个版本，后者是一款更小的精简版模型，...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降8

...将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出...……更多

2025-02-13 19:51:00豆包,字节,推理,架构,模型,团队

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根据所遇到的信息灵活调整研究方向。值得注意的是，在对这个智能体的能力评测中，OpenAI特...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

...云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。随着A...……更多

2024-07-19 17:21:00阿里,推理,模型,性能,升级,服务

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...28日消息，AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference，号称“全球最快”。该服务已经在云端上线。据官网介绍，该推理服务在保证精度的同时，速度比英伟达的服务快20倍；其处理器内存带宽是英伟达...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

page 3/1000 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

主动对接专项辅导太原税务助力经营主体应对消费旺季

从乡村直播间的农特产品，到城市商场的促销热潮，再到物流行业的高效运转……记者从太原市税务局获悉，随着“双11”将下半年消费市场带入旺季

2025-11-21 08:12:00

天阳科技发布“量子增强计划”，多方聚力共筑“量子金融”新生态

近日，以 “量子计算+AI：重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开，本次研讨会由天阳宏业科技股份有限公司（以下简称 “天阳科技”）主办

2025-11-21 08:29:00

奋进的河北·“十四五”答卷丨身边的“十四五”（四）：车间里的

向智而行，新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统，实现订单与产能高效匹配；石家庄四药集团应用生产执行系统

2025-11-21 08:36:00

华厦眼科发布《厦门市新闻工作者眼健康白皮书》打造职业健康保

“看见”，是新闻工作的起点。守护新闻工作者的清晰视野，就是守护社会公器的明亮窗口。11月18日，在厦门市新闻工作者协会指导下

2025-11-21 09:40:00

网易 UU 远程 Mac 被控功能上线，提升 macOS高效

网易 UU 远程全新版本上线，在已有 Mac 控制 PC 功能的基础上，正式开放 Mac 设备被控功能，自此 Mac 实现控制与被控的双向协作

2025-11-21 09:47:00

小米回应“潜水手表不能潜水”：相关报道失实

中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示

2025-11-21 11:11:00

阿里巴巴承办COP30中国角边会展示AI驱动气候治理新成果

第30届联合国气候变化大会（COP30）于11月10日至21日在巴西帕拉州首府贝伦市举办，这是2015年《巴黎协定》签署以来最受瞩目的气候大会

2025-11-21 11:36:00

数绘星云与腾讯云达成战略合作，共同推动AI出海电商智能化升级

11月18日，数绘星云（深圳）科技有限责任公司与腾讯云正式签订战略合作协议，双方将在云计算、大数据、AIGC等核心领域开展深度合作

2025-11-21 11:48:00

外媒：基于Gemini 3，谷歌再推AI图像生成器

中新经纬11月21日电据彭博社报道，当地时间20日，谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型

2025-11-21 11:53:00

陕西“十四五”科技创新发展特写|边研边产、产研互动这个团队

回望“十四五”，西安交通大学方涛教授说，他们团队倍感振奋。“在国家能源结构转型关键期，我们扎根国家‘双碳’战略，依托西安交大强大科研平台

2025-11-21 13:29:00

盲盒手办发展既要讲增长也要重安全

舒朗秋11月19日，工业和信息化部举行新闻发布会，介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍，我国建成了全球最为完善的玩具产业链

2025-11-21 14:19:00

从年度词汇看社会发展脉动

向长河英国剑桥大学出版社近日宣布，与追星相关的词语“准社交”（parasocial）成为2025年《剑桥词典》年度词汇

2025-11-21 14:19:00

2025世界计算大会发布全球计算十大创新成就

20日，2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括

2025-11-21 15:35:00

系统创业自由人生｜首届雨大王大健康私域 IP 创业峰会在深

2025年11月1日-2日，为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业，自由人生"为主题

2025-11-21 15:41:00

《保险AI智能体应用白皮书》发布，四层架构＋七大场景定义行业

随着人工智能技术加速重塑千行百业，以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业，伴随数字化进程的深入推进

2025-11-21 15:42:00

头条订阅服务