成本,数学,时间,模型,数学,输出头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

数学击败o1-preview，成本仅为十分之一，并且几乎没有思考延迟！OpenAI《Her》全量开放同一天，谷歌Gemini 1.5迎来重大升级。除此之外，价格也是原来的一半，速度限制提升2-3倍；输出速度提升2倍、延迟降为原来三分之一。开发...……更多

2024-09-26 10:01:00成本,数学,时间,模型,数学,输出

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...enAI表示，o1模型会提供由模型生成的思维链摘要。预览版成本比GPT-4o贵三四倍，9.11和9.8谁大仍翻车“发布o1-preview的一个动机是为了观察哪些使用场景会变得流行，以及这些模型在哪些方面还需要改进。”OpenAI员工称。该公司表...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

NeurIPS 2024 | 数学推理场景下，首个分布外检测

本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收，第一作者王一鸣是上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通...……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...间，他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

Nature重磅：击败人类数学家，AI首次攻破经典数学难题

人工智能（AI）大模型，击败了人类数学家。今天，在 Nature 上发表的一篇论文中，Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch，它的工作原理是将预先训练的大型语言模型（LLMs）与...……更多

2023-12-15 14:38:00数学,数学家,重磅,难题,人类,经典

谷歌deepmind公布ai模型训练法

...包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind（下同）据悉，FunSearch模型训练法主要为AI模型引入了一个“评估器（Evaluator）”系统，AI模型输出一系列“创意解...……更多

2023-12-16 02:20:00模型,训练,模型,问题,训练,研究人员

ChatGPT o1满血版上线！实测中它竟然败给了国产AI？

...算困难的数学计算题：假设一个公司生产某种商品，生产成本与产量的关系为C(x)=3x^2-2x+5（单位：万元），其中x是产量（单位：千件）。市场售价与产量的关系为P(x)=50-0.5x（单位：万元/千件）。1.求该公司生产x千件商品时的总...……更多

2024-12-11 20:12:00实测,国产,模型,推理,文心,答案

OpenAI CEO罕见认错：DeepSeek是非常好的模型

...式发布了o3-mini模型，这也是OpenAI推理系列中最新、最具成本效益的模型，并且已在ChatGPT和API中开放使用。据悉，该模型在数学代码等基准测试中刷新SOTA，相关测试中o3-mini（high）在准确率和校准误差（Calibration Error）均是最优...……更多

2025-02-03 14:40:00模型,模型,奥尔,伟达,成本,奥尔特曼

补齐Transformer规划短板又不放弃快速思考，Dual

...只是模仿系统 2 式的思考过程，那就需要远远更高的计算成本才能完成，同时响应速度也会大幅减慢。在研究这一难题时，田渊栋团队得到了一项惊人发现：在解决推理任务时，一种简单的数据方案就足以实现即时动态的系统 1 ...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LL

...便宜，现在想体验更强大的推理能力则需要再付出几倍的成本。嫌OpenAI o1太贵？那就自己做一个！近日，一篇利用纯提示方法让普通LLM变身成为OpenAI o1的文章在推特上爆火。开源代码：https://github.com/harishsg993010/LLM-Research-Scr……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...数学能力看，o1最强，其次是o1-mini，最后是o1-preview，从成本看，o1最高，其次是o1-preview，最便宜是o1-mini。o1擅长准确生成和调试复杂代码，o1-preview具有较强的推理能力和广阔的世界知识，o1-mini速度更快、比o1-preview便宜80%的推.……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

...让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻辑一致性和合理性。相比CoT将推理过程表示为线性序列，DoT更能捕捉人类推理的复杂性。相比引入...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

能看风水夸我有情趣 Kimi现在都这么野了吗

...答案，但很快它就否定了自己。继续把假币、找零还有成本利润这些复杂因素综合考虑进去，最后终于想明白老板亏了 80 元。（正确答案是 80 元）往上滑动查看更多这逻辑能力，确实有点强。包括我拿几道行测的类比推理题...……更多

2024-12-19 00:21:00看风水,情趣,模型,能力,推理,更多

腾讯推出新一代大模型「混元Turbo」，性能大幅提升，定价低

...模型采用MoE架构，比上一代产品推理效率提升100%，推理成本降低50%，解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布，腾讯混元Turbo在腾讯云上线，输入和输出价格只有前代模型的一半，输出...……更多

2024-09-05 14:28:00腾讯,新一代,模型,定价,性能,腾讯

openaio1系列模型开放访问权限

...限价格较高，其中o1的输入词元（tokens）费用为每百万个成本15美元（IT之家备注：当前约107元人民币），输出词元费用为每百万个60美元（当前约427元人民币），通过API调用时，o1模型每分钟最多可调用500次，o1-mini模型每分钟可...……更多

2024-09-23 04:12:00模型,权限,开放,模型,可调,任务

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...编程的更快、更便宜的推理模型。」整体来看，o1-mini 的成本比 o1-preview 低 80%。由于 o1 等大型语言模型是在大量文本数据集上预训练，虽然具有广泛世界知识，但对于实际应用来说，可能成本高昂且速度慢。相比之下，o1-mini 是...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

终于，Claude上线LaTeX公式渲染功能，评论区网友沸腾

当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时，Claude 现在终于补上了这一功能。在论文、书籍、报告或幻灯片中，我们有时需要插入数学公式或符号。其中使用 LaTeX 语言来生成数学公式或符号是主要方式之一，这...……更多

2024-08-24 09:35:00公式,功能,网友,评论,数学,公式

对标o1，Kimi放出了最能打的国产模型

...6 日交上又一份答卷：Kimi 的最新一代推理模型 k0-math，在数学能力已实现对标 OpenAI o1-mini 和 o1-preview。这是 Kimi 推出的首款推理能力强化模型，k0-math 同样采用了全新的强化学习和思维链推理技术，通过模拟人脑的思考和反思过...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...15美元，每100万输出tokens收费60美元。与GPT-4o 相比，输入成本是其3倍，输出成本是其4倍。 o1-mini则定位速度更快、成本效益更高，据称在数学和编程方面的表现也较为出色，在AIME和Codeforces等评估基准上几乎与o1性能相当，可作...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

清华量子计算成果登顶刊，来自丘成桐数学中心团队

...计算获得广泛应用，它能够指导人们如何更有效率地部署成本高昂的量子纠错机制。学术界首次发现噪声造成量子优势突然消亡现象概括而言，这项研究主要做出了以下贡献：成功刻画了逐渐增强的噪声影响量子优势的动态过...……更多

2024-11-28 12:04:00清华,量子,成果,团队,数学,量子

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

...制能力，让用户能够更好地为不同任务配置特定预算，在成本效益和推理质量之间实现更优的平衡。同时，由于模型架构的改进、训练数据的增加以及更有效的训练方法，Qwen3稠密基础模型的性能与参数更多的Qwen2.5基础模型相当...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

用AI自动设计智能体，数学提分25.9%，远超手工设计

...用，可能需要考虑不同的优化目标，例如智能体的性能、成本、延迟或安全性。评估函数定义如何评估候选智能体的这些指标。例如，为了评估智能体在未见过的数据上的表现，一种简单的方法是计算任务验证数据的准确率。该...……更多

2024-08-24 09:36:00设计,手工,数学,智能,智能,元智

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能

...出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002，相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用，Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%，提高了两种模……更多

2024-09-26 09:51:00进化,更快,模型,成本,性能,模型