• 我的订阅
  • 头条热搜
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
数学击败o1-preview,成本仅为十分之一,并且几乎没有思考延迟!OpenAI《Her》全量开放同一天,谷歌Gemini 1.5迎来重大升级。除此之外,价格也是原来的一半,速度限制提升2-3倍;输出速度提升2倍、延迟降为原来三分之一。开发...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI表示,o1模型会提供由模型生成的思维链摘要。预览版成本比GPT-4o贵三四倍,9.11和9.8谁大仍翻车“发布o1-preview的一个动机是为了观察哪些使用场景会变得流行,以及这些模型在哪些方面还需要改进。”OpenAI员工称。该公司表...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场...……更多
谷歌deepmind公布ai模型训练法
...包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind(下同)据悉,FunSearch模型训练法主要为AI模型引入了一个“评估器(Evaluator)”系统,AI模型输出一系列“创意解...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
人工智能(AI)大模型,击败了人类数学家。今天,在 Nature 上发表的一篇论文中,Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch,它的工作原理是将预先训练的大型语言模型(LLMs)与...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...只是模仿系统 2 式的思考过程,那就需要远远更高的计算成本才能完成,同时响应速度也会大幅减慢。在研究这一难题时,田渊栋团队得到了一项惊人发现:在解决推理任务时,一种简单的数据方案就足以实现即时动态的系统 1 ...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...便宜,现在想体验更强大的推理能力则需要再付出几倍的成本。 嫌OpenAI o1太贵?那就自己做一个!近日,一篇利用纯提示方法让普通LLM变身成为OpenAI o1的文章在推特上爆火。开源代码:https://github.com/harishsg993010/LLM-Research-Scr……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...数学能力看,o1最强,其次是o1-mini,最后是o1-preview,从成本看,o1最高,其次是o1-preview,最便宜是o1-mini。o1擅长准确生成和调试复杂代码,o1-preview具有较强的推理能力和广阔的世界知识,o1-mini速度更快、比o1-preview便宜80%的推.……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻辑一致性和合理性。相比CoT将推理过程表示为线性序列,DoT更能捕捉人类推理的复杂性。相比引入...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
...模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只有前代模型的一半,输出...……更多
openaio1系列模型开放访问权限
...限价格较高,其中o1的输入词元(tokens)费用为每百万个成本15美元(IT之家备注:当前约107元人民币),输出词元费用为每百万个60美元(当前约427元人民币),通过API调用时,o1模型每分钟最多可调用500次,o1-mini模型每分钟可...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...编程的更快、更便宜的推理模型。」整体来看,o1-mini 的成本比 o1-preview 低 80%。由于 o1 等大型语言模型是在大量文本数据集上预训练,虽然具有广泛世界知识,但对于实际应用来说,可能成本高昂且速度慢。相比之下,o1-mini 是...……更多
对标o1,Kimi放出了最能打的国产模型
...6 日交上又一份答卷:Kimi 的最新一代推理模型 k0-math,在数学能力已实现对标 OpenAI o1-mini 和 o1-preview。这是 Kimi 推出的首款推理能力强化模型,k0-math 同样采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过...……更多
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时,Claude 现在终于补上了这一功能。在论文、书籍、报告或幻灯片中,我们有时需要插入数学公式或符号。其中使用 LaTeX 语言来生成数学公式或符号是主要方式之一,这...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...15美元,每100万输出tokens收费60美元。与GPT-4o 相比,输入成本是其3倍,输出成本是其4倍。 o1-mini则定位速度更快、成本效益更高,据称在数学和编程方面的表现也较为出色,在AIME和Codeforces等评估基准上几乎与o1性能相当,可作...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...用,可能需要考虑不同的优化目标,例如智能体的性能、成本、延迟或安全性。评估函数定义如何评估候选智能体的这些指标。例如,为了评估智能体在未见过的数据上的表现,一种简单的方法是计算任务验证数据的准确率。该...……更多
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
...出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模……更多
学而思推出数学答疑原生AI工具九章随时问,“AI将重新定义教育行业”
...,好未来官方公众号宣布,学而思九章大模型推出最新AI数学搜索答疑工具“九章随时问”,即日起免费开放使用。这款产品打破了以生成式AI技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解题思维...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...创作情况。介绍完功能特性,再来说说很多人关心的使用成本。 值得一提的是,与上代“大杯”模型Claude 3 Opus相比,这次的“中杯”Claude 3.5 Sonnet不仅研发成本低,其性能已是最强前辈的两倍。官方介绍,该模型每百万输入Toke...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...展1000倍必定是昂贵的,形象地解释,下一代数据中心的成本将超过一个小国的GDP。按照目前的发展速度,我们的硬件、成本、财力根本无法跟得上。GPU撞墙了圣克拉拉,英伟达总部所在地,不愿意让人知道的小秘密是—— GPU性...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...成的是易于理解的文本,这件事非常重要,尤其是在处理数学、编码这样的复杂任务时。如下图所示,你让 AI 写一个快速排序算法,AI 很快就写出来了,而且答案很简洁。但不会写代码的你要怎么判断 AI 写得对不对呢?OpenAI 在...……更多
...地了解大模型产品的性能和特点提供了参考样本。AI高考数学全不及格?换个打开方式试试近期,一则“AI高考测试出分,数学全不及格”的消息登上“热搜”。消息出自上海人工智能实验室旗下司南评测体系OpenCompass对7个开源...……更多
Transformer打破三十年数学猜想!Meta研究者用AI给出反例,算法杀手攻克数学难题
【新智元导读】30多年的数学猜想首次获得了进展!Meta等学者提出的PatternBoost,使用Transformer构造了一个反例,反驳了一个已悬而未决30年的猜想。是否所有数学问题都适合机器学习技术?这样的未来太令人期待了。30多年的数...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...是「推理专家」,比以往OpenAI最佳模型还要聪明。而且,成本和延迟都非常低。 或许,它可能不一定知道一位名人,以其出生日期,但确具备了如何进行有效推理,和大量智慧的能力。OpenAI研究人员表示,将进一步改进算法,...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...名为Arrakis或Q*,原本计划在2025年作为GPT-5发布,但因推理成本高而取消。OpenAI此后计划,2027年发布的Q 2025(GPT-8)将实现完全的AGI。人工智能(AI)研究者早就在争论用什么标准判断人类实现了通用人工智能(AGI)。OpenAI最近开...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tianhao Wu,导师之一...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...驾驶所需的模型。Etched 给我们算了一笔账:芯片项目的成本为 5000 万至 1 亿美元,需要数年时间才能投入生产。另一方面,当模型训练成本超过 10 亿美元、推理成本超过 100 亿美元时,使用专用芯片是不可避免的。在这种产业...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...么得出上述结论的呢?我们先来看一个例子。假设有一个数学问题:奥利弗在星期五摘了 44 个猕猴桃。然后在星期六摘了 58 个猕猴桃。星期天,他摘的猕猴桃数量是星期五的两倍。奥利弗有多少个猕猴桃?显然,答案是 44 + 58 +...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学能力,积累了一些关注。这次最新开源代码,也在开发者社区引起热议。OpenAI o1系列发布后,团队开始升级算法,专注于数学奥赛问题,作为OpenAI草莓项目的开源版本...……更多
kimi智能助手更新:模型能力提升
...答更快,等待时间更短。逻辑推理能力提升:其中Kimi的数学和编程能力更强了。翻译能力提升:进一步提升了中英翻译场景下的语言准确性。其他体验优化:解决了Kimi在单行数学公式输出格式不稳定、部分场景回答不够精练等...……更多
更多关于科技的资讯:
钻漏洞谋求个人私利:吉林一雪场将15名大学生拉入黑名单
快科技1月15日消息,国内不少景点会针对大学生等群体推出相应的优惠政策,有些甚至是免门票,然而这样的规则也会被有心人利用谋取私利
2025-01-15 17:25:00
小米超级小爱升级计划公布:小米13/K60等也能用上 1月27日前推送
快科技1月15日消息,小米官方今天发文宣布,澎湃OS 2系统中的「超级小爱」功能已正式向用户开放。该功能新增了手势唤醒和智能理解屏幕内容等特性
2025-01-15 17:25:00
高性能内存对于游戏帧率如此重要!英睿达DDR5 Pro 6400MHz评测
一、前言:专为锐龙9000平台设计的游戏内存内存延迟对于游戏帧率的重要性已无需赘述。由于Intel新一代酷睿Ultra 200S在游戏性能上的拉胯表现
2025-01-15 17:25:00
理想汽车推出2025新春活动攻略!涵盖充电免服务费等福利
快科技1月15日消息,理想汽车为庆祝2025年新春,推出了五重福利活动。活动从1月16日开始,至2月4日结束,期间理想汽车全系车型在全国范围内的高速理想超充站充电时
2025-01-15 17:25:00
网友申请退机票收到近七千元代金券 携程称系航司政策规定
快科技1月15日消息,据媒体报道,近日,有网友反映称,他在2024年11月,通过携程购买了12月21日的往返国际机票,总价为8279元人民币
2025-01-15 17:25:00
连续36年第一!中国第一个14万亿大省诞生 广东新能源汽车、手机产能激增
快科技1月15日消息,2024年广东GDP预计站上14万亿大关,成为我国第一个14万亿大省,连续36年蝉联全国榜首(已经全面赶超“亚洲四小龙”)
2025-01-15 17:25:00
男子聚餐后次日身亡9同事被告 法院:同饮者已尽合理注意义务 无责!
1月15日消息,外出聚餐莫劝酒,一旦出事情很有可能摊上官司,类似的事情已经不止一次发生,想必关注新闻的朋友都已了解。据CCTV法治在线报道
2025-01-15 17:25:00
史无前例!世界最大核能基地首创“和气一号”能源站
快科技1月15日消息,据报道,位于江苏连云港的田湾核电站,是全球在运+在建总装机容量最大的核电基地 。随着7、8号机组投产
2025-01-15 17:55:00
三星Galaxy S25欧版存储仍为128GB起售!亚洲地区256GB起售
快科技1月15日消息,三星Galaxy S25系列手机即将发布,不同市场的存储配置差异引发关注。据海外科技博主透露的消息来看
2025-01-15 17:55:00
铃木汽车将在印度利用牛粪生产车用沼气燃料 此前曾宣称要建沼气厂
快科技1月15日消息,据媒体报道,日本铃木汽车公司目前正在印度全力利用牛粪生产汽车用沼气燃料。据了解,在2024年12 月 25 日
2025-01-15 17:55:00
男子开火车卧铺车厢带全家自驾游:一辆车住了十几个人
快科技1月15日消息,近日,博主@ 狼先生~(卷儿哥)开着火车卧铺带全家人自驾游的视频,引起网友关注热议。据博主介绍,加上父母他们一行十多人
2025-01-15 18:25:00
2025支付宝集福玩法公布:每人5次!集齐立马开奖 不用等除夕
快科技1月15日消息,今天,支付宝正式官宣了2025支付宝集福玩法。今年的集五福将在1月20日启动,玩法相比以往有明显变化
2025-01-15 18:25:00
诺基亚与三星达成重磅协议!三星电视将用上诺基亚视频技术
快科技1月15日消息,诺基亚与三星签署多年期专利许可协议,三星电视将采用诺基亚视频技术。根据协议,三星将向诺基亚支付专利费用
2025-01-15 18:25:00
你见过活沙币吗
如果你在海滩上赶海时,捡到下图中的“白色圆盘”,你觉得最有可能是什么?是贝壳还是石块,抑或是古老的植物花瓣化石?海滩边上的“死沙币”图源sanddollarshelling真相也许会让你大吃一惊因为你捡到的其实是一枚沙币
2025-01-15 18:25:00
RTX4060游戏本便宜了 翼龙15 Pro双补仅5670元
快科技1月15日消息,机械革命翼龙15 Pro正在天猫旗舰店参加百亿补贴+国家补贴双重补贴活动中,到手价格仅5670.4元
2025-01-15 18:25:00