• 我的订阅
  • 头条热搜
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
数学击败o1-preview,成本仅为十分之一,并且几乎没有思考延迟!OpenAI《Her》全量开放同一天,谷歌Gemini 1.5迎来重大升级。除此之外,价格也是原来的一半,速度限制提升2-3倍;输出速度提升2倍、延迟降为原来三分之一。开发...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI表示,o1模型会提供由模型生成的思维链摘要。预览版成本比GPT-4o贵三四倍,9.11和9.8谁大仍翻车“发布o1-preview的一个动机是为了观察哪些使用场景会变得流行,以及这些模型在哪些方面还需要改进。”OpenAI员工称。该公司表...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...源和存储空间,以及大量的训练数据。这使得训练和部署成本非常高。环境依赖性:LLMs的性能取决于输入的上下文和环境。如果输入的数据与训练数据不同,它们可能会产生错误的输出。基于上述问题,这些模型有时会做出不...……更多
谷歌deepmind公布ai模型训练法
...包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind(下同)据悉,FunSearch模型训练法主要为AI模型引入了一个“评估器(Evaluator)”系统,AI模型输出一系列“创意解...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
人工智能(AI)大模型,击败了人类数学家。今天,在 Nature 上发表的一篇论文中,Google DeepMind 的研究团队介绍了一种搜索数学和计算机科学新解决方案的方法——FunSearch,它的工作原理是将预先训练的大型语言模型(LLMs)与...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...算困难的数学计算题:假设一个公司生产某种商品,生产成本与产量的关系为C(x)=3x^2-2x+5(单位:万元),其中x是产量(单位:千件)。市场售价与产量的关系为P(x)=50-0.5x(单位:万元/千件)。1.求该公司生产x千件商品时的总...……更多
OpenAI CEO罕见认错:DeepSeek是非常好的模型 将考虑跟进开源!
...式发布了o3-mini模型,这也是OpenAI推理系列中最新、最具成本效益的模型,并且已在ChatGPT和API中开放使用。据悉,该模型在数学代码等基准测试中刷新SOTA,相关测试中o3-mini(high)在准确率和校准误差(Calibration Error)均是最优...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...只是模仿系统 2 式的思考过程,那就需要远远更高的计算成本才能完成,同时响应速度也会大幅减慢。在研究这一难题时,田渊栋团队得到了一项惊人发现:在解决推理任务时,一种简单的数据方案就足以实现即时动态的系统 1 ...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...便宜,现在想体验更强大的推理能力则需要再付出几倍的成本。 嫌OpenAI o1太贵?那就自己做一个!近日,一篇利用纯提示方法让普通LLM变身成为OpenAI o1的文章在推特上爆火。开源代码:https://github.com/harishsg993010/LLM-Research-Scr……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...数学能力看,o1最强,其次是o1-mini,最后是o1-preview,从成本看,o1最高,其次是o1-preview,最便宜是o1-mini。o1擅长准确生成和调试复杂代码,o1-preview具有较强的推理能力和广阔的世界知识,o1-mini速度更快、比o1-preview便宜80%的推.……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻辑一致性和合理性。相比CoT将推理过程表示为线性序列,DoT更能捕捉人类推理的复杂性。相比引入...……更多
能看风水 夸我有情趣 Kimi现在都这么野了吗
...答案,但很快它就否定了自己。 继续把假币、找零还有成本利润这些复杂因素综合考虑进去,最后终于想明白老板亏了 80 元。( 正确答案是 80 元 )往上滑动查看更多这逻辑能力,确实有点强。包括我拿几道行测的类比推理题...……更多
本文转自:鲁中晨报专家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
...模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只有前代模型的一半,输出...……更多
openaio1系列模型开放访问权限
...限价格较高,其中o1的输入词元(tokens)费用为每百万个成本15美元(IT之家备注:当前约107元人民币),输出词元费用为每百万个60美元(当前约427元人民币),通过API调用时,o1模型每分钟最多可调用500次,o1-mini模型每分钟可...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...编程的更快、更便宜的推理模型。」整体来看,o1-mini 的成本比 o1-preview 低 80%。由于 o1 等大型语言模型是在大量文本数据集上预训练,虽然具有广泛世界知识,但对于实际应用来说,可能成本高昂且速度慢。相比之下,o1-mini 是...……更多
对标o1,Kimi放出了最能打的国产模型
...6 日交上又一份答卷:Kimi 的最新一代推理模型 k0-math,在数学能力已实现对标 OpenAI o1-mini 和 o1-preview。这是 Kimi 推出的首款推理能力强化模型,k0-math 同样采用了全新的强化学习和思维链推理技术,通过模拟人脑的思考和反思过...……更多
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时,Claude 现在终于补上了这一功能。在论文、书籍、报告或幻灯片中,我们有时需要插入数学公式或符号。其中使用 LaTeX 语言来生成数学公式或符号是主要方式之一,这...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...15美元,每100万输出tokens收费60美元。与GPT-4o 相比,输入成本是其3倍,输出成本是其4倍。 o1-mini则定位速度更快、成本效益更高,据称在数学和编程方面的表现也较为出色,在AIME和Codeforces等评估基准上几乎与o1性能相当,可作...……更多
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...计算获得广泛应用,它能够指导人们如何更有效率地部署成本高昂的量子纠错机制。学术界首次发现噪声造成量子优势突然消亡现象 概括而言,这项研究主要做出了以下贡献:成功刻画了逐渐增强的噪声影响量子优势的动态过...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...用,可能需要考虑不同的优化目标,例如智能体的性能、成本、延迟或安全性。评估函数定义如何评估候选智能体的这些指标。例如,为了评估智能体在未见过的数据上的表现,一种简单的方法是计算任务验证数据的准确率。该...……更多
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
...出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro-002 和 Gemini-1.5-Flash-002 最高降幅 50%,提高了两种模……更多
学而思推出数学答疑原生AI工具九章随时问,“AI将重新定义教育行业”
...,好未来官方公众号宣布,学而思九章大模型推出最新AI数学搜索答疑工具“九章随时问”,即日起免费开放使用。这款产品打破了以生成式AI技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解题思维...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...创作情况。介绍完功能特性,再来说说很多人关心的使用成本。 值得一提的是,与上代“大杯”模型Claude 3 Opus相比,这次的“中杯”Claude 3.5 Sonnet不仅研发成本低,其性能已是最强前辈的两倍。官方介绍,该模型每百万输入Toke...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...展1000倍必定是昂贵的,形象地解释,下一代数据中心的成本将超过一个小国的GDP。按照目前的发展速度,我们的硬件、成本、财力根本无法跟得上。GPU撞墙了圣克拉拉,英伟达总部所在地,不愿意让人知道的小秘密是—— GPU性...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...成的是易于理解的文本,这件事非常重要,尤其是在处理数学、编码这样的复杂任务时。如下图所示,你让 AI 写一个快速排序算法,AI 很快就写出来了,而且答案很简洁。但不会写代码的你要怎么判断 AI 写得对不对呢?OpenAI 在...……更多
...地了解大模型产品的性能和特点提供了参考样本。AI高考数学全不及格?换个打开方式试试近期,一则“AI高考测试出分,数学全不及格”的消息登上“热搜”。消息出自上海人工智能实验室旗下司南评测体系OpenCompass对7个开源...……更多
更多关于科技的资讯:
战略大单品—国缘四开
“国缘四开,销量第一”的广告在春节前的江苏、山东等地闪耀登场,高铁站、高速旁、城市楼宇、电梯内等不同的地方,“国缘四开
2025-02-09 22:31:00
零跑宣布已部署DeepSeek-R1大模型!全新座舱即将上线
快科技2月9日消息,零跑汽车于2月8日宣布,其小零GPT大模型已成功部署DeepSeek-R1大模型,并即将推出。DeepSeek-R1大模型的部署不仅将提升零跑汽车的内部IT团队运营效率
2025-02-09 16:46:00
深化合作,361度携手大润发共促冰雪运动发展
2025年2月9日,国内知名体育品牌361度与大润发在济南大润发历下店正式举行签约仪式,双方将进一步深化合作,共同推动冰雪运动的普及与发展
2025-02-09 17:00:00
奇瑞智能化模型深度接入DeepSeek:将应用于新车与机器人
快科技2月9日消息,奇瑞集团宣布已与人工智能公司DeepSeek深度技术融合,将其智能化大模型系统应用于雄狮智能座舱系统——Lion AI智舱大模型
2025-02-09 17:46:00
2月9日,记者从国网太原市滨河供电公司了解到,为提升电网末端智能化管理,该公司完成了优山美郡三期941户共1008台智能微型断路器安装调试工作
2025-02-09 18:06:00
空客推迟氢动力商用飞机研发计划:技术发展比目标落后5到10年
快科技2月9日消息,据报道,空中客车公司宣布,由于技术发展速度低于预期,该公司将推迟原定于本世纪30年代中期的氢动力商用飞机开发计划至下个十年中期
2025-02-09 18:16:00
本田中国品牌悄悄更名:烨P7改为本田P7
快科技2月9日消息,广汽本田烨P7车型预计今年上市,但最新宣传中已悄然去掉“烨”字。2月3日,广汽本田发布的立春海报中仅提及P7
2025-02-09 18:16:00
逛景区、赏民俗、品美食、看灯展……元宵节马上就要到了,为全力做好元宵节的通信保障,太原移动严格实行24小时不间断值守制度
2025-02-09 18:37:00
外星人Area-51台式机首发59999元:Ultra 9+RTX 4090D组合
快科技2月9日消息,戴尔推出新款外星人Area-51台式机,预售价59999元。据悉,这款台式机使用外星人“预言设计”全塔机箱
2025-02-09 19:16:00
RTX 5090/5080黑屏变砖!NVIDIA终于启动调查
快科技2月9日消息,RTX 5090(D)、RTX 5080上市之后,第一波冲上去入手的玩家,不少都经历了黑屏变砖的噩梦
2025-02-09 19:46:00
全国高铁的心脏!郑州东站变成了“郑妙东站”
快科技2月9日消息,作为中原地区最繁忙的超大高铁站,郑州东站日均开行800多趟列车,6小时内可直达全国128个城市,高峰时段有近2万人同时候车
2025-02-09 19:46:00
院士Shimon Ullman加入欧洲经济研究院
欢迎以色列科学院院士、美国艺术与科学院院士、国际认知科学学会会士、以色列魏茨曼科学研究所计算机科学教授、魏茨曼人工智能中心主任
2025-02-09 19:49:00
Arogyaswami Paulraj加入欧洲经济研究院
欢迎中国工程院院士、美国国家工程院院士、美国艺术与科学院院士、瑞典皇家工程科学院院士、世界科学院院士、斯坦福大学教授、无线通信技术专家
2025-02-09 19:50:00
Kia Nobre院士加入欧洲经济研究院
欢迎美国国家科学院院士、美国艺术与科学院院士、欧洲科学院院士、英国科学院院士、美国耶鲁大学心理学系教授、耶鲁大学吴仔研究所(WTI)副所长
2025-02-09 19:52:00
历史首次!俄宇航员在国际空间站硕士论文答辩
快科技2月9日消息,据报道,俄罗斯总统学院院长阿列克谢·科米萨罗夫在社交媒体上分享了一则令人瞩目的视频。视频中,俄罗斯宇航员伊万·瓦格纳于2月8日在遥远的国际空间站上成功完成了他的硕士论文答辩
2025-02-09 20:46:00