• 我的订阅
  • 头条热搜
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
OpenAI的“草莓”终于来了。当地时间9月12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
... OpenAI 在大语言模型领域的新尝试,也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看,相比以往的 GPT 模型,「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力,使其成为通用人...……更多
对着3个中国AI大模型,两个美国科技界大佬深聊了半小时
...前AI行业快速发展,竞争也越来越激烈,特别是各种高级推理模型之间的竞争。过去一段时间,中国科技公司陆续发布了3款自研的AI模型,分别是DeepSeek(深度求索)的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
超强AI来袭!OpenAI最新AI模型 “草莓”即将上线,推理能力惊艳
...但其实这个模型的能力可不容小觑,它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道,“草莓” 模型将视为一种推理模型,这意味着它能够处理一些需要多步骤来完成的请求,比如解答难度较大的代数题,...……更多
消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推理
...于之前的预期。根据之前的报道,“草莓”是一款专注于推理的AI产品,预计于今秋发布。但这两位测试过该模型的人士称,OpenAI计划在未来两周内发布“草莓”。当然,最终的日期也可能生变。需要指出的是,虽然“草莓”是C...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...级智能的关键一步。它被指具有这些特性,比如在数学和推理能力方面有很大的提升,突破了人类数据的限制,可以自己生产巨量训练数据,有自主学习和自我改进的能力等等。在草莓项目正式被曝光的前几天,OpenAI科学家Noam B...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
ChatGPT 革新,消息称 OpenAI“草莓”大模型两周内发布
...tion 今日报道称,OpenAI 计划在接下来的两周内推出专注于推理的 AI 大模型“草莓(原 Q* 项目)”并将其应用到 ChatGPT 服务中,比传闻中的“秋季发布”(IT之家注:指 9 至 11 月)更早。作为以推理为卖点的大模型,“草莓”在...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...力和机器人硬件会如何平衡,从广告噱头到量产应用还有多远?人形机器人百家争鸣的春秋时代已拉开序幕。李志飞,出门问问创始人兼CEO,美国约翰霍普金斯大学计算机系博士,自然语言处理及人工智能专家,前Google总部科学...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示,在比较13.11%和13.8%时,13.11%是更大的数值。这是因为当比较两个百分数时,我们首先比较整数部分,如果它们相同,则比较小数...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...本质的不同。其不仅进入到复杂的领域,还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率...……更多
OpenAI升级o3-mini模型思维链:提升AI推理过程透明度
...更新o3-mini-high的思维链,更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。OpenAI在去年12月发布了推理模型o3,该系列包含两个模型,即o3和o3-mini,前者是高性能推理模型,后者是更小的精简版模型,在保持智能...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出,数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
更多关于财经的资讯:
中建四局一体化推进节前防“四风”工作
为进一步严明中秋、国庆假期的政治纪律和政治规矩,持续正风肃纪、净化节日风气。秉承“节点”亦是“考点”,中建四局建设投资公司上海分公司全面推进双节防“四风”工作
2025-09-30 13:08:00
光大银行苏州分行投顾摘得“万得星选”理财师大赛全国卓越投顾奖
近日,2025年Wind星选理财师大赛圆满落幕。中国光大银行苏州分行投资顾问胡净雪历经模拟盘投资、案例制作及主题演讲多轮激烈角逐
2025-09-30 13:09:00
保障金融权益 助力美好生活—中国民生银行毕节二级分行开展金融教育宣传周活动
??????为切实履行社会责任,提升公众金融素养,中国民生银行毕节二级分行以构建金融知识教育宣传长效机制为目标,结合总分行和监管部门工作要求
2025-09-30 13:10:00
“邻里团圆宴 月下共此时” 绿城服务四川地区举办千人家宴 共庆中秋佳节
秋意渐浓,桂香浮动,又是一年中秋将至。不同于往常的简单庆祝,今年绿城服务四川公司全面开启“团圆邻里,情满中秋”为主题,于9月20日-9月30日期间隆重举办了12场融合传统与现代
2025-09-30 13:38:00
服务属地发展!中建筑港印尼宾坦南山工业园7万吨码头工程正式投入使用
9月25日,中建港航局承建的印尼宾坦南山工业园7万吨码头工程完成验收并投入使用。据悉,该项目以7万吨码头建设为主,包含房建
2025-09-30 13:08:00
榜样就在身边,世茂服务用“学长学姐说”点亮开学季
开学的清晨,社区内的活动室里,却传来阵阵掌声。几位刚刚迈入大学校门的学长学姐,正与邻里孩子面对面分享学习经验与成长故事
2025-09-30 10:37:00
上海闵行虹桥商务区新地标即将竣备
据最新消息,前湾印象城 MEGA 目前正处于最后的冲刺收尾阶段,幕墙、园林及精装修工程均已接近完工。多项专项验收已初步通过
2025-09-30 10:37:00
中建四局建设投资公司举办精诚筑梦,谁”羽“争锋 迎国庆中秋“精诚杯“羽毛球赛
为积极响应国家“体重管理年”行动号召,深入贯彻《全民健身计划纲要》,大力倡导“健康生活、快乐工作”理念,营造积极向上、活力迸发的运动氛围
2025-09-30 10:37:00
中建四局建设投资公司开展“精诚益行”志愿助学活动
近日,中建四局建设投资公司携手莘庄镇团委共同开展了困境青少年慰问活动。此次活动中,他们深入莘庄镇,走访了3户困境青少年家庭
2025-09-30 10:37:00
中银保险上海闵行支公司因编制虚假资料被罚14万元
9月30日,国家金融监督管理总局上海监管局行政处罚信息公开表显示,中银保险有限公司上海市闵行支公司因编制虚假资料被罚款14万元,责任人尤某被警告并罚款2万元。
2025-09-30 10:38:00
阿里巴巴AI动漫创作工具ANIMODE商标获批
近日,阿里巴巴(中国)有限公司“ANIMODE”商标注册成功,国际分类为教育娱乐。据了解,Animode是阿里巴巴推出的AI动漫视频创作工具,上传图片、视频等素材,用户可以将现实
2025-09-30 10:48:00
中信银行长春中海支行开展“光影定格美好 金融守护幸福”主题活动
为进一步提升客户服务体验,强化金融知识普及力度,中信银行长春中海支行于9月23日在长春医学高等专科学校开展“光影定格美好 金融守护幸福”主题活动
2025-09-30 10:50:00
建行烟台分行四级联动 走进企业宣导汇率避险策略
胶东在线9月26日讯(通讯员 周鹏杰)9月19日,建行总行、省行、市行、支行四级联动,深入走访烟台两家重点客户,与企业就近期外汇走势和汇率避险产品进行沟通交流
2025-09-30 07:13:00
中广核风电在云南成立新能源公司,注册资本1亿元
近日,中广核云南新能源有限公司成立,法定代表人为普智勇,注册资本为1亿元,经营范围包含:发电业务、输电业务、供(配)电业务;风力发电技术服务;太阳能发电技术服务;节能管理服务等。
2025-09-29 15:00:00
诚迈科技新设数科技术公司,含多项物联网业务
近日,诚迈数科(江西)技术有限公司成立,法定代表人为谢良辉,注册资本为1000万元,经营范围包含:人工智能应用软件开发
2025-09-29 15:00:00