• 我的订阅
  • 头条热搜
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...平的推理能力,提升了行业的标准。不过也有人表示经过实测可见,它仍然具有 Transformer 架构的局限性。对此,图灵奖获得者 Yann LeCun 表示,问题不在于 Transformer,而是因为 Claude 3.5 仍然是一个自回归大模型。无论架构细节如...……更多
智谱AI视频大模型上线排队30秒生成6秒视频 记者现场实测
...型清影(Ying)正式上线智谱清言,新京报贝壳财经记者实测了清影的视频生成能力,并现场采访了张鹏。记者实测:等待时间在1分钟以内 视频可选择4种风格张鹏“官宣”清影发布后,新京报贝壳财经记者登录智谱清言首页发...……更多
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
最强数学大模型,现在易主!阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
本文转自:重庆日报“未来,金融和汽车将是大模型最早使用的两大场景。作为汽车制造重镇的重庆,在大模型发展方面极具潜力”“重庆拥有大量的应用场景以及工业大数据资源,为大模型的应用提供了丰富的数据基础”“...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...iddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-preview(85.5%)。除此之外,在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人员的反馈,这两个...……更多
初中数学压轴题突破 几何综合大题 中点模型(一)
中点模型问题是什么?中点问题是初中平面几何当中非常重要的一类问题。当我们面对两个中点时,会很自然地联想到中位线。而当我们面对一个中点时,可以联想到直角三角形的斜边中线(当然,前提条件是存在直角三角形...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
近日,OpenAI用一场26分钟的线上直播展示了GPT-4o带来的惊艳交互能力,将新一轮AI争霸带入了“Her 时代”。GPT-4o的“o”代表“omni”,一词意为“全能”,该模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,...……更多
...一。要想用好数学这个工具,就要对问题加以分类,建立模型。其实我们的课本设计的思路大致如此,只是有些教师在实际教学过程中往往把这些割裂开来,把知识点搞得杂乱无序,学生无法形成有效的知识体系。“授之以鱼,...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...nguage Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
第一波大模型已经走进厨房了!实测方太Healthy CookingGPT
...环,不得不说非常令人期待了~ 量子位率先开展了第一波实测,来看看方太是如何实现的?第一波AI健康烹饪系统走进中国厨房此次Healthy CookingGPT发布,大体可以总结出三个特点。首先,聚焦于健康的需求。它能根据每个人的身...……更多
用进球数判断比赛走势?一个公式就能轻松解决
...偶然性,统计数据采用了泊松分布作为大小盘投注的预测模型。著名学者约翰·黑格在他所著的《Taking Chances》(中译名“机会的数学原理”)一书中创建了一个表格,根据某一球队每场平均进球数计算其打进0、1、2、3、4及更多...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
曝Bengio新动向:世界模型+数学证明,确保AI系统正常运作
...学总监。据介绍,Safeguarded AI旨在:通过结合科学的世界模型和数学证明,构建一个负责理解和降低其它AI Agent风险的AI系统。主打的就是一个量化安全保障。该项目由英国高级研究与发明局(ARIA)提供支持,据说未来ARIA将投入...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多
扩散模型=进化算法!生物学大佬用数学揭示本质
【新智元导读】扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。扩散模型居然就是生物的进化算法!这个结论来自「新常春藤」塔夫茨大学(Tufts University)于...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...力”的内涵已经进化到了“AI算力”。阿里云并没有让大模型成为2023年云栖大会的主角,不过,大模型却又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里...……更多
对标OpenAI o1!Kimi发布新一代推理模型:中考高考考研全第一
...息,日前,国内人工智能公司月之暗面推出的Kimi国产大模型正式发布k0-math。k0-math是Kimi推出的首款推理能力强化模型,采用全新强化学习和思维链推理技术,通过模拟人脑的思考和反思过程,大幅提升解决数学难题的能力。据...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
今日值得关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模...……更多
...实落地,发挥名师的引领和辐射作用。近日,淄博市小学数学名师课堂活动在淄博经开区傅家镇中心小学举行,由数学学科基地负责人赵淑玮老师执教《小数乘整数》一课,既展示了经开区小学数学对大单元教学的研究成果,又...……更多
专家模型不要专家并行!微软开源MoE新路径
...日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了截然不同的训练方法...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
晓院顶山实小数学作业重实践
...自:南京晨报知行合一,“量”由“感”生晓院顶山实小数学作业重实践晨报讯(通讯员 吴红宇 南京晨报/爱南京记者 刘彩云)《数学课程标准(2022版)》新增了“量感”这一核心素养,量感主要是指对事物的可测量属性及大...……更多
vivo蓝心小v是如何实测的?
...贴等操作,效率提升明显。 文字识别可能不算难事,在实测中,我发现蓝心小V还能读懂图片里的内容,比如直接让它查找海边的照片、吃火锅的照片,当然,就算增加一些更复杂的条件,比如“找出国庆节的大餐”、“去年三...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解...……更多
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo底座能力再次迎来全新升级,图文、数学和长文本能力...……更多
更多关于科技的资讯:
近日,上城区发布第四批“人工智能+”机会场景清单,25个场景聚焦产业升级、金融服务、智慧教育、智能医疗等重点领域。据悉
2025-12-13 08:06:00
“甩一甩”就能测温的水银体温计,即将在2026年1月1日全面禁产的政策下退出历史舞台。这则消息引发的全网热议,恰是怀旧情感与环保理性
2025-12-13 08:16:00
厦门网讯(厦门日报记者 应洁)昨日,“新质设计——红点产品设计大奖·中国获奖作品精选展”在红点厦门设计博物馆开展,来自70多家中国企业的百余件“红点奖”获奖作品呈现出国际一流设计的“中国力量”
2025-12-13 08:39:00
第六届中国人工智能大赛配套论坛在厦成功举办
厦门网讯(厦门日报记者 翁华鸿 通讯员 张晶晶 王艳红)12日,第六届中国人工智能大赛配套论坛在厦门成功举办。论坛以“融新汇智
2025-12-13 08:39:00
中新经纬12月13日电 据“网信中国”微信号13日消息,2025年12月2日,中央网信办提出并归口的《数据安全技术 电子产品信息清除技术要求》强制性国家标准由国家市场监督管理总局
2025-12-13 10:42:00
中国科大利用磁力系统实现宽带磁声混合频率梳
大皖新闻讯 12月13日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在磁力系统研究中取得新进展。该团队董春华教授研究组通过磁振子与高频声子相互作用
2025-12-13 14:35:00
京东宠物百千万爆品计划启动:联合pidan打造确定性产品 单款猫砂月销1500万
猫砂是猫用品购买频率最高的产品,其潜力被外界看好。不过,因行业门槛低,这两年入局者多、竞争加剧,猫砂利润像纸一样薄,最低仅1%
2025-12-13 14:56:00
2025年“福满榕城 奋勇争先”短视频征集展播——《项目审批专班:“五项机制”激活发展新效能》。
2025-12-13 15:03:00
沁珠宝的2025年:文化赋能,匠心质造,新中式珠宝坚定前行
2025年,是新中式珠宝赛道蓬勃发展的一年,也是沁珠宝以文化为帆、品质为桨,实现跨越式发展的关键之年。在刚刚过去的2025年11月
2025-12-13 16:41:00
鲸鸿动能系列营销案例正式入库复旦管院案例中心,开启产学融合新路径
2025年12月10日,由复旦大学管理学院与鲸鸿动能联合举办的“技术驱动的商业创新:从生态支撑到全球竞逐”主题的案例课堂暨鲸鸿动能案例入库仪式
2025-12-13 16:42:00
硬核突破!全球领先脑肿瘤放疗设备将在廊坊临空实现“中国制造、全球交付”
河北新闻网讯(刘英、刘岩)12月6日,百洋医药高端制造产业化基地在临空经济区(廊坊)高端智能制造港正式启用投产,将承担全球领先脑肿瘤精准放疗设备ZAP-X火星舟放射外科机器人的生产供应任务
2025-12-13 17:52:00
开栏语 深圳,一座将创新刻入基因的城市。无数海归人才,正是这基因中最活跃的段落。作为改革开放的窗口与先锋,她以澎湃的活力与无限的机遇
2025-12-14 11:22:00
日前,第七届浙江国际智慧交通产业博览会在杭州盛大开幕。开幕式上,多项重磅政策与创新成果集中亮相,省交通运输厅、省科技厅共同发布《交通科技创新合作协议》
2025-12-14 11:39:00
海辰储能第三届生态日 发布长时储能与AIDC最新成果
当前,长时储能技术已成为破解新能源波动性难题、打造全天候绿电系统的核心支撑,而AIDC等高能耗行业也亟需依托长时储能的优势破解能源困局
2025-12-14 12:45:00