• 我的订阅
  • 头条热搜
9.11和9.9哪个更大?一道小学生都会的数学题,却难倒了一众AI大模型。昨天,“大模型测不出9.11和9.9哪个大”还登上了微博热搜。这个难倒大多数AI大模型的数学题,其实来自于最近热播的《歌手》。7月13日,在最新一期《歌...……更多
大模型“翻车”小学题?
13.11和13.8谁大?——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高...……更多
学而思携九章大模型、学而思学习机亮相世界人工智能大会
...九章随时问”的拍题讲题能力。当用手机拍摄一道四年级数学题,它并不直接给出答案,而是分析了题目考察的知识点和形式,再引导用户进行一步步思考,在启发下自主解决问题。这一明显区别于拍题软件的讲解方式,让大家...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
...们这群核心成员里很多人都是理科生,有时候突然扔一个数学题到群里就开始一起解答”。这个诞生于PC贴吧时代的兴趣社区,在互联网浪潮中走过了20年。吧主公孙闬透露,创建人当年还是小学生,前些年去国外攻读博士了,...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...题解决。OpenAI 2021 年提出的 GSM8K(Grade School Math 8K)小学数学题数据集已成为评估 LLM 数学推理能力的流行基准。尽管它包含了详细的解决方案的简单数学问题,适合使用思维链(CoT)提示等技术,但它只提供了一个固定问题集...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...学辅导。图 | 赵子龙(来源:赵子龙)用大模型求解奥赛数学题本次课题最早可以追溯到 2023 年 2 月。当时,已经有一些研究团队开始使用大模型做逻辑推理和数学推理。赵子龙和合作者也认为这个方向很有前景。他表示让自己...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...qizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会...……更多
0.999……和1相等?长沙数学名师解读网络热议的小学数学题
...友热议截图。据媒体报道,近日,一位家长晒了一道小学数学题引发热议。这道题目就是问0.999……和1谁更大,不少家长肯定地为是“1大”,但有家长求助AI后得到的结果是“0.999……=1”,让大家大为惊讶,引发网络热议。潇...……更多
...年级教师要做好衔接,引导学生理解图形对解题的意义。数学题的特点是有许多相关的背景信息,要求学生寻找出有用的信息,对题目中已知条件进行分析,挖掘出已知条件背后的信息,教师在培养数形结合思想过程中,引导学生利用画...……更多
小升初衔接,数学该怎么学,命题在发生什么变化?杭州初中数学核心组推出公益大讲堂,满满都是干货
...再用数学语言把它表达出来。何老师还拿去年的一道中考数学题举例,题目是这样的——杭州奥体中心体育场又称“大莲花”,里面有80800个座位,数据80800用科学记数法如何表示。“大莲花是真实情境,很多孩子都去过。在真...……更多
小学数学题惊动了教育局 网友:我读第一遍竟然是懵的
...动了教育局,这件事在网上引发了很多网友的讨论。小学数学题惊动了教育局这个究竟是怎么一回事呢?原来武汉刘先生孙女今年上小学二年级,几天前刘先生在给孩子辅导数学作业的时候,看到了这样一道题:猫妈妈钓到一些...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...而在认知推理类的数据集上也存在着类似现象。面对一道数学题,假如要求大模型给出分步推理的“思维链”时,大模型往往会混淆不同单位的量,比如将时速和公里数相乘相加,这说明对于不同概念背后的物理意义,大模型存...……更多
...语言模型的短板,GPT-3.5发布后,也被指出过做不了简单数学题。记者在现场“调取”了一页数学题,要求“商量”解答其中一道“判断题:求商的近似值时,要保留三位小数,就要除到商的百分位。”“商量”给出的答案为:...……更多
“景润”浸心  “文笔”生辉
...题目堆中,晚上点着煤油灯演算习题。有一次,他被一道数学题难住,花了一个晚上的时间还是没能解答出来,想起陆宗授老师就住在附近,便去向他请教。“他这种钻研劲头十分难得,我喜欢这样的学生,他以后一定会有一番...……更多
...落实“双减”,要做好科学教育加法,这不是一道简单的数学题,而是教育观念的转变升级。数学教育与其他学科进行有机结合。我们可以通过跨学科的教学设计,让学生在数学课堂上应用和拓展其他学科的知识。例如,将数学...……更多
...的家访工作。全校老师点赞的家访系统灵感来自一道初中数学题“150组家庭地址,原本要一个下午的安排时间,这次几分钟就能出结果,分配也很科学,直接能给家访老师使用。”8月是云谷学校全员入户家访时期。此次家访,...……更多
全球第12!17岁中专女生击败一众名校大学生,闯入阿里数赛决赛
...的,对我的喜怒哀乐有很大的影响。我要是做不出来一道数学题,每当我躺在床上眼睛一闭的话,它就会在我脑子里反复地出现。然后我就百思不得其解,脑海中就会想这题的思路。然后第二天的话,如果还是没有解决的时候,...……更多
显卡为什么能提升游戏画质?
...心非常多。打个比方,CPU就像数学家,可以轻易解决高考数学题,但面对一大堆100以内的加减乘除,单靠一个数学家是做不过来的。显卡则像是一个小学学校,里面有成千上万个会“九九乘法表”的小学生,让他们做高考题肯定...……更多
对标o1,Kimi放出了最能打的国产模型
...的 o1 完全版的 94.8 分。而在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。常规模型的关键目标是尽快提供答案。与之不同,在做题过程中,k0-math...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...理科最好成绩还无法进入人类考生的前30%。针对大模型答数学题普遍“吃瘪”的问题,国内某头部大模型负责人就曾表示,大模型的指令遵循或者说推理能力通常是把一个指令背后的意思拆解出来,但数学题既包含规则性,又包...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...匹克(IMO)中的复杂几何问题。解答国际数学奥林匹克的数学题,需要强大的头脑创造力,而AI历来在解答此类问题中的表现不佳。但“阿尔法几何”经过针对性训练后,在逻辑检查系统的加持下,其几何学的解题表现几乎与最...……更多
...答得没有问题;还有人认为虽然是开放式题目,但既然是数学题,应该从数学的角度作答,老师扣分也无可厚非。具体怎么答题关键要看题目要求。若将该题目当作纯粹的数学应用题,那么就应按照数学的逻辑思维,规范题干表...……更多
“谁说大一不算一年级”,大学生涌入口算APP,小学生被虐哭了
...好了。而且各种各样的APP让小学生们像玩游戏一样去解决数学题真的是别有趣味,据说是某个口算的APP上面还有一个全国性质的排行榜。 只要你每天答题的正确率够高,速度够快,在PK中的获胜率越多,就可以在这个排行榜上...……更多
...了就需要放水。所以每年,三峡水库都会面临一道熟悉的数学题:一个泳池一边注水、一边放水,什么时候装满?这道数学题,听起来简单,但事实却远非如此。未来上游的降水多少?汇集的水量是多少?全流域各站点水位如何...……更多
搜题更精准、难题都有解 夸克“AI搜题”提升用户学习能力与效率
...脑”。在最新评测中,夸克 “灵知” 学习大模型在考研数学题上的正确率和得分率已经可以比肩OpenAI最新发布的o1模型,且远超国内其他模型。另外,在多个国内数学竞赛与高考等重要测试中,夸克的正确率和得分率也处于绝...……更多
姜萍进入决赛考场!竞赛组回应:难度相当于数学博士资格考试
...题,光读题理解题的意思估计就半个小时左右,解出一道数学题,可能会写满一页或者是二页纸才可能解完。虽然大家都没有参赛过,但可以想象这对于一个只有中专学历的17岁女孩子会是多难的一件事情。想到这里,笔者内心...……更多
33岁“北大韦神”春运回家!提大包小包如农民工,小动作引发热议
...他的童年记忆,不是与小伙伴的欢声笑语,而是与一道道数学题的较劲。这种孤独,或许正是天才的必经之路。时光跳转到小学时代,韦东奕已经将华罗庚的数学著作视为“复杂一点的数学而已”。这种轻描淡写的背后,是他对...……更多
84岁宜兴奶奶跟着视频做数学题
本文转自:扬子晚报84岁宜兴奶奶跟着视频做数学题听课记笔记,儿子称这是她的爱好和习惯扬子晚报讯(记者 王塞塞)“对这个式子进行分析,首先我们要保证它是一个整数,也就是说,所有跟根号相关的式子都要抵消掉…...……更多
学而思发布学习机新品xPad2 Pro系列,打造专业极致学习体验
...模型的“数学随时问”,可以实现对小学初中的任何一道数学题,80%实现即问即答,暂时不能回答的最快可在一小时内上传真人讲解、20分钟内生成AI视频解析。除此之外,还升级了基于大模型的指尖翻译、百科问答、口算练习...……更多
更多关于科技的资讯:
价格接近400万元!法拉利首款纯电动车将于今年秋季发布
快科技2月5日消息,日前,法拉利首席执行官在财务业绩发布会上证实,法拉利首款纯电动汽车将于今年秋季发布,具体日期或为10月9日
2025-02-05 16:42:00
告别黄牛!任天堂为Switch 2大量备货:信心满满保障需求
快科技2月5日消息,任天堂即将发布的Switch 2游戏机备受玩家期待,而任天堂也正在积极准备,以确保这款新游戏机不会重蹈初代Switch因缺货而被黄牛囤积炒卖的覆辙
2025-02-05 16:42:00
舒适防臭耐磨:三枪中筒男女运动商务袜5双到手14.9元
天猫三枪袜品旗舰店,三枪中筒男女运动商务袜5双当前售价24.9元,限时限量10元券,实付14.9元包邮。款式简约百搭,舒适防臭又耐磨
2025-02-05 16:42:00
无人机避障黑科技横空出世!时速73km 夜间也能跟踪目标
快科技2月5日消息,据媒体报道,近日,中国香港大学科技团队研发的无人机自主避障技术,吸引了众多无人机爱好者的目光。据介绍
2025-02-05 16:42:00
轴距加长赶上X5 新一代国产宝马X3配置曝光:选装很丰富
快科技2月5日消息,近日,新一代国产宝马X3的相关消息曝光,包括部分配置。据悉,新车将将于2月上市,一季度开启交付,共三款车型
2025-02-05 17:12:00
中国联通首条自由空间光承载业务顺利开通:无需物理介质 跨湖高速传输
快科技2月5日消息,中国联通官方介绍,中国联通研究院联合江苏联通、蓝星光域对研发设备成果进行了现场验收,现场部署环境是跨湖1
2025-02-05 17:12:00
天钡GT37迷你主机首发5299元:锐龙AI 9 HX 370旗舰芯
快科技2月5日消息,天钡推出了新款迷你主机——天钡GT37,首发5299元。新款迷你主机采用硬朗的电竞外观,左右侧有斜切的通风开口
2025-02-05 17:12:00
国产科幻大片《流浪地球3》下月开机:网友喊话求加入我国6代战机
快科技2月5日消息,据国内媒体报道称,国产科幻大片《流浪地球3》将会在下月开机,预计2027年春节上映(此前官方已经宣布2027年大年初一上映)
2025-02-05 17:12:00
创史高 春节充电量最多的三条高速公路出炉:京沪高速排第3
快科技2月5日消息,据国家电网智慧车联网平台的最新数据显示,2025年春节期间,我国新能源汽车在高速公路上的充电量实现了大幅增长
2025-02-05 17:12:00
国货爆款:颐莲玻尿补水喷雾30元速囤(必入)
颐莲玻尿酸喷雾300ml日常售价89元,今日百亿补贴万人团买一送一,到手价为60元2瓶。一喷瞬补水,时刻水润充盈。3大维度补水
2025-02-05 17:12:00
布鲁可携多IP系列产品亮相德国纽伦堡玩具展,持续推进全球化战略布局
随着中国春节的钟声敲响,全球玩具行业的的目光将再次聚焦于欧洲的"玩具都城"——德国纽伦堡市。1月28日至2月1日,这里举办被称为是"世界三大玩具展"之一的纽伦堡玩具展
2025-02-05 17:14:00
刷手机真的会让“大脑腐化”吗?牛津大学教授反驳称研究不支持
近日,英国《卫报》刊发文章——《刷手机真的会让“大脑腐化”吗?》,令人耳目一新:多位神经科学家、心理学家的研究和观点认为
2025-02-05 17:15:00
华为引望申请5D蟹行商标
华为引望申请华尔兹掉头商标天眼查知识产权信息显示,近日,深圳引望智能技术有限公司申请注册“5D蟹行”“华尔兹掉头”商标
2025-02-05 17:17:00
浙江在线2月5日讯(通讯员 王蓉) 近日,南京银行杭州分行在支付业务管理工作领域传来喜讯,凭借在支付结算、移动支付等多方面的卓越表现
2025-02-05 17:25:00
欧戈雅刘凡立:家居的另一种可能
莫尔说:“为了寻找想要的东西,我们走遍了全世界。回到家找到了”。家,是一个有温度的词语。一间房子,里面装满了爱,生活就有了意义
2025-02-05 17:34:00