• 我的订阅
  • 头条热搜
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...学辅导。图 | 赵子龙(来源:赵子龙)用大模型求解奥赛数学题本次课题最早可以追溯到 2023 年 2 月。当时,已经有一些研究团队开始使用大模型做逻辑推理和数学推理。赵子龙和合作者也认为这个方向很有前景。他表示让自己...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...匹克(IMO)中的复杂几何问题。解答国际数学奥林匹克的数学题,需要强大的头脑创造力,而AI历来在解答此类问题中的表现不佳。但“阿尔法几何”经过针对性训练后,在逻辑检查系统的加持下,其几何学的解题表现几乎与最...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...题解决。OpenAI 2021 年提出的 GSM8K(Grade School Math 8K)小学数学题数据集已成为评估 LLM 数学推理能力的流行基准。尽管它包含了详细的解决方案的简单数学问题,适合使用思维链(CoT)提示等技术,但它只提供了一个固定问题集...……更多
学而思携九章大模型、学而思学习机亮相世界人工智能大会
...九章随时问”的拍题讲题能力。当用手机拍摄一道四年级数学题,它并不直接给出答案,而是分析了题目考察的知识点和形式,再引导用户进行一步步思考,在启发下自主解决问题。这一明显区别于拍题软件的讲解方式,让大家...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
大模型“翻车”小学题?
13.11和13.8谁大?——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高...……更多
小学数学题惊动了教育局 网友:我读第一遍竟然是懵的
...动了教育局,这件事在网上引发了很多网友的讨论。小学数学题惊动了教育局这个究竟是怎么一回事呢?原来武汉刘先生孙女今年上小学二年级,几天前刘先生在给孩子辅导数学作业的时候,看到了这样一道题:猫妈妈钓到一些...……更多
8岁掌握微积分,12岁自学函数论,冯·诺依曼的传奇故事
...个庞然大物拆开来重新布线。这就像是咱们拿着计算器做数学题,每解一个问题都要把计算机拆开来每根电线、每个螺丝重新组装一遍,换谁谁不emo?靠计算机运算节省下来的时间,全都在组装过程中还回去了。 就在美国军方...……更多
韦东奕事件真相揭秘:北大数学天才被解雇?还是继续发光发热?
...有着浓厚的兴趣和天赋。他在小学时就能轻松地解决高中数学题,他在初中时就能独立地研究大学数学课本。他曾经参加过多次国内外的数学竞赛,并获得了优异的成绩。其中最令人印象深刻的是,他在2009年参加了国际数学奥...……更多
...张纸,杨乐尽情徜徉在数学世界之中。中学期间做了多少数学题?他没有专门统计过,“但肯定过万了”。1956年,杨乐考入北京大学数学力学系,平均每天学习12个小时。6年后,他进入中国科学院数学研究所读研究生,在熊庆...……更多
学而思发布学习机新品xPad2 Pro系列,打造专业极致学习体验
...模型的“数学随时问”,可以实现对小学初中的任何一道数学题,80%实现即问即答,暂时不能回答的最快可在一小时内上传真人讲解、20分钟内生成AI视频解析。除此之外,还升级了基于大模型的指尖翻译、百科问答、口算练习...……更多
...,Q*除了能合成数据,更本质的,可能是对一些有难度的数学题、逻辑题做了重新采集、标注。或在之前基础上,或没有用transformer方式,而是直接输入所有东西再输出,且加了一个值的评估。他认为,基于类似某种价值评估和...……更多
理想同学APP实测:真能帮奶爸辅导作业了
...地都能辅导孩子写作业了。首先来个简单的,小学三年级数学题:非常easy的搞定了:然后加大难度,上个高中经典的传送带问题:很遗憾,识别不准确,没能得出正确答案: 对于更复杂的高等数学曲面积分问题:能给出解题思...……更多
董宇辉可不能砸了老东家的招牌
人逼急了什么都能做出来,除了数学题,数学题不会就是不会。这两天,斯基经常能刷到“国民女婿”董宇辉的一条直播切片视频。镜头前的董老板像往常一样侃侃而谈,创造性编修了多个自然科学和历史知识点,包括但不限...……更多
《从小就做数学高手》:把数学融入职业中,原来数学启蒙这么简单
...思维能力,抽象思维能力太差的人,是不可能学好复杂的数学题的。所以,想要孩子学好数学,就得有意识地培养孩子这两方面的能力。很多人都意识到了这一点,所以如今市面上已经有越来越多寓教于乐的书籍供大家选择,想...……更多
拿明星开玩笑,郝蕾表演课300一节,网友要给杨幂赵丽颖报名
...百块一节的数学辅导,真的让人觉得有点肉疼。今年高考数学题一出炉,想必不少学生心里都有数了,就算上再多的数学辅导课,最后那道大题还是无从下手,毕竟,有些知识不是靠辅导就能轻松掌握的。 看到吴谨言也加入了...……更多
9.11和9.9哪个更大?一道小学生都会的数学题,却难倒了一众AI大模型。昨天,“大模型测不出9.11和9.9哪个大”还登上了微博热搜。这个难倒大多数AI大模型的数学题,其实来自于最近热播的《歌手》。7月13日,在最新一期《歌...……更多
2024年或成国产大模型应用爆发年 “有道子曰”率先出牌
...小P老师解答多学科题目的过程:例如,当孩子问小P老师数学题时,他不会直接给出答案,而是先给出方程式的解法;如果孩子反馈没学过方程式,他还会更换不同的方式讲解,确保“有问必答”;同时,小P老师还支持“举一反...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
国产o1新选手登场!它能快速解决更复杂的数学解题、代码编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程...……更多
退休教师给外孙女辅导作业被百万网友“蹭课”,网友:姥爷每次都能教会我
...40年教龄的退休教师,近两年来他给外孙女“正好”辅导数学题的视频,引来上百万网友蹭课,表示需要“同款姥爷”,还有家长在评论区表示“听了姥爷的讲解终于知道怎么给孩子辅导了”。田雷发布的视频中,一块小黑板,...……更多
搜题更精准、难题都有解 夸克“AI搜题”提升用户学习能力与效率
...脑”。在最新评测中,夸克 “灵知” 学习大模型在考研数学题上的正确率和得分率已经可以比肩OpenAI最新发布的o1模型,且远超国内其他模型。另外,在多个国内数学竞赛与高考等重要测试中,夸克的正确率和得分率也处于绝...……更多
“景润”浸心  “文笔”生辉
...题目堆中,晚上点着煤油灯演算习题。有一次,他被一道数学题难住,花了一个晚上的时间还是没能解答出来,想起陆宗授老师就住在附近,便去向他请教。“他这种钻研劲头十分难得,我喜欢这样的学生,他以后一定会有一番...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...qizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会...……更多
保送北大的学霸成了竞赛教练
...在数学竞赛中取得好成绩。“我很热爱数学,也很享受解数学题的感觉,如果能把这些经验和方法传递出去,这是一件很有成就感的事情。”李忠羿说,经开外校给了他担任竞赛教练的机会,让他有更多的空间发挥自己的才能。...……更多
对标o1,Kimi放出了最能打的国产模型
...的 o1 完全版的 94.8 分。而在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。常规模型的关键目标是尽快提供答案。与之不同,在做题过程中,k0-math...……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...理科最好成绩还无法进入人类考生的前30%。针对大模型答数学题普遍“吃瘪”的问题,国内某头部大模型负责人就曾表示,大模型的指令遵循或者说推理能力通常是把一个指令背后的意思拆解出来,但数学题既包含规则性,又包...……更多
...语言模型的短板,GPT-3.5发布后,也被指出过做不了简单数学题。记者在现场“调取”了一页数学题,要求“商量”解答其中一道“判断题:求商的近似值时,要保留三位小数,就要除到商的百分位。”“商量”给出的答案为:...……更多
能陪伴作业还能识别情绪,学而思学习机“小思伴学”全新升级
...思”,比如不认识的字和单词,小思可以给出提示,如果数学题不会,小思会给出思路引导并进行主动提问,帮助孩子解决问题。听写背诵、口算批改等原本需要家长参与的任务,小思也可以轻松完成。小思作业模式学习机端界...……更多
吴谨言学习郝蕾表演课引热议,杨幂赵丽颖粉丝内卷升级
...宜呢。不过,数学课再贵也无济于事,有些学生面对高考数学题依旧束手无策。 看到吴谨言也在学习郝蕾的表演课,网友们纷纷“出幺蛾子”,有的建议杨幂报名郝蕾的课程,还有的说赵丽颖也该去学学。这种起哄架秧子的现...……更多
...,数学本应是最考验思维能力的学科,但从小学到大学,数学题一般都设了标准答案。 ▼下转第二版(上接第一版)甚至有的学校要求学生反复操练,将每个类型的题目内化为“肌肉记忆”,根本不需要思考、质疑。张逸中也...……更多
更多关于科技的资讯:
宁波市消保委发布“大路灯”比较试验结果:“适璞”落地灯电气安全项目不符合要求
中国消费者报杭州讯(记者郑铁峰)“最接近日光的照明体验”“让孩子的用眼环境更加舒适”……近年来,作为新兴的护眼灯具产品
2025-02-18 11:13:00
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
2月18日,昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法SkyReels-A1
2025-02-18 11:13:00
橘子冒烟小心肺部真菌感染:大量孢子形成烟雾
快科技2月18日消息,按压橘子冒烟是咋回事?据报道,这通常是因为霉菌繁殖产生的孢子扩散。霉菌成熟后会产生大量孢子,当微小的孢子在空气中扩散时
2025-02-18 11:25:00
路遇限宽墩司机不敢开:打开智驾寻求最强外援
快科技2月18日消息,日常生活中我们开车时可能会遇到限宽墩,每当这个时候,不少新手司机都觉得眼前一黑,不敢通过。而当前新能源汽车越发加宽
2025-02-18 11:25:00
“两新”政策赋能,太原电子产品市场“热”力全开
消费日报网讯(记者 刘自昌)2025年,作为 “十四五” 规划收官与 “十五五” 规划谋划的承上启下之年,意义非凡。在这一关键节点
2025-02-18 11:32:00
30家轻工企业入选工信部实数融合典型案例
本报讯 近日,工业和信息化部公布了2024年实数融合典型案例名单,235个案例上榜。轻工行业“成绩单”亮眼,共有30家企业榜上有名
2025-02-18 11:32:00
漫评丨这些机器人企业“代言”苏州新质生产力
□秦柳青在今年总台央视春晚上,人形机器人的“赛博秧歌”实力出圈了。在苏州,人形机器人不仅能“炒菜浇花”,还能“进厂打工”
2025-02-18 11:36:00
联通数科墨攻安全运营服务平台,护航亚冬安全,彰显卓越实力
2025年2月7-14日,第九届亚洲冬季运动会在哈尔滨隆重举办,这场冰雪盛会吸引了全球目光。作为本届亚冬会的官方通信及云服务合作伙伴
2025-02-18 11:45:00
小米青年公寓内部实拍首曝!减轻北漂毕业生租房贵压力
快科技2月18日消息,日前,小米市场部管培生赵长琳(抖音、小红书昵称“二赵上道”)全网首发分享了位于北京昌平的小米青年公寓内部实拍视频
2025-02-18 11:55:00
本田:若日产社长辞职 我们愿意重启合并谈判
快科技2月18日消息,据知情人士透露,如果日产汽车公司社长内田诚卸任,本田愿意重启收购谈判,以创建世界第四大汽车生产商
2025-02-18 11:55:00
深圳70名AI公务员上岗引热议 AI能取代公务员吗:DeepSeek是这么回答的
快科技2月28日消息,日前,#深圳70名AI公务员上岗# 的话题登上热搜,引发网友关注。据报道,近日,广东深圳福田区推出了基于DeepSeek开发的AI数智员工
2025-02-18 11:55:00
两女子骑电动车走机动车道并闯红灯:被撞翻还需负全责
快科技2月18日消息,行人闯红灯被车撞,该怎么判罚?也许这个案例可以全国推广。据“公安部交通管理局”最新披露的案例显示
2025-02-18 11:55:00
全社会都能共享数据!国家公共数据资源登记平台将于3月上线
快科技2月18日消息,据央视报道,今天,国家数据局举行新闻发布会,介绍公共数据开发利用最新情况。相关负责人介绍,国家公共数据资源登记平台将于3月1日上线试运行
2025-02-18 11:55:00
SSD直奔PB时代!闪迪已在路线图中列出
快科技2月18日消息,在近日的投资者日活动上,闪迪宣布了其开发容量高达PB级固态硬盘的计划,不过遗憾的是路线图中并未公布具体的时间
2025-02-18 11:55:00
学而思今天正式发布接入DeepSeek的全新“随时问”APP
学而思今天正式发布接入DeepSeek的全新“随时问”APP。该产品深度融合DeepSeek R1智能推理,依托学而思22年教研沉淀
2025-02-18 12:01:00