• 我的订阅
  • 头条热搜
...能提供学习知识新途径大语言模型对著名数学问题有“新见解”【总编辑圈点】科技日报北京12月14日电 (记者张梦然)“深度思维”团队利用大语言模型(LLM)对一个著名的数学问题提出了“新见解”,并通过系统的、迭代的...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...研究所的何杨辉教授和他的同事们想试试AI能否提出新的见解。于是,他们让AI神经网络在一个包含数百万条椭圆曲线的数据库中搜索曲线的某个特征,结果AI没有让人失望。在对其预测进行更详细的分析后,何杨辉和同事们发现...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
...表示,“希望这能够激发使用 FunSearch 的科学家的进一步见解,推动改进和发现的良性循环。”威斯康星大学麦迪逊分校的合作者和数学教授 Jordan Ellenberg 表示:“FunSearch 生成的解决方案在概念上比单纯的数字列表要丰富得多。...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...规模研究,为 LLM 在数学推理任务中的行为提供了重要的见解。 2、作者质疑了当前在 GSM8K 上报告的结果的可靠性,并证明 LLM 的性能在处理同一问题的不同表述时,其表现的波动性是不合理的。他们展示了所有模型在 GSM-Symbolic...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
...加快研究成果转化,培养“数学+”复合型人才 两大应用模型同日发布 本报讯 (记者 姜澎)上海张江再增一家新型研发机构。上海张江数学研究院日前正式成立,上海张江数学院同济大学分院和上海大学分院也同时成立。...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
...9哪个更大?一道小学生都会的数学题,却难倒了一众AI大模型。昨天,“大模型测不出9.11和9.9哪个大”还登上了微博热搜。这个难倒大多数AI大模型的数学题,其实来自于最近热播的《歌手》。7月13日,在最新一期《歌手》公布...……更多
...课堂上的精彩表现,并对还可以优化的环节发表了独到的见解,研讨气氛热烈,双方在思维碰撞、理念交流中相互学习、共同提升。 ……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
学而思推出数学答疑原生AI工具九章随时问,“AI将重新定义教育行业”
6月11日,好未来官方公众号宣布,学而思九章大模型推出最新AI数学搜索答疑工具“九章随时问”,即日起免费开放使用。这款产品打破了以生成式AI技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解...……更多
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
...,通过简单的命令来实现复杂的数学表达式。对于大语言模型来说,它们在解答一些数学相关的问题时有时也需要输出数学方程式或表达式。这时如果能够使用 LaTeX 输出标准的公式,答案自然会更加清晰明了。以大模型初创公...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
... cot 研究还不太成体系,我们觉得应该多给出一些基础的见解。”未来,课题组准备针对这个问题研究大模型的内部,即分析 LLM 推理的长推理步骤和短推理步骤、以及大模型内部的神经元过程。他们的终极目标是:希望可以确...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
...宗鹏接受凤凰网财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不会彻底摆脱幻觉和出错的问题,这是数学上已经...……更多
...谱。研究显示,百度贴吧“弱智吧”数据集训练出的AI大模型,跑分超过百科、知乎、豆瓣、小红书等平台,在问答、头脑风暴、分类、生成、总结等8项测试中取得了最高分。这个充满荒诞段子的中文社区,一跃成为最佳的中文...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
专家模型不要专家并行!微软开源MoE新路径
...日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了截然不同的训练方法...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一...……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理
...nguage Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信...……更多
o1带火的CoT到底行不行?新论文引发了论战
...任务,至于其它任务,CoT 的效果并不显著甚至可能有损模型性能。另一个发现是 CoT 能帮助提升执行计算和符号操作的执行步骤,但却比不上能使用外部工具的 LLM。这是什么意思呢?该团队发现,相比于使用直接回答方法,使...……更多
更多关于教育的资讯:
墨香沁冬至,玫瑰里书画美育公益市集暖人心
荆楚网(湖北日报网)讯(记者何鹏 通讯员蒋纯英)“冬至大如年,人间小团圆”。12月21日正值冬至,江汉二桥街道知音西苑社区联合玫瑰里携手湖北省书法家协会
2024-12-24 19:57:00
云南宣威这群孩子,坐着“空中校车”去上学
本文转自:人民网-云南频道550米,这是尼珠河大峡谷谷底到谷顶官寨小学的海拔落差;3小时,这是尼珠河峡谷的孩子们几十年来上学路上需要的时间
2024-12-24 20:38:00
本文转自:人民网人民网北京12月24日电 (记者孙博洋)记者从市场监管总局了解到,近日,市场监管总局公开发布标准物质研制生产和计量专业项目考核在线教育课程
2024-12-24 20:47:00
本文转自:人民网-广西频道近年来,广西水利电力职业技术学院积极响应国家号召,创新实施“四维法治驱动”战略,通过“高位引领筑基
2024-12-24 21:54:00
“生活·实践”教育实验学校授牌仪式在燕小教育集团顺利召开
12月19日至12月20日,济南市历下区燕山小学教育集团举办了“生活·实践”教育实验学校授牌仪式以及教研座谈活动,推动了“生活·实践”教育理念的深入实施
2024-12-24 22:01:00
家校携手 共战共赢 济南高新一实验九年级家委会成立
为进一步加强家校沟通,形成教育合力,助力学生科学备考,近日,济南高新区第一实验学校九年级启动了“级部家委会成立”仪式。学校副校长杜寿辉主持了此次会议
2024-12-24 22:06:00
本文转自:人民网-江西频道12月21日下午,由江西省教育厅主办、吉安职业技术学院承办的2024年江西省职业院校技能大赛(高职组)机电一体化技术赛项落幕
2024-12-24 17:57:00
南宁市云景路小学开展安全主题研学活动
本文转自:人民网-广西频道讲解员通过现场演示场景为孩子们演示讲解安全知识。余艳艳摄近日,南宁市云景路小学2022级善德中队师生到“国泰民安·壮小安应急安全科教中心”开展安全主题研学活动
2024-12-24 18:01:00
悦动成长·共绘童心梦——大渡口区钢城实验幼儿园开展“百千万”大渡教育行活动
为营造园家社同频共振的教育生态,向社会各界传导教育思想,汇报实践成效,12月以来,重庆市大渡口区钢城实验幼儿园(以下简称“钢城实验幼儿园”)围绕“悦”动童心
2024-12-24 18:04:00
佳绩频传!厦门南洋职业学院学子多项赛事获奖
本文转自:人民网近期,厦门南洋职业学院学生在“高校未来导游之星大赛”“福建省大学生男子排球赛”以及“第73届环球小姐中国区大赛福建赛区总决赛”中获得多项荣誉
2024-12-24 18:06:00
本文转自:人民网-广西频道为引导广大青年学生在实践中增进各民族交往交流交融,进一步铸牢中华民族共同体意识,今年以来,广西物流职业技术学院以大学生暑期“三下乡”社会实践活动为契机
2024-12-24 18:47:00
武汉一高校面向校友免费“开课”
荆楚网(湖北日报网)讯(记者唐天琪 通讯员周黎)“免学费,免住宿费,还给予免费创业扶持!”近日,记者从武昌理工学院获悉
2024-12-24 19:25:00
聚焦“玩创” 这场活动成就幼儿自主生长
荆楚网(湖北日报网)讯(记者许文秀 通讯员肖洁、夏青、翁艺萌)12月20日,武汉市整体推进学前教育高质量均衡发展武汉实践暨“办家门口优质幼儿园
2024-12-24 19:25:00
武汉文理学院召开课程思政专题会议
荆楚网(湖北日报网)讯(记者唐天琪 通讯员施慧丽)为贯彻落实《关于深化新时代学校思想政治理论课改革创新的若干意见》和《高等学校课程思政建设指导纲要》等文件要求
2024-12-24 19:25:00
“味”爱守护 军山中学食堂开放日获赞
荆楚网(湖北日报网)讯(记者林杉 通讯员张慧芳)12月20日,武汉经济技术开发区军山中学开展“‘味’爱同行 共护健康”食堂家校社共建活动
2024-12-24 19:25:00