• 我的订阅
  • 头条热搜
...能提供学习知识新途径大语言模型对著名数学问题有“新见解”【总编辑圈点】科技日报北京12月14日电 (记者张梦然)“深度思维”团队利用大语言模型(LLM)对一个著名的数学问题提出了“新见解”,并通过系统的、迭代的...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...研究所的何杨辉教授和他的同事们想试试AI能否提出新的见解。于是,他们让AI神经网络在一个包含数百万条椭圆曲线的数据库中搜索曲线的某个特征,结果AI没有让人失望。在对其预测进行更详细的分析后,何杨辉和同事们发现...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
...表示,“希望这能够激发使用 FunSearch 的科学家的进一步见解,推动改进和发现的良性循环。”威斯康星大学麦迪逊分校的合作者和数学教授 Jordan Ellenberg 表示:“FunSearch 生成的解决方案在概念上比单纯的数字列表要丰富得多。...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
...规模研究,为 LLM 在数学推理任务中的行为提供了重要的见解。 2、作者质疑了当前在 GSM8K 上报告的结果的可靠性,并证明 LLM 的性能在处理同一问题的不同表述时,其表现的波动性是不合理的。他们展示了所有模型在 GSM-Symbolic...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
...太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系...……更多
学而思正自研数学大模型MathGPT,由CTO田密负责
...5日消息,搜狐科技了解到,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级...……更多
过好“四关”数学轻松突破
...、基本概念、基本定理;“二批”就是把预习时的体会、见解以及自己暂时不能理解的内容,批注在书的空白地方;“三试”就是尝试性地做一些简单的练习,检验自己预习的效果;“四分”就是把自己预习的这节知识要点列出...……更多
...加快研究成果转化,培养“数学+”复合型人才 两大应用模型同日发布 本报讯 (记者 姜澎)上海张江再增一家新型研发机构。上海张江数学研究院日前正式成立,上海张江数学院同济大学分院和上海大学分院也同时成立。...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
随着语言模型的能力越来越强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多
...9哪个更大?一道小学生都会的数学题,却难倒了一众AI大模型。昨天,“大模型测不出9.11和9.9哪个大”还登上了微博热搜。这个难倒大多数AI大模型的数学题,其实来自于最近热播的《歌手》。7月13日,在最新一期《歌手》公布...……更多
...课堂上的精彩表现,并对还可以优化的环节发表了独到的见解,研讨气氛热烈,双方在思维碰撞、理念交流中相互学习、共同提升。 ……更多
微软推出14b参数“最先进”小型语言模型
...13日消息,微软今天宣布推出14B参数“最先进”小型语言模型(SLM)Phi-4,除了传统的语言处理外,它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员,官方表示其展示了微软继续探索SLM边界的可能性。官方...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
学而思推出数学答疑原生AI工具九章随时问,“AI将重新定义教育行业”
6月11日,好未来官方公众号宣布,学而思九章大模型推出最新AI数学搜索答疑工具“九章随时问”,即日起免费开放使用。这款产品打破了以生成式AI技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
今日值得关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基...……更多
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
...,通过简单的命令来实现复杂的数学表达式。对于大语言模型来说,它们在解答一些数学相关的问题时有时也需要输出数学方程式或表达式。这时如果能够使用 LaTeX 输出标准的公式,答案自然会更加清晰明了。以大模型初创公...……更多
...宁市教育科学研究院初中英语教研员尹山权有自己独到的见解:面对课程标准的变化,教师要转变教学观念,形成主体多元、方式多样、素养导向的英语课堂评价体系,做到“教-学-评”一体化;要明确如何以主题为引领选择和...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
... cot 研究还不太成体系,我们觉得应该多给出一些基础的见解。”未来,课题组准备针对这个问题研究大模型的内部,即分析 LLM 推理的长推理步骤和短推理步骤、以及大模型内部的神经元过程。他们的终极目标是:希望可以确...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
更多关于教育的资讯:
树人景瑞小学:弘扬中华优秀传统文化,讲好“大思政课”
为深化思政教育,全面展示学校大思政课和传统文化课程实施成效,2月28日,重庆市沙坪坝区树人景瑞小学校举行大思政·美育成果展暨课后服务(传统文化)课程展示活动
2025-03-02 14:06:00
自主选学,研修同行:重庆市教师自主选学试点区县项目在江津区教师进修学院开班
活动现场3月1日上午,“国培计划(2024)”——重庆市教师自主选学试点区县项目开班仪式在江津区教师进修学院举行。蔡增灏主持仪式 重庆市中小学教师发展中心
2025-03-02 14:06:00
从QS百强名校到裱花台:新时代人才发展的多元路径选择
本文转自:人民网-安徽频道近日,一位名叫范圣融的学生因其独特的求学经历引发了社会的广泛关注。范圣融毕业于世界百强名校英国格拉斯哥大学
2025-03-02 10:11:00
垫江县教育大会:增强信心,重点突破,奋力打造新时代渝东教育强县
大会现场为认真落实全国教育大会精神及全市教育大会部署,总结全县教育成绩,分析存在问题,安排打造新时代渝东教育强县重点工作
2025-03-01 11:50:00
大众报业·齐鲁壹点记者 巩悦悦 策划整理编者按:即日起,《青年说》栏目策划推出“乡村教育者手记”,为乡村校长和教师提供一个展示自我的平台
2025-03-01 20:20:00
聚焦课堂导入“黄金90秒” 高中新教师培训跨界秀创意
荆楚网(湖北日报网)讯(记者林杉 通讯员付雯静)“如何抓住课堂黄金90秒,点燃学生学习热情?”2月26日,江夏实验高中迎来2025年春季学期的第一期新教师研修会
2025-03-01 21:29:00
重庆:欢乐购物节 童趣满校园
本文转自:人民网2025年2月28日,重庆市北碚区锦林小学成功举办第三届欢乐购物节。活动中,同学们亲身体验学习备货、推销
2025-03-01 10:03:00
月背样品新发现,山东大学团队参与!
月背样品,又有新发现!2月28日,由国家航天局组织,中国地质科学院主导,澳大利亚科廷大学与山东大学合作完成的研究成果论文《月球背面玄武岩源区的同位素和成分限制》在国际科学期刊《科学》上发表
2025-03-01 12:19:00
山东又一所高校接入!“i石大”版满血DeepSeek正式上线
2月26日,中国石油大学(华东)宣布,属于石大人自己的“i石大”版满血DeepSeek大模型——AI智能助手正式上线。石大师生可通过学校微信企业号或直接点击PC端链接进入使用
2025-03-01 12:19:00
2000万次跳绳!济南高新区劝学里小学家校共育跨越成长每一步
你见过这样的寒假吗?1027名学生与家长挥动跳绳,2000万次跃动交织成海,这是济南高新区劝学里小学的特别“作业”,当体育跳出课间游戏的框架
2025-03-01 14:00:00
湖北:努力在教育强国建设中走在前列
本文转自:人民网-湖北频道近日,湖北召开全省教育大会,提出要锚定2035年建成教育强省目标,努力在教育强国建设中走在前列
2025-03-01 09:13:00
本文转自:人民日报海外版杜老师:在媒体中,我有时看见“主要成分”的说法,有时又看见别的媒体写作“主要成份”。请问“成分”跟“成份”
2025-03-01 04:27:00
宁德路小学—剪纸教联体微课堂 非遗焕彩润童心
大众网 青岛报道灵蛇起舞迎新季 少年筑梦启华章,青岛市政协委员、九三学社青岛大学委员会科普专家王风华教授来到青岛宁德路小学二(2)中队
2025-02-28 18:01:00
寒假回母校,1526名大学生将山财大故事传遍五湖四海
2025年寒假,山东财经大学教务处招生办公室、校团委联合组织发起“启航财大·感恩起点”寒假回访高中活动。417支队伍,1526名学生
2025-02-28 18:58:00
山一大化学与制药工程学院:健步走校园,共话新发展
为了营造团结奋进、砥砺前行的团队氛围,引领广大职工在推动新时代学院高质量发展中做出更大贡献,2025年2月28日下午,山一大化学与制药工程学院分工会组织的“健步走校园
2025-02-28 19:01:00