• 我的订阅
  • 头条热搜
...能提供学习知识新途径大语言模型对著名数学问题有“新见解”【总编辑圈点】科技日报北京12月14日电 (记者张梦然)“深度思维”团队利用大语言模型(LLM)对一个著名的数学问题提出了“新见解”,并通过系统的、迭代的...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...研究所的何杨辉教授和他的同事们想试试AI能否提出新的见解。于是,他们让AI神经网络在一个包含数百万条椭圆曲线的数据库中搜索曲线的某个特征,结果AI没有让人失望。在对其预测进行更详细的分析后,何杨辉和同事们发现...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
...表示,“希望这能够激发使用 FunSearch 的科学家的进一步见解,推动改进和发现的良性循环。”威斯康星大学麦迪逊分校的合作者和数学教授 Jordan Ellenberg 表示:“FunSearch 生成的解决方案在概念上比单纯的数字列表要丰富得多。...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
...太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系...……更多
学而思正自研数学大模型MathGPT,由CTO田密负责
...5日消息,搜狐科技了解到,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级...……更多
过好“四关”数学轻松突破
...、基本概念、基本定理;“二批”就是把预习时的体会、见解以及自己暂时不能理解的内容,批注在书的空白地方;“三试”就是尝试性地做一些简单的练习,检验自己预习的效果;“四分”就是把自己预习的这节知识要点列出...……更多
...加快研究成果转化,培养“数学+”复合型人才 两大应用模型同日发布 本报讯 (记者 姜澎)上海张江再增一家新型研发机构。上海张江数学研究院日前正式成立,上海张江数学院同济大学分院和上海大学分院也同时成立。...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
随着语言模型的能力越来越强,现有的这些评估基准实在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并...……更多
大模型“翻车”小学题?
...——这样一道简单的“小升初”数学题难倒一众网友和大模型。上周五(7月12日)综艺《歌手2024》投票率出炉,孙楠以13.8%的投票率位居第三,Chanté Moore以13.11%的投票率排在第四。一位网友留言质疑“13.8%比13.11%高?”迅速引起热...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
...9哪个更大?一道小学生都会的数学题,却难倒了一众AI大模型。昨天,“大模型测不出9.11和9.9哪个大”还登上了微博热搜。这个难倒大多数AI大模型的数学题,其实来自于最近热播的《歌手》。7月13日,在最新一期《歌手》公布...……更多
...课堂上的精彩表现,并对还可以优化的环节发表了独到的见解,研讨气氛热烈,双方在思维碰撞、理念交流中相互学习、共同提升。 ……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
学而思推出数学答疑原生AI工具九章随时问,“AI将重新定义教育行业”
6月11日,好未来官方公众号宣布,学而思九章大模型推出最新AI数学搜索答疑工具“九章随时问”,即日起免费开放使用。这款产品打破了以生成式AI技术为基础,通过启发引导的方式帮助学生解决数学难题,旨在培养学生的解...……更多
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
...,通过简单的命令来实现复杂的数学表达式。对于大语言模型来说,它们在解答一些数学相关的问题时有时也需要输出数学方程式或表达式。这时如果能够使用 LaTeX 输出标准的公式,答案自然会更加清晰明了。以大模型初创公...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
... cot 研究还不太成体系,我们觉得应该多给出一些基础的见解。”未来,课题组准备针对这个问题研究大模型的内部,即分析 LLM 推理的长推理步骤和短推理步骤、以及大模型内部的神经元过程。他们的终极目标是:希望可以确...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
...谱。研究显示,百度贴吧“弱智吧”数据集训练出的AI大模型,跑分超过百科、知乎、豆瓣、小红书等平台,在问答、头脑风暴、分类、生成、总结等8项测试中取得了最高分。这个充满荒诞段子的中文社区,一跃成为最佳的中文...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
首个AI高考全卷评测结果发布:数学全都不及格
...布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排名二三位。本次评测采用全国新课...……更多
星火大模型数学能力遥遥领先已领先ChatGPT
举办的讯飞星火认知大模型成果发布会上,科大讯飞宣布推出“讯飞星火认知大模型”,并在现场进行了实机演示。据介绍,星火认知大模型具备以下能力:多风格多任务长文本生成、多层次跨语种语言理解,泛领域开放式知...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和...……更多
更多关于教育的资讯:
山东师范大学2024年新生开学典礼暨大学思政第一课举行
9月19日,山东师范大学2024年新生开学典礼暨大学思政第一课在长清湖校区举行。学校领导冯继康、张建、万光侠、许双庆、张茂聪
2024-09-20 16:35:00
常规有序 从“一”开始 来看济南高新一实验新生习惯养成日记
少成若天性,习惯如自然。儿童期是养成习惯的关键时期,孩子各种习惯的好与坏对孩子的成长起到决定性的作用。养成良好的习惯,才能发挥巨大的潜能
2024-09-20 17:08:00
长沙市天心区科普日系列主题活动暨学无界科学素养实践教育营地开营典礼启动
本文转自:人民网-湖南频道“风力发电”科学素养研学公开课。单位供图科普公开课、沉浸式营地参观、航模飞行表演……9月20日上午
2024-09-20 17:22:00
本文转自:人民网-四川频道在过去一年,四川国际标榜职业学院媒体创意与策划专业的郭子豪通过学校产教融合工作室的磨练,迅速成长为“信息与创意的‘百事通’”
2024-09-20 17:27:00
本文转自:人民网-安徽频道近日,在武汉大学中国科学评价研究中心与数字出版智能服务技术教育部工程研究中心联合组织举办的“中国应用型期刊评价”中
2024-09-20 17:33:00
本文转自:人民网-安徽频道党的建设是高校落实立德树人根本任务的重要抓手,是大学生成长成才的重要助力。扎实开展党建育人工作能够激发高校教书育人的不竭动力
2024-09-20 17:37:00
文化味儿十足!济南高新区黄金谷学校开展第27届推普周系列活动
近日,济南高新区黄金谷学校启动第27届全国推广普通话宣传周活动。学校通过一系列精心策划、形式多样的活动,有效提高了学生们使用国家通用语言文字的意识和能力
2024-09-20 20:29:00
粮食安全宣传走进校园 传递节粮爱粮理念
本文转自:人民网-上海频道9月20日,以“粮安‘沪’城、风味上海”为主题的粮食安全宣传教育活动走进上海理工大学的校园。在活动中心
2024-09-20 20:44:00
济南高新区心理教师培训“充电”:专家引领,为学生心理健康加码
为加强高新区心理教师队伍建设,提升心理教师的专业素养,9月19日,济南高新区心理教研室在济南高新区黄金谷学校举办了本学年首次心理生涯系列培训活动
2024-09-20 21:03:00
山东师范大学举行“向光而行 师梦启航”迎新生文艺演出
9月19日晚,山东师范大学2024年“向光而行 师梦启航”迎新生文艺演出在长清湖校区图书馆北广场举行。山东省委外办、共青团山东省委
2024-09-20 21:03:00
济南高新区景汇小学:关爱口腔健康,从娃娃抓起
9月20日是第36个“全国爱牙日”,济南高新区景汇小学三级部积极响应,精心策划并举办了一场以“爱护牙齿,从小做起”为主题的教育活动
2024-09-20 21:03:00
河北省“学习新思想,做好接班人”主题座谈会举行
本文转自:人民网-河北频道人民网石家庄9月20日电 (记者赵明妍)9月20日,河北省“学习新思想,做好接班人”主题座谈会举行
2024-09-20 21:37:00
本文转自:人民网-河北频道“学习新思想 育人启新篇”系列报道充分利用资源 开展好行走的“大思政课”人民网记者 赵明妍人民网记者
2024-09-20 22:15:00
江西南昌:以赛促训、以赛促学 建筑工技能比武
本文转自:人民网-江西频道建筑行业工作人员正在进行技能大比武。人民网记者 时雨摄人民网南昌9月20日电(记者时雨)20日
2024-09-20 20:04:00
近日,网传“英国外教对学生灌输台湾不属于中国”,多位网民发起投诉举报。经向权威部门核实,涉事主体为无资质违规机构,相关APP已下架,有关违规问题还将进一步调查处理。中国民办教育协
2024-09-20 13:46:00