• 我的订阅
  • 头条热搜
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...学生成式人工智能实验室(GAIR Lab)推出的OlympicArena[1] (奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...OpenAI 还发现它在数学和编码方面表现出色。在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅正确解答了 13% 的问题,而 o1 模型正确解答了 83% 的问题。模型的编码能力也在比赛中得到了评估,在 Codeforces 比赛中排名 89%。OpenAI 表...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...科的挑战性基准测试中,表现超过人类专家。在国际数学奥林匹克(IMO)资格考试中,新模型得分超83%,远高于GPT-4o的13%。在Codeforces编程竞赛中,o1模型的成绩达到了前89%,而GPT-4o仅达到11%。 OpenAI表示, o1模型在推理能力上相...……更多
...篇计算机科学论文称,研究人员开发出一个能解国际数学奥林匹克竞赛级别几何题的人工智能(AI)系统,表现超过了之前最好的自动化定理证明系统。该研究证明了AI能以接近人类最高水平破解复杂逻辑挑战的潜力,而这正是AI研...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIME)预选赛中位列美国前500名学生之列,并且在物理、生物和化学问题的基准测试(GPQA)中超过了人类博士水平的准确度。OpenAI团队上下对o1模型充满了...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...而对于最能考验人类大脑的深度思考能力的 IMO 国际数学奥林匹克竞赛试题,R1-Lite-Preview 的表现是这样的:这道代数题相当难,全球仅有 5 个人全对。在长达 162 秒的思考过程中,R1-Lite-Preview 洋洋洒洒地把解题思路写成了一篇小...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果,二者差异显著,其中,前者正确解决问题的准确率是 13.4%,而 o1 的准确率则能够达到 83.3%。这种推理能力的重要意义...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
最近,专门为人工智能(AI)设立的AI国际奥林匹克数学竞赛(IMO)即将进入尾声,其结果将随今年7月于英国巴斯举行的65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI...……更多
...的,是 Google 的专用模型 AlphaGeometry 在公认高难度的国际奥林匹克数学竞赛中取得了 28/42 的成绩,获得银牌。学生时代我们也接触过奥数,深知能在此类国际奥赛中获银牌的选手,无一不是从小就体现出相当数学天赋,且一路努...……更多
人工智能赢得国际奥数银牌
在刚刚结束国际数学奥林匹克竞赛中,谷歌旗下DeepMind派出了人工智能参赛,并取得了第二名银奖。据了解,DeepMind的AI数学模型由数学推理模型AlphaProof 和几何求解模型AlphaGeometry (阿尔法几何)组成。此次奥数比赛共有六道题...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...-4o。在编程竞赛题(Codeforces)中排名第89位,在美国数学奥林匹克预选赛(AIME)中跻身全美前500 名学生行列,在物理、生物和化学问题(GPQA)基准测试中的准确率也超过了人类博士生水平。据介绍,类似于人类在回答一个难题...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...在看到报价的时候,突然想起 OpenAI 有一个论文是对数学奥林匹克竞赛的题目和解题过程进行标注,以进行强化学习的训练。OpenAI 标注的性质和内容,和我们存在部分相似的地方。”在 OpenAI 那份名为 PRM800K 的数据集里,包含了 ...……更多
第三十届江苏省青少年科技模型大赛在苏州举办
12月23日,第三十届江苏省青少年科技模型大赛头脑奥林匹克竞赛在苏州举办。来自省内156个代表队的1563名青少年选手、130名带队导师和20多名评审专家齐聚西安交通大学苏州附属中学普惠路校区,共同参与一场精彩的头脑风暴...……更多
...理)相结合,构建出一种神经—符号混合系统。在今年的奥林匹克数学竞赛中,升级后的AlphaGeometry2在19秒内就解答出一道题,令人类选手望尘莫及。研究人员坚信,目前的迭代只是个开始。“AI科学家”就像AI科研自动化领域的GPT...……更多
泰安市学科奥林匹克竞赛教练员培训班在山东省泰安第二中学举行
为落实科教兴国战略,提升中学学科奥林匹克竞赛优生教育和学科奥林匹克竞赛培训水平,加强基础学科拔尖创新人才选拔培养,为国家基础学科和重大战略领域输送后备人才,1月20日至22日,泰安市学科奥林匹克竞赛教练员培...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...解、分析问题的方式一样。根据测试,o1模型在国际数学奥林匹克的资格考试中,能够拿到83%的分数,而GPT-4o只能正确解决13%的问题。而在编程能力比赛Codeforces中,o1模型拿到89%百分位的成绩,而GPT-4o只有11%。(图上显示,o1模...……更多
郑州八中学子在全国青少年信息学奥林匹克竞赛河南省CSP-J/S比赛中荣获佳绩
...郑州八中迎来喜讯,学校共16名学子在全国青少年信息学奥林匹克竞赛河南省CSP-J/S第二轮比赛中荣获佳绩!其中,一等奖8人次,二等奖16人次。在9月21日举办的初赛中,郑州八中学子在6000余人中杀出重围,挺进复赛圈,并于10月...……更多
英国物理奥林匹克竞赛,日照一中学生郑德轩获得超级金奖
2月14日,英国物理奥林匹克竞赛(BPhO)公布结果,日照一中高二年级学生郑德轩同学获得超级金奖(Top Gold)(在英国排名大约前50名)奖项,受邀参加BPhO Round 2比赛,并受邀参加仅35个席位的剑桥大学官方组织的物理集训营,...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...输入一些比较抽象的数学题,比如一道来自小学四年级的奥林匹克竞赛题:还是惯例先看看国产AI的回答: kimi文心一言两个国产AI分别给出了A和B的选项,其中kimi的推理过程非常长,直接把这道小学奥数题以高等数学的方式进...……更多
...日报本报讯 (记者黄远会)前不久,全国青少年信息学奥林匹克竞赛官网公布,贵港市荷城初级中学的陈最、高周鑫和蒙子俊3名学生荣获全国青少年信息学奥林匹克竞赛第二轮入门级一等评级。陈最、高周鑫、蒙子俊都是第一...……更多
济南高新区凤凰路小学在2023年全国信息学奥林匹克竞赛中喜获佳绩!
...30日讯2023年9月16日在全省各地市进行了2023年全国信息学奥林匹克竞赛第一轮认证考试,2023年10月21-22日在日照(山东外国语职业技术大学)进行了第二轮认证考试,2023年12月29日-30日在烟台青华中学召开了2023年山东省信息学奥赛...……更多
...创新人才培养物理奥赛能够助力高考、创新和科普,物理奥林匹克竞赛中国国家队总教练兼领队宋峰认为物理奥赛能够拓宽学生的升学渠道,增加升学人数,以衡水中学为例,在做竞赛的十年间,实现清北录取人数从92人到270余...……更多
全国中学生数学奥林匹克竞赛 温州高一男生龚浩然满分摘金
本文转自:温州都市报全国中学生数学奥林匹克竞赛 温州高一男生龚浩然满分摘金浙江27人获得金牌,其中我市13人温都记者 姜瑾瑾 受访者供图 温都讯 昨天,2022年全国中学生数学奥林匹克竞赛(决赛)获奖名单公布,乐清市...……更多
国际天文奥林匹克竞赛在京开幕 涵盖理论、观测及实测等
...国新闻网中新网北京11月8日电 (记者 陈杭)第27届国际天文奥林匹克竞赛7日在北京天文馆开幕。本届竞赛由欧亚天文学会和北京天文馆主办,共有来自9个国家的53位选手和20位领队及观察员参赛。7日,第27届国际天文奥林匹克竞赛...……更多
第十七届国际地球科学奥林匹克竞赛全球总决赛在北大启动
...转自:人民网人民网北京8月9日电 第十七届国际地球科学奥林匹克竞赛2024全球总决赛8日在北京大学百周年纪念讲堂启动。竞赛由北京大学与中国科学院大学、北京一零一中、中国地震学会共同主办。来自全球35个国家和地区的13...……更多
来源:极目新闻第28届WMO(世界奥林匹克竞赛)创新讨论测评来啦11月10日,由WMO世界奥林匹克数学竞赛协会发起举办的,在奥数杯赛中有着重要地位的WMO世界奥林匹克数学竞赛(中国区)(以下简称“WMO”)第28届大赛已在上海地区...……更多
泰山学院附属中学获29届全国青少年信息学奥林匹克联赛山东赛区金牌学校
2023年12月30日,第29届全国青少年信息学奥林匹克联赛(NOIP2023)山东赛区颁奖仪式在烟台举行,泰山学院附属中学获得“金牌学校”荣誉称号。泰山学院附属中学获29届全国青少年信息学奥林匹克联赛山东赛区金牌学校。(孙凯...……更多
淄博六中学子在全国信息学奥林匹克联赛及CSP-J/S提高级认证中喜获佳绩
鲁网12月19日讯12月12日,第29届全国信息学奥林匹克联赛(NOIP2023)获奖学生名单在中国计算机学会官方网站公示,淄博六中高跃铭同学获得一等奖,王梓蘅、周御基同学获得二等奖。信息学奥赛作为五大学科奥赛之一,是促进...……更多
...果想申请理工专业,常见的国际性竞赛有:IMO(国际数学奥林匹克竞赛)、IPhO(国际物理奥林匹克竞赛)、IChO(国际化学奥林匹克竞赛)、IBO(国际生物奥林匹克竞赛)。值得注意的是,参加国际竞赛都需要一定的准备时间,...……更多
...日,包头市第九中学捷报频传,2024届学子在全国中学生奥林匹克五大学科竞赛中共获铜牌5枚,省级一等奖21人,位列包头第一、自治区前列。强之行等4人在数学奥林匹克竞赛(预赛)中获得内蒙古赛区一等奖;于恩泽获得化学...……更多
更多关于科技的资讯:
复旦大学漆远:DeepSeek将推理成本降至百万token仅1元人民币,加速AI普及
上海科学智能研究院院长、复旦大学浩清特聘教授漆远出品|搜狐科技作者|郑松毅2月21日-23日,2025全球开发者先锋大会在上海举办
2025-02-22 11:50:00
DeepSeek等AI大模型加持 !贵州大数据集团多款政务智能体应用“上新”
智能问政、政策咨询助手、政务办事小助······随着多款自研政务智能体应用“上新”,贵州大数据集团国产算力服务器已完成DeepSeek系列大模型本地化部署
2025-02-22 11:52:00
奔驰高管:我们新车量产前都会经历“地狱级”的安全测试
快科技2月22日消息,新车量产之前都要经历严格的测试,比如大家熟知的冬测和夏测,实际上还有非常多的项目,以此验证整车的质量
2025-02-22 12:00:00
剧情太恶心!网友呼吁《难哄》下架 女主被骚扰还安慰犯罪者家属
2月22日消息,近日,电视剧《难哄》被网友呼吁下架。剧情中女主八集遭遇六次性骚扰,还去安慰犯罪家属,引起网友不满。不少网友纷纷在社交媒体上呼吁下架该剧
2025-02-22 12:00:00
王兴兴他是个天才!俞敏洪自嘲无法成DeepSeek和宇树:中国传统教育必须要改革
快科技2月22日消息,在亚布力中国企业家论坛第25届年会”上,俞敏洪发言称,自己无法成为DeepSeek和宇树科技。俞敏洪表示
2025-02-22 12:00:00
快科技2月22日消息,近日,中国科学院力学研究所宣布,我国自主研发的临近空间宽域飞行器“鸣镝”系列(型号MD-22)已成功完成关键性飞行试验
2025-02-22 12:30:00
打破行业十几年固化!米家空调上出风Pro获UET好产品奖
快科技2月22日消息,据小米官方介绍,小米米家空调上出风Pro 1.5匹等三款产品荣获“UET好产品奖”。该奖项是由中国家用电器研究院发起
2025-02-22 12:30:00
马斯克裁员大刀砍向美国交管局:自动驾驶监管人员减半
快科技2月22日消息,马斯克执掌大权后频频使用雷霆手段,而近日,他又将目光瞄向了美国交管局。据《华盛顿邮报》21日援引知情人士消息称
2025-02-22 12:30:00
200万一辆 马斯克投的飞行汽车试飞:垂直能升降
快科技2月22日消息,近日,美国电动飞行汽车公司Alef Aeronautics完成了Model A原型车在城市环境中的飞行测试
2025-02-22 13:30:00
快科技2月22日消息,近日,在黄河宁夏中卫段出现了令人惊叹的自然景观。正值冬末春初,受气候、降水及温度等多重因素影响,原本奔腾不息的黄河水在此刻竟呈现出如“翡翠”般晶莹的绿色
2025-02-22 13:30:00
东疆文旅融合玩出新花样 打造特色海洋旅游目的地 扫码阅读手机版
这两天,“飞机堵马路上了!网友:可能这辈子就碰上这一次”等相关视频霸屏市民的朋友圈。记者从东疆综保区获悉,这架堵在路上的退役空客A330-200飞机将停放在日出东疆·露营基地
2025-02-22 13:38:00
本文转自:人民网人民网北京2月22日电 (焦磊)近年来,随着人们对生活品质的追求不断提高,舒适家居已成为大众消费的热点
2025-02-22 13:57:00
首批骁龙8s至尊版旗舰!REDMI Turbo 4 Pro用上1.5K直屏+金属中框
快科技2月22日消息,高通将在Q2骁龙8s至尊版移动平台,小米Civi 5 Pro、REDMI Turbo 4 Pro将会是首批搭载的机型
2025-02-22 14:00:00
据北京日报消息,昨天,《哪吒之魔童闹海》(以下简称《哪吒2》)票房突破127亿元,其IP衍生品也在市场上取得空前成功,甚至出现了一“吒”难求的盛况
2025-02-22 14:15:00
国产新作《解限机》在海外风评大好:美女机师太诱人
国产机甲新作《解限机》Demo测试预下载已于近日开启。有国外推主被游戏强大的捏脸功能震撼,分享美女机师号召粉丝来体验一下
2025-02-22 14:30:00