研究成果,推理,场景,成果,检测,数学头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

NeurIPS 2024 | 数学推理场景下，首个分布外检测

本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收，第一作者王一鸣是上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通...……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

...凸优化理论、神经网络优化理论、机制设计等领域有颇多研究成果。姚期智姚期智是中国科学院院士、清华大学交叉信息研究院院长；同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

“发现教育” 让师生发现自己

...学习活动，旨在引导学生进行操作、观察、分析、猜想和推理等数学活动，在经历数学知识的“再创造”与“再发现”过程中，亲身体验数学、理解数学。 “数学实验”不是让学生机械地、盲目地操作，而是融入学生的数学思...……更多

2023-10-31 09:06:00师生,教育,数学,实验,教育,儿童

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

探索小学低段数学教学质量提升路径

...共同交流探讨小学基础认知能力训练与游戏化教学的最新研究成果和教学方法，有效推进小学基础认知能力的训练与低段数学游戏化教学的发展。 ……更多

2024-05-24 10:00:00数学教学,路径,数学,质量,小学,教学

诸城一中数学老师演绎精彩课堂

...课堂改革方案得失，梳理实施过程与实践经验，总结提炼研究成果，作为课堂教学改革的重要参考。（二）解决问题方法1、由于教学进度压力和教材内容设置与实际教学的差异，教师要巧妙设计课堂教学，拆分和整合有关内容...……更多

2024-09-05 21:39:00诸城,课堂,老师,数学,学生,学习

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...理路径。第四，是输出模块，是系统的"表达者"，负责将研究成果转化为专业的呈现形式。它能够根据用户需求，生成格式规范的报告、论文或分析图表。在这个过程中，系统会严格遵循学术规范，为每个结论提供准确的来源引...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来

...型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo，代码达到GPT-4 Turbo 96%，多模态理解达到GPT-4V 91%。此外，讯飞星...……更多

2024-01-30 22:41:00讯飞,星火,成果发布,成果,全国,平台

邹平农商银行AI大模型部署初测成果显著

...源。软件上，选择稳定的操作系统，部署Vllm开源大模型推理框架，驱动大模型批量、有序计算。模型选择上，经过对各大主流模型综合评估，选择硬件资源占用率合理、推理速度快、生成内容的深度和准确性符合业务要求的Qwen-...……更多

2025-05-22 21:28:00邹平,农商,模型,成果,银行,模型

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

搭建交流平台推动技术创新 “认知世界智创未来”主题论坛在

...大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见解和实践经验，众多海内外著名学者、专家、企业家等获邀出席活动，让本次论坛的交流更为国际化、多元化。上海市经济和信息化委员会信息基础设施...……更多

2024-07-06 08:26:00技术创新,认知,主题,交流,世界,平台

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R

快科技3月6日消息，阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型，其性能可与具备6710亿参数（其中370亿被激活）的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下，用...……更多

2025-03-06 07:42:00阿里,推理,模型,参数,全新,能力

大语言模型逻辑推理“很糟糕”

...也反映了人类在推理测试中的认知偏差？”她总结自己的研究成果称，这些大语言模型“经常表现出非理性推理，但表现方式与人类不同”。在伦敦大学学院教授兼机器智能实验室主任米尔科·穆索莱西的指导下，麦克米伦-斯科...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

新课标下，探寻高质量课堂的密码

...拨算盘，而是一起研究算理和算法。学算理、学算法、学推理……经过精心打磨的珠算课指向学生数学核心素养的培养，这是天一实验小学交出的教育教学改革成果之一，也是全体教师深耕课堂探寻高质量发展之路的缩影。新课...……更多

2023-11-29 06:38:00标下,高质量,课堂,密码,课堂,天一

把中国人的名字载入世界数学史册

...主要概念“亏值”和“奇异方向”之间的具体联系。这一研究成果，被命名为“杨—张定理”。次年，杨乐与张广厚带着研究成果赴瑞士参加国际分析会议。在他们的报告结束之后，函数值分布论专家奈望林纳和阿尔弗斯表示，...……更多

2023-10-24 02:26:00史册,中国,中国人,名字,数学,世界

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

2024年世界人工智能大会“数学与人工智能”学术会议在沪举办

...主题进行深入讨论，共同探讨数学与人工智能领域的最新研究成果和未来发展趋势。作为全球性高级别学术研讨会，此次会议由华院计算技术（上海）股份有限公司创始人董事长、斯梅尔数学与计算研究院执行院长宣晓华担任主...……更多

2024-07-10 22:53:00人工智能,人工,智能,学术会议,学术,大会

聚焦2025中国国际数字经济博览会·记者观察｜这个健康大模型

...，并融合问诊、舌象、脉象、面色等多模态数据，训练了推理模型库，建成世窗中医健康大模型。智能中医舌诊仪是三项应用成果产出之一。仪器利用高精度摄像头与图像识别技术采集数据，由模型分析舌象和面色，自动辨识体...……更多

2025-10-19 08:21:00中国,博览会,博览,模型,实力,观察

AI卷翻科研！DeepMind 36页报告：全球实验室被「A

...erdisciplinarity），形成成果，并最终通过采纳（Adoption）将研究成果转化为实际影响。底部的合作（Partnerships）、安全与责任（Safety & responsibility）贯穿始终，确保整个流程高效且符合道德规范。虽然很多要素看起来直观，但Dee...……更多

2024-11-27 18:23:00科学家,实验室,科研,指数,实验,科学