• 我的订阅
  • 头条热搜
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...凸优化理论、神经网络优化理论、机制设计等领域有颇多研究成果。姚期智姚期智是中国科学院院士、清华大学交叉信息研究院院长;同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学...……更多
...学习活动,旨在引导学生进行操作、观察、分析、猜想和推理等数学活动,在经历数学知识的“再创造”与“再发现”过程中,亲身体验数学、理解数学。 “数学实验”不是让学生机械地、盲目地操作,而是融入学生的数学思...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
...共同交流探讨小学基础认知能力训练与游戏化教学的最新研究成果和教学方法,有效推进小学基础认知能力的训练与低段数学游戏化教学的发展。 ……更多
诸城一中数学老师演绎精彩课堂
...课堂改革方案得失,梳理实施过程与实践经验,总结提炼研究成果,作为课堂教学改革的重要参考。 (二)解决问题方法1、由于教学进度压力和教材内容设置与实际教学的差异,教师要巧妙设计课堂教学,拆分和整合有关内容...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...理路径。 第四,是输出模块,是系统的"表达者",负责将研究成果转化为专业的呈现形式。它能够根据用户需求,生成格式规范的报告、论文或分析图表。在这个过程中,系统会严格遵循学术规范,为每个结论提供准确的来源引...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。此外,讯飞星...……更多
...源。软件上,选择稳定的操作系统,部署Vllm开源大模型推理框架,驱动大模型批量、有序计算。模型选择上,经过对各大主流模型综合评估,选择硬件资源占用率合理、推理速度快、生成内容的深度和准确性符合业务要求的Qwen-...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见解和实践经验,众多海内外著名学者、专家、企业家等获邀出席活动,让本次论坛的交流更为国际化、多元化。上海市经济和信息化委员会信息基础设施...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
快科技3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用...……更多
...也反映了人类在推理测试中的认知偏差?”她总结自己的研究成果称,这些大语言模型“经常表现出非理性推理,但表现方式与人类不同”。在伦敦大学学院教授兼机器智能实验室主任米尔科·穆索莱西的指导下,麦克米伦-斯科...……更多
新课标下,探寻高质量课堂的密码
...拨算盘,而是一起研究算理和算法。学算理、学算法、学推理……经过精心打磨的珠算课指向学生数学核心素养的培养,这是天一实验小学交出的教育教学改革成果之一,也是全体教师深耕课堂探寻高质量发展之路的缩影。新课...……更多
...主要概念“亏值”和“奇异方向”之间的具体联系。这一研究成果,被命名为“杨—张定理”。次年,杨乐与张广厚带着研究成果赴瑞士参加国际分析会议。在他们的报告结束之后,函数值分布论专家奈望林纳和阿尔弗斯表示,...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
2024年世界人工智能大会“数学与人工智能”学术会议在沪举办
...主题进行深入讨论,共同探讨数学与人工智能领域的最新研究成果和未来发展趋势。作为全球性高级别学术研讨会,此次会议由华院计算技术(上海)股份有限公司创始人董事长、斯梅尔数学与计算研究院执行院长宣晓华担任主...……更多
...,并融合问诊、舌象、脉象、面色等多模态数据,训练了推理模型库,建成世窗中医健康大模型。智能中医舌诊仪是三项应用成果产出之一。仪器利用高精度摄像头与图像识别技术采集数据,由模型分析舌象和面色,自动辨识体...……更多
AI卷翻科研!DeepMind 36页报告:全球实验室被「AI科学家」指数级接管
...erdisciplinarity),形成成果,并最终通过采纳(Adoption)将研究成果转化为实际影响。底部的合作(Partnerships)、安全与责任(Safety & responsibility)贯穿始终,确保整个流程高效且符合道德规范。虽然很多要素看起来直观,但Dee...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...。谷歌表示,现有的人工智能模型通常只处理一种类型的推理,如图片或文本,而 Gemini 的设计是“多模式”的。这意味着它接受包括多种媒体类型的输入,组合文本、图像、音频、视频和编程代码。未来,谷歌还计划将 Gemini添...……更多
论文变产品 智源成资源——西咸新区校地合作“开花结果”
...智眼的机器视觉、工业智手的控制决策与工业智脑的认知推理等核心技术闭环运用于多场景、跨行业的无损检测智能化解决方案,全面提升检测效率和质量品质。”西安数合信息科技有限公司公司财务总监段嘉奇说,未来将进一...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在...……更多
汇智空天,赋能未来 第一届空天信息技术大会在济南开幕
...感解译基础模型。在技术创新方面,为有效突破遥感模型推理的性能和速度瓶颈,联合研究团队自主研发了一套基于热传导的内核工作架构,大幅提升模型推理速度,计算速度较传统结构模型提升2.4倍以上。该模型目前已表现出...……更多
...测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的,是它在训练方式上的简化。以往的模型在提升推理能力时,通常依...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
丘成桐谈AI:帮助数学但不能改变数学
...些学科的深入研究往往需要高度的抽象思维和严密的逻辑推理,“用几个方程式‘纸上谈兵’,可以解释宇宙里边的很多重要的结构,这是很有趣的事情。”然而,基础学科绝非纸上的空谈,对于推动科学技术的进步和创新具有...……更多
...提供了一种通用工具,可用于揭示广泛存在的物理和生物场景中复杂系统中的隐藏模式。邬荣领介绍,该互作网络能够解析随机、非线性、不确定的自然现象,还可以作为人工智能的一个底层框架,为人工智能提供数学基础。据...……更多
更多关于科技的资讯:
鲁网11月21日讯为回馈客户,赋能业务高质量发展,近日,河东农商银行桃源支行联合辖内某药业集团举办“金冬时节·健康相伴”客户养生见面会
2025-11-22 09:34:00
灵光4天下载破100万,扩容8轮,刷新Sora2五天纪录
11月22日消息,蚂蚁灵光上线4天下载量突破100万,冲上App Store中国区免费榜第六。灵光首个百万下载速度超过ChatGPT
2025-11-22 14:13:00
知识带货热度高,历史作家梅毅在抖音直播间发布新书
知识带货热度不减,越来越多作家走进直播间推荐新书、好书。11月20日,知名历史作家梅毅(网名“赫连勃勃大王”)携新作《天命无常
2025-11-22 15:35:00
齐绘未来发布“快上岸”智能求职小程序,多项自主知识产权技术为大学生就业赋能
北京齐绘未来教育科技有限公司近日正式推出“快上岸”微信小程序,以多项具备自主知识产权的AI系统为核心,为大学生提供精准
2025-11-22 15:36:00
以开源聚合力,以生态促创新,电鸿走出行业操作系统自主路径
“在过去,去一次现场要带一大堆终端,以应对现场不同设备的接入。现在,只需一部手机和一箱基础工具就行。”来自广州南沙示范区运维工作人员的分享
2025-11-22 15:37:00
河北新闻网讯(李力芳)2025年7月份以来,河北建工省安装六分公司浙江八亿时空项目创新引入平台吊装系统、蜘蛛吊、电动遥控坦克等专业技术装备
2025-11-22 18:08:00
11月21日从太钢获悉,太钢近期硅钢产品订单在欧洲高端市场实现成功落地。此次出口的硅钢产品首次实现大卷重(15-17吨)和高牌号超宽规格(1250mm)供货
2025-11-22 18:20:00
校企携手研发新型电池 拓展长时储能应用新边界
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)11月20日,以“储能大时代,长时新蓝海”为主题的中国新型储能产业创新联盟2025年度大会在武汉召开
2025-11-22 19:06:00
必胜客中国业务进入快车道:门店突破4000家
2025年11月22日,百胜中国旗下必胜客在海南三亚举行中国第4000家门店的开业庆典。这一里程碑意味着必胜客在中国的布局进入新阶段
2025-11-22 22:32:00
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00