• 我的订阅
  • 头条热搜
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
对标o1,Kimi放出了最能打的国产模型
...历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前,OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手,通过更多的强化学习、原生的思维链和更长的推理时...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...凸优化理论、神经网络优化理论、机制设计等领域有颇多研究成果。姚期智姚期智是中国科学院院士、清华大学交叉信息研究院院长;同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学...……更多
...学习活动,旨在引导学生进行操作、观察、分析、猜想和推理等数学活动,在经历数学知识的“再创造”与“再发现”过程中,亲身体验数学、理解数学。 “数学实验”不是让学生机械地、盲目地操作,而是融入学生的数学思...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
...共同交流探讨小学基础认知能力训练与游戏化教学的最新研究成果和教学方法,有效推进小学基础认知能力的训练与低段数学游戏化教学的发展。 ……更多
诸城一中数学老师演绎精彩课堂
...课堂改革方案得失,梳理实施过程与实践经验,总结提炼研究成果,作为课堂教学改革的重要参考。 (二)解决问题方法1、由于教学进度压力和教材内容设置与实际教学的差异,教师要巧妙设计课堂教学,拆分和整合有关内容...……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...理路径。 第四,是输出模块,是系统的"表达者",负责将研究成果转化为专业的呈现形式。它能够根据用户需求,生成格式规范的报告、论文或分析图表。在这个过程中,系统会严格遵循学术规范,为每个结论提供准确的来源引...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...型讯飞星火V3.5在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。此外,讯飞星...……更多
...源。软件上,选择稳定的操作系统,部署Vllm开源大模型推理框架,驱动大模型批量、有序计算。模型选择上,经过对各大主流模型综合评估,选择硬件资源占用率合理、推理速度快、生成内容的深度和准确性符合业务要求的Qwen-...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见解和实践经验,众多海内外著名学者、专家、企业家等获邀出席活动,让本次论坛的交流更为国际化、多元化。上海市经济和信息化委员会信息基础设施...……更多
阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1
快科技3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用...……更多
...也反映了人类在推理测试中的认知偏差?”她总结自己的研究成果称,这些大语言模型“经常表现出非理性推理,但表现方式与人类不同”。在伦敦大学学院教授兼机器智能实验室主任米尔科·穆索莱西的指导下,麦克米伦-斯科...……更多
新课标下,探寻高质量课堂的密码
...拨算盘,而是一起研究算理和算法。学算理、学算法、学推理……经过精心打磨的珠算课指向学生数学核心素养的培养,这是天一实验小学交出的教育教学改革成果之一,也是全体教师深耕课堂探寻高质量发展之路的缩影。新课...……更多
...主要概念“亏值”和“奇异方向”之间的具体联系。这一研究成果,被命名为“杨—张定理”。次年,杨乐与张广厚带着研究成果赴瑞士参加国际分析会议。在他们的报告结束之后,函数值分布论专家奈望林纳和阿尔弗斯表示,...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
2024年世界人工智能大会“数学与人工智能”学术会议在沪举办
...主题进行深入讨论,共同探讨数学与人工智能领域的最新研究成果和未来发展趋势。作为全球性高级别学术研讨会,此次会议由华院计算技术(上海)股份有限公司创始人董事长、斯梅尔数学与计算研究院执行院长宣晓华担任主...……更多
...,并融合问诊、舌象、脉象、面色等多模态数据,训练了推理模型库,建成世窗中医健康大模型。智能中医舌诊仪是三项应用成果产出之一。仪器利用高精度摄像头与图像识别技术采集数据,由模型分析舌象和面色,自动辨识体...……更多
AI卷翻科研!DeepMind 36页报告:全球实验室被「AI科学家」指数级接管
...erdisciplinarity),形成成果,并最终通过采纳(Adoption)将研究成果转化为实际影响。底部的合作(Partnerships)、安全与责任(Safety & responsibility)贯穿始终,确保整个流程高效且符合道德规范。虽然很多要素看起来直观,但Dee...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...。谷歌表示,现有的人工智能模型通常只处理一种类型的推理,如图片或文本,而 Gemini 的设计是“多模式”的。这意味着它接受包括多种媒体类型的输入,组合文本、图像、音频、视频和编程代码。未来,谷歌还计划将 Gemini添...……更多
论文变产品 智源成资源——西咸新区校地合作“开花结果”
...智眼的机器视觉、工业智手的控制决策与工业智脑的认知推理等核心技术闭环运用于多场景、跨行业的无损检测智能化解决方案,全面提升检测效率和质量品质。”西安数合信息科技有限公司公司财务总监段嘉奇说,未来将进一...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...在保证特定任务性能的前提下,大幅降低模型规模和潜在推理成本的可能性。北京大学杨仝教授团队表示:“FairyR1-32B模型是我们探索高效大型语言模型技术路线的阶段性成果。通过对蒸馏和合并方法的改进,我们初步验证了在...……更多
汇智空天,赋能未来 第一届空天信息技术大会在济南开幕
...感解译基础模型。在技术创新方面,为有效突破遥感模型推理的性能和速度瓶颈,联合研究团队自主研发了一套基于热传导的内核工作架构,大幅提升模型推理速度,计算速度较传统结构模型提升2.4倍以上。该模型目前已表现出...……更多
...测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的,是它在训练方式上的简化。以往的模型在提升推理能力时,通常依...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
丘成桐谈AI:帮助数学但不能改变数学
...些学科的深入研究往往需要高度的抽象思维和严密的逻辑推理,“用几个方程式‘纸上谈兵’,可以解释宇宙里边的很多重要的结构,这是很有趣的事情。”然而,基础学科绝非纸上的空谈,对于推动科学技术的进步和创新具有...……更多
...提供了一种通用工具,可用于揭示广泛存在的物理和生物场景中复杂系统中的隐藏模式。邬荣领介绍,该互作网络能够解析随机、非线性、不确定的自然现象,还可以作为人工智能的一个底层框架,为人工智能提供数学基础。据...……更多
更多关于科技的资讯:
海尔智慧家庭与小度战略合作:双向控制,生态互通
伴随市场需求从单品向全屋智能深入,智能家居生态正从过去单一入口向着多入口、多圈层的生态体系迈进。特别是互联平台的兼容性方面
2025-11-16 15:16:00
摘要:本文围绕企业绩效管理体系的构建与完善展开研究,首先明确该体系的核心构成,包含目标设定、过程监控、评估实施与结果应用四个相互衔接的环节
2025-11-15 05:22:00
厦门软件园健康马拉松赛开跑 引入AI陪跑员
厦门网讯(厦门日报记者 林露虹 摄影报道)“我的‘跑友’是机器人!”昨日,厦门软件园第十七届健康马拉松赛在软件园二期热力开跑
2025-11-15 08:20:00
吉林本土动画电影《疯狂电脑城》,凭啥在海外频频获奖?
在温哥华华语电影节上,吉林动画学院师生联合打造的《疯狂电脑城》摘得“最佳动画片奖”,这已经不是该片第一次出海,2024年
2025-11-15 19:01:00
摘要:本文聚焦数字化转型背景下企业行政管理效率提升问题,首先剖析数字化转型与企业行政管理的内在关联,指出二者通过流程优化
2025-11-15 05:22:00
2025网聚美好安徽|“双路由”直连上海 看宿州腾“云”而上
大皖新闻讯 11月14日,“皖美十四五 再启新征程”2025网聚美好安徽网络主题活动采访团走进位于宿州高新区的汴水之畔超级计算中心
2025-11-15 10:05:00
“世界舞台”上秀一圈,南京收获了什么?
进博会圆满落幕,南京交易分团意向成交9.98亿美元“世界舞台”上秀一圈,南京收获了什么?□南京日报/紫金山新闻记者 黄琳燕11月10日
2025-11-14 08:38:00
埃斯顿工业机器人出货量持续增长 宁企连续三季霸榜国内“一哥”
11月13日,在江宁开发区埃斯顿智能制造示范车间内,工业机器人正在做各种场景应用展示。宁企埃斯顿今年前三季度机器人总销量约25000台
2025-11-14 08:39:00
一批创新产品亮相“宁创新品”信创产业教育专场活动 只需3步,20分钟完成全班作业批改南报网讯(记者徐宁)上传空白试卷和答案
2025-11-14 08:39:00
以AI引擎打造数字化转型山西模式
图片由讲述人提供讲述人 山西数据流量谷副总经理邵同旭我是山西数据流量谷的邵同旭,长期专注于数据要素与人工智能领域。多年来
2025-11-14 08:52:00
岁末是金融服务的“大考期”,业务量激增、客户需求多元叠加。张家口农商银行宣泰支行聚焦柜面运营核心环节,以“压降投诉、提升质量
2025-11-14 10:07:00
秋实如今,快节奏的都市生活中,“情绪消费”成为一种新的消费方式。数据显示,超九成青年认可情绪价值,近六成青年愿意为情绪价值买单
2025-11-14 11:28:00
新华社记者王雨萧周蕊一杯咖啡,能勾勒出怎样的经济图景?从云南绵延百万余亩的咖啡种植园,到上海梧桐树下香气氤氲的创意特调
2025-11-14 11:28:00
惠依近日,深圳大学深圳城市传播创新研究中心发布《短视频用户的算法实践与“破茧”报告》。《报告》显示,与一些人担忧“信息茧房”形成对比
2025-11-14 11:28:00
如新荣获2025消费责任对话活动客户服务创新典型案例
2025年11月5日,以“大力提振消费 品质服务担当”为主题的消费责任对话活动在成都成功举办。本次活动由中国消费者协会
2025-11-14 11:29:00