• 我的订阅
  • 头条热搜
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
快科技1月16日消息,今日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解,在识别推理错误步骤能力上,Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多
美股收盘:标普四渡6400点失利 锂矿、大麻板块豪迈上涨
...至周一收盘,Alt5 Sigma收跌26.42%。【英伟达推出具身智能推理模型Cosmos Reason】在周一揭幕SIGGRAPH大会上,英伟达推出一系列面向机器人开发者的世界模型、应用库和基础设施。最引人关注的是参数量只有70亿的开源物理AI应用和机...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...次采取扩容等措施保证流量异常增高后的稳定,这对Kimi推理算力、成本等也构成挑战。实际上,长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示,很多大模型仅停留在长度和简单...……更多
美国之“偏”:“华盛顿一直在欺骗巴勒斯坦人”
...的“两国方案”做准备。 爱尔兰广播电视台网站:美国罗格斯大学法学教授哈克表示,联大决议将使巴勒斯坦人能够“就一系列问题发言并制定议程”,而且可以推动落实“两国方案”,从而“结束以色列对巴勒斯坦领土的无...……更多
...够运行该模型,意味着特斯拉可能拥有地球上最大数量的推理算力。即便未来无人驾驶出租车的愿景成真,汽车每周的实际使用时间大致只有三分之一,剩下三分之二的时间可以用来做分布式推理,例如参与“寻找地外文明计划...……更多
...天凌晨,阿里巴巴又默默干了件大事:发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习,它在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。在保持...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
IDC:中国大模型推理市场爆发,九章云极以\\\
近日,IDC发布《2025中国大模型推理算力市场分析报告》指出,大模型与生成式AI的推理算力建设已成为当前产业发展的关键环节。报告预测,2024年中国生成式AI基础设施市场规模将达到2091.9亿元。九章云极凭借在AI基础设施市场...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
...,找到合适的应用场景与解决方案。有应用场景就会出现推理,如果推理成本控制不了,只是一味追求模型越大越好,对于企业来说很难负担得起。”顾凡直言,因此,对于制造业客户来说,大模型应用核心需要注意的是,找到...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...。在数学方面大模型还有很大的提升空间。数学关乎复杂推理相关能力,这是大模型普遍面临的难题,也是大模型在金融、工业等要求可靠的场景落地需要的关键能力。上海人工智能实验室领军科学家林达华此前在采访中对第一...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院 供图“空天·灵犀”遥感智能训推一体机搭载的高精度、高时效轻量化基础模型,能够在自然资源、...……更多
马斯克的AI大模型登场
...够运行该模型,意味着特斯拉可能拥有地球上最大数量的推理算力。即便未来无人驾驶出租车的愿景成真,汽车每周的实际使用时间大致只有三分之一,剩下三分之二的时间可以用来做分布式推理,例如参与“寻找地外文明计划...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...湖大学工学院助理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多
春节后创历史新高个股盘点:机器人概念股批量再迎新高 一股3个交易日大涨超80%
...合专家MoE,MLA)、训练方法(纯强化学习)、蒸馏优化和推理效率提升等,显著提升了AI算法效率和性能。DeepSeek本质是对现有AI算法的效率优化,短期可能导致训练需求下降,但随着模型普及和应用场景扩展,长期推理需求将显...……更多
显卡可能没那么重要了 中国公司给硅谷好好上了一课
...的更新主要是 3 个方面的优化,分别是通信和显存优化、推理专家的负载均衡以及FP8 混合精度训练。各个部分怎么实现的咱也就不多说了,总体来说,大的整体结构没啥变化,更多的像是咱们搞基建的那一套传统艺能,把工程...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...到现阶段还不成熟的视频生成效果,和仍旧高昂的训练、推理成本,其商业化变现路径仍不明确。“在文本大模型领域,免费可能是大家的共识,因为成本相对可控,而且用户越多越有利于大模型快速升级。但对于训练成本、推...……更多
深度交流,成功举办!2025中国肠道大会亮点一览
...众号推文链接)。全体大会环节,西湖大学董晨院士、美国罗格斯大学/上海交通大学赵立平教授、香港中文大学于君教授、美国加州大学Rob Knight教授、北京大学姜长涛教授、清华大学程功教授、西湖大学付元庆教授七位知名专家,...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...们刚才所述,32个基准测试中拿下30个SOTA。其中,通用、推理、数学和编程等大方向的成绩如下表所示:△Gemini 在包括文本和编码在内的一系列基准测试中达到SOTA 在多模态方面,Gemini Ultra在新的MMMU基准测试中也获得了59.4%的SOT...……更多
为了弗拉格,三支值得放弃当下的球队!
...大的讨论主要围绕杜克大学的新生库珀-弗拉格,而来自罗格斯大学的迪伦-哈珀,以及伊利诺大学的卡斯帕拉斯-雅库西奥尼斯都被认为是弗拉格最具威胁性的挑战者,但是从简单的比赛内容来看,还是没有任何一位潜力新秀能拥...……更多
联想提出混合智能,已开发“联想大脑”
...露,联想已经开发了如“联想大脑”这样的大模型训练和推理平台,并拥有全栈式AI Building Blocks(大模型和小模型系列)。同时,该公司也将推出AI异构推理加速平台。他表示:“未来,联想将围绕‘新IT’持续投资技术创新,...……更多
更多关于科技的资讯:
联通客户日 暖冬送温情——福建联通VIP客户答谢会在三明圆满落幕
活动现场。东南网11月26日讯(通讯员 肖锦雯)近日,以“联通客户日 暖冬回馈季”为主题的福建联通VIP客户答谢会在三明市徐锦新城小区温馨启幕
2025-11-26 12:50:00
梦百合家居董事长倪张根亮相沈阳“梦粉见面会”,发布适老化智能床新品
近日,知名睡眠品牌MLILY 梦百合在沈阳京东MALL发布适老化智能床系列新品,并针对沈阳大东区社会福利院展开公益捐赠
2025-11-26 13:04:00
BORCHERS®亮相中国国际涂料展,以本地化创新与全球技术推动行业可持续发展
在今天开幕的 2025 中国国际涂料展上,美利肯涂料添加剂品牌BORCHERS®于 W2.F21 展位(展馆 W2)再次携核心解决方案亮相
2025-11-26 13:37:00
国际大咖为“南京故事”国际传播支招在中国制作 向世界传播南报网讯(记者乔雅萱)11月22日上午,南京国际传播中心揭牌仪式现场
2025-11-26 10:27:00
江苏南京:链接全球资本!宁企赴港上市热潮涌动
□南京日报/紫金山新闻记者曹丽珍今年以来,一股赴港上市浪潮正在全国范围内持续奔涌。相关数据显示,今年前三季度,中国企业境外首次公开募股(IPO)的活跃度大幅回升
2025-11-26 10:27:00
江苏南京:一张购物小票,掘出一座“数据金山”
南京加快释放数据要素价值培育壮大数据产业一张购物小票,掘出一座“数据金山”晓数通社区微数据中心。 江苏荣泽信息科技股份有限公司供图数族科技
2025-11-26 10:27:00
南报网讯(记者朱旖旎通讯员刘芳)深秋的南京,一场跨越山海的双向奔赴正在发生。近日,2025中欧机器人产业合作(南京)对接会在栖霞区召开
2025-11-26 10:28:00
医疗器械“产学研医”对接会举办
近日,2025南京医疗器械“产学研医”对接会在高淳举办,高校、医院、企业等多方代表齐聚。活动搭建协同平台,助力产业创新与成果转化
2025-11-26 10:28:00
在长三角文博会上亮出“文化家底”和数字创新实力南京打造微短剧产业集聚高地□南京日报/紫金山新闻记者朱静近日,一场聚焦微短剧的产业合作交流活动在国家会展中心(上海)火热举办
2025-11-26 10:28:00
江苏南京:相约十年,让制造更聪明
相约十年,让制造更聪明——写在2025世界智能制造大会即将召开之际□南京日报/紫金山新闻记者徐宁 实习生黄倩“作为南京智能制造产业的标杆力量
2025-11-26 10:28:00
智能工厂运营效率提升
近日,在南京天加环境科技有限公司今年5月投产的天加洁净基地内,高度自动化生产线正生产发泡板机、换热器等核心零部件。该生产基地建立了从客户需求到最终交付的“端到端”全流程数字化运营体系
2025-11-26 10:28:00
东南网11月26日讯(福建日报记者 李珂) 记者从厦门大学获悉,日前,该校萨本栋微米纳米科学技术研究院吴德志教授团队在3D打印技术领域取得突破性进展——首创“激光原位诱导直写打印”技术
2025-11-26 10:34:00
厦门网讯(厦门日报记者 张珺 通讯员 吴冰冰)我市跨境电商生态再添新支点,日前,POD(按需定制)专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园
2025-11-25 08:11:00
AI赋能千行百业一线故事(十七):这位“农事专家”,让种地更聪明
这位“农事专家”,让种地更聪明——AI赋能千行百业一线故事(十七)11月14日,雄安新区都市农业科技博览园温室大棚内,工作人员查看番茄长势
2025-11-25 08:41:00
荣耀加冕!锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒店100强
2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上
2025-11-25 09:25:00