推理,模型,极限,突破,学习,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

AI 的“心智理论”难题：Meta ExploreToM 探

...单的预定义场景，无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集，为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性，以及高质量训练数据对于...……更多

2024-12-21 09:27:00之路,心智,难题,突破,理论,模型

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

讯飞星火X1全面升级领跑教育、医疗、司法行业应用

本文转自：人民网-安徽频道4月20日，科大讯飞深度推理大模型——讯飞星火X1迎来全新升级。作为当前业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答...……更多

2025-04-22 16:50:00讯飞,星火,行业应用,司法,升级,医疗

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...”薛娇说。QASC挑战赛是美国艾伦研究所推出的一项常识推理阅读理解任务，它的挑战性在于不仅要求机器能够理解和检索知识，还要求机器将检索到的知识进行组合推理，最终给出合理的答案。“最开始的测试中，我们的模型...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

...达14.3%，显著高于DeepSeek-V3的3.9%，也远远超过行业的其他推理模型，比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符，或偏离用户指令的现象，会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多

2025-03-05 15:54:00东岩,幻觉,北大,对话,用户,模型

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...Ovis在OpenCompass上的测评数据情况据介绍，Ovis能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如，Ovis可以准确回答数学问题，识别花的品种，支持多种语言的文本提取，甚至可以识别手写字体...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

DeepSeek开源惠四方（科技名家笔谈）

...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献，必须坚持历史视角，将其放在人工智能创新发展的...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

京东云发布八大领先智算产品，助力企业火速用上大模型

...云DeepSeek大模型一体机，通过自研的算力池化能力、智能推理加速引擎，充分融合软硬件，实现了性能的全面提升，推理速度提升50%，企业可以根据自己的需求灵活选择不同版本，开箱即用。目前，在河南鹤壁、江苏宿迁、山东...……更多

2025-02-27 14:14:00京东,模型,领先,产品,企业,京东

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...发力。一是在预训练的基础上加上强化学习，提高模型的推理能力。“强化学习还在早期，还会延续一长段时间。”第二个趋势是多模的理解生成一体化。李璟认为，文本领域已经实现生成理解任务的统一，语言模型的技术路线...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型

...现突破，于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM（Denoising Diffusion Implicit Robot Model）。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM（Denoising Diffusion Proba……更多

2024-11-25 09:49:00成都,人形,机器人,推理,模型,机器

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

不遥控的机器人来了！中国首个基于 3DSGs 的人形机器人

...工干预、无需遥控的自主完成跨空间人形机器人任务规划推理执行系统Raydiculous—1正式亮相。该系统在执行大空间和跨空间任务中拥有长视野（Long Horizon）推理规划能力，同时具备自主学习、处理跨场景任务的特性。是人形机器...……更多

2025-03-11 09:35:00机器人,机器,成都,人形,中国,推理

人形机器人会跳舞和空翻还不够？通用具身智能仿真平台“格物”发

...要打造多元异构人形机器人的预训练模型管理和具身智能推理系统软件等。许彬此前在接受媒体采访时指出，当前上海在技术创新层面已取得了诸多突破性进展，已初步搭建起完整产业生态，产业集聚效应逐步显现。不过具身智...……更多

2025-03-21 12:58:00空翻,人形,用具,机器人,仿真,不够

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

9月13日，OpenAI发布具有推理能力的人工智能模型“o1”，备受行业瞩目。o1通过模仿人类的思维过程，强化学习和“思维链”技术，引导模型自主解决问题。这一特点在解决复杂问题，尤其是在科学、编码和数学等领域，展现出...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型