推理,模型,极限,突破,学习,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

商汤科技发布日日新5.0大模型

...法不准确。同时，它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现，得益于其最新发布的日日新5.0版本大模型。记者了解到，自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

我国农业科技领域AI应用获重要突破 “神农大模型1.0”发布

...问答、农业文本语义理解、文本摘要生成、农业生产决策推理等多项功能。与会专家表示，这标志着AI应用在我国农业领域获重大进展，标志着由高校及科研院所研发的行业大模型又添新军，对我国以科技驱动农业现代化发展将...……更多

2023-12-31 09:21:00神农,农业科技,模型,突破,领域,我国

“上天”“入地”“下海” AI驱动中国科学创新加速前行

...主研发了首个专注于气候变化适应领域的水-能-粮多模态推理大模型——洛书。该模型集成训练并整合了科研人员自主研发的可解释AI驱动水能耦合模型“思源”，通义千问最新推理模型Qwen-QwQ和通义千问多模态大模型Qwen2.5-VL。...……更多

2025-03-21 16:54:00中国科学,中国,驱动,科学,模型,珊瑚礁

突破数据墙！27岁华裔MIT辍学创业8年，年化收入逼近10亿

...的合同工进行人工标注。他强调，来自专家的、包含复杂推理的数据是未来人工智能的必备条件。传统的数据来源，比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程，模型先输出一些内容，例如撰写研...……更多

2024-09-26 13:37:00华裔,收入,突破,创业,数据,数据

作业帮全系产品接入DeepSeek，与自研大模型实现深度整合

...智能硬件、智能图书、教育数字化等业务场景中正式接入推理大模型DeepSeek-R1，与自研作业帮大模型实现深度整合。后续，作业帮将进一步提升学习和推理模型的能力，适配不同的教育场景，为用户带来更优质的个性化学习体验...……更多

2025-02-13 19:48:00接入,深度,模型,作业,整合,产品

OpenAI没有放弃的机器人梦想

...人团队，理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据，研发受到了阻碍。当时，在美国创业孵化器Y Combinator的论坛上，BuzzFeed数据科学家马克思·伍尔夫（Max Woolf）直言：“一种可能准确但带有讽刺意味的观...……更多

2024-03-18 10:00:00机器人,机器,梦想,机器人,机器,模型

奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测

...级智能的关键一步。它被指具有这些特性，比如在数学和推理能力方面有很大的提升，突破了人类数据的限制，可以自己生产巨量训练数据，有自主学习和自我改进的能力等等。在草莓项目正式被曝光的前几天，OpenAI科学家Noam B...……更多

2024-08-08 15:11:00奥特,奥特曼,一波,实测,竞技场,草莓

紧抓AI智能体爆发元年机遇推动新质生产力加快发展

...了大模型的幻觉，人工智能才得以在各场景中广泛应用。推理大模型涌现出让人惊叹的深度思考能力，它将推动人工智能的一个重要应用方向，即“AI智能体”的落地，2025年可能会成为AI智能体爆发的元年。原生多模态大模型，...……更多

2025-03-09 14:03:00生产力,机遇,智能,生产,发展,人工智能

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源

...在其在线 Demo 的模型选项中已有暗示 —— 其中包含开放推理模型甚至 AGI 和 ASI 的潜在选项。看起来这确实是一个雄心勃勃的团队。模型发布后，虽也有质疑声音，但 AI 社区总体上还是给出了非常积极的肯定。机器之心也用几...……更多

2024-12-03 13:34:00三洲,欧亚,开发者,模型,流程,训练

清华团队提出新型光计算架构，光训练速度提升1个数量级

...智能计算的“潜力股”，为后摩尔时代带来新的希望。推理和训练是 AI 大模型核心能力的两个重要阶段，正是看到了这一点，该团队在推理和训练方面进行了同期的并行研究。今年 4 月，他们在 Science 报道了通用智能光计算芯...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

...著提升，而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此，有人认为，新的扩展律 —— 后训练扩展律（Post-Training Scaling Laws）已经出现，并可能引发社区对于算力分配、后训练能力的重新思...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

中国首个音乐SOTA模型「天工音乐大模型」今日公测

...全球最大的开源MoE大模型。「天工3.0」在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升，数学/推理/代码/文创能力提升超过30%。（天工3.0模型参数超越Grok-1，成全球最大开源MoE...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

国产大模型第一梯队玩家，为什么pick了CPU？

...占绝对大头的因素——算力。现在提及大模型的训练和推理，很多人的第一反应或许就是想到了GPU。诚然GPU在高性能上占据着一定的优势，但它所存在“硬伤”也是比较明显，那便是供应不足、价格昂贵。何以破局？国产大模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

唯一全国产算力训练！讯飞星火深度推理模型X1正式发布：多项指

...天的新品发布会上，科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1，这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍，与通用大模型相比，X1的解题过程更接近人类的“慢思考”方式，并且...……更多

2025-01-15 10:24:00讯飞,星火,推理,深度,模型,指标

首发！优刻得云平台上新DeepSeek-V3-0324模型

... 不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude3.5/3.7Sonnet相媲美。同时，模型的开源协议升级为更宽松的MIT许可，进一步降低了商业应用门槛。优刻得云平台始终密切关注A...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

依托数据、平台、知识增强等优势夸克大模型降低问答幻觉率

...夸克大模型具备较好的语义理解、知识掌握与应用、逻辑推理能力。在大模型技术落地层面，夸克大模型的能力体现在四个方面，可以帮助用户提升工作、学习效率。知识能力，拥有广泛的知识覆盖、信息搜集和多语言支持等，...……更多

2023-11-23 11:11:00夸克,幻觉,模型,问答,优势,知识

大江东｜在首届浦江AI学术年会，感受人工智能加速跑

...，“我希望通过因果智能研究，让大模型今后拥有强大的推理能力，能够从大数据中发现数据之间的因果关系，这样就能形成新的知识。”“我们正在把大模型和因果推理方法联系起来，让大模型去寻找纷繁复杂世界中的因果关...……更多

2024-12-24 15:57:00浦江,人工智能,大江,年会,人工,首届

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

DeepSeek，这条诞生在杭州的“鲸鱼” 这几天在全球科技

...月后，DeepSeek-R1开源模型面世，在数学、代码、自然语言推理等任务上，性能比肩OpenAI o1正式版。整件事最为传奇的地方在于，DeepSeek-V3的训练成本不到竞争对手的十分之一。Deepseek-R1的训练成本虽然没有公布，但它的收费却只有...……更多

2025-01-28 07:53:00鲸鱼,巨浪,杭州,资本,全球,科技

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根据所遇到的信息灵活调整研究方向。值得注意的是，在对这个智能体的能力评测中，OpenAI特...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...行评分。最后，强化微调加强了模型在处理领域问题时的推理能力，并提升了在特定任务上的准确性。对于那些要求高精确性和专业知识的领域，强化微调将会发挥至关重要的作用。从OpenAI的官方演示中不难看出，强化微调的效...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

1-bit大模型还能再突破！新一代BitNet架构启用4位激

...为可以吃到4位（INT4/FP4）内核的计算红利，实现了更快的推理速度。BitNet a4.8仅激活55%的参数，并支持3 bit KV cache，进一步提升了大规模LLM部署和推理的效率。BitNet a4.8模型架构模型的整体架构如图1所示，BitNet a4.8采用了与BitNet b……更多

2024-12-06 09:55:00架构,激活,新一代,模型,突破,激活