新论,推理,符号,性能,任务,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下，希姆计算的大模型一体机能支撑企业将基座模...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

化学：强化归类研究明确命题追求

...生在“宏微结合”“变化平衡”等思想观念指引下的证据推理、模型认知、科学探究与符号表征等能力素养状况以及科学态度、社会责任等个性品质与价值观念发展水平。这样的命题追求是指导并统领命题的行动指南。毫无疑问...……更多

2023-10-13 09:11:00归类,命题,化学,研究,试题,考查

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发，他们通过为 LLM ...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

支持1024帧、准确率近100％，英伟达「LongVILA」

...微调，(4) LLM 的上下文扩展，以及 (5) 长监督微调。对于推理，MM-SP 解决了 KV 缓存内存使用率的挑战，这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数，实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

微软研究院推出orca2llm

...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术，同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型，在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多

2023-11-22 11:08:00微软,研究院,研究,微软,模型,推理

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...湖大学工学院助理教授（研究）杨林易。o1 作为 OpenAI 在推理领域的最新模型，大幅度提升了 GPT-4o 在推理任务上的表现，甚至超过了平均人类水平。o1 背后的技术到底是什么？OpenAI 技术报告中所强调的强化学习和推断阶段的 Sca...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

openai发布多语言大规模多任务语言理解

...语言。其结构旨在评估模型在不同研究领域中需要常识、推理、解决问题和理解能力的任务中的表现。MMMLU的创建反映了OpenAI对测量模型实际能力的关注，尤其是在NLP研究中代表性不足的语言，纳入多种语言可确保模型在使用英...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

Anthropic再反击！发布Claude 3.5吊打GPT

...本Claude 3.5 Sonnet。从官方披露的测试数据来看，其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言，“太卷了，现在AI竞争是要以周为单位了吗？” 从官方介绍来看，Claude 3.5全家桶仍会有3款系列模型，分别...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第一。在腾讯全球数字生态大会上，腾讯公司副总裁、云与智...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

英特尔推出新款AI芯片：推理性能比英伟达H100快50%

...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型，以及1750亿参数GPT-3模型的训练时间。英特尔表示，Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

谷歌DeepMind推Imagen2；ChatGPT Plu

...科学人物，表彰其在ChatGPT开发中的核心作用。OpenAI发布新论文，探讨用小模型监督大模型的方法，为未来超人类AI对齐工作提供支持。Key PointsRunway宣布开展通用世界模型研发Mistral AI发布专家混合模型Mixtral 8x7B微软发布27亿参数...……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、

... 2此次提供的90亿（9B）和270亿（27B）参数的两个版本，其推理性能和效率均优于第一代，并具有显著的安全性改进。事实上，270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争，并且提供了此前只有专有模型才能实...……更多

2024-06-29 09:37:00诚意,经济,模型,训练,性能,注意力

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...的任务对应套件，包含总结、感知（回忆、跟踪）、视觉推理（空间、时间、预测、因果、反事实）和导航（房间到房间、对象检索）任务，共18个子任务。其中，总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

...The」。完整的回复，花了整整20个小时熟悉模型的训练和推理的朋友都知道，这些事情一点都不奇怪。集群搭建（GPU配置、网络设计、轨道优化等）、集群管理（实时监控、故障排除等）……个个都是「拦路虎」。对于缺乏相关...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学