巅峰,推理,模型,风云,模型,测试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

突发！谷歌发布史上最强大模型Gemini，打爆GPT-4

...们刚才所述，32个基准测试中拿下30个SOTA。其中，通用、推理、数学和编程等大方向的成绩如下表所示：△Gemini 在包括文本和编码在内的一系列基准测试中达到SOTA 在多模态方面，Gemini Ultra在新的MMMU基准测试中也获得了59.4%的SOT...……更多

2023-12-07 09:35:00突发,模型,模态,模型,基准,数据

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推

...于之前的预期。根据之前的报道，“草莓”是一款专注于推理的AI产品，预计于今秋发布。但这两位测试过该模型的人士称，OpenAI计划在未来两周内发布“草莓”。当然，最终的日期也可能生变。需要指出的是，虽然“草莓”是C...……更多

2024-09-11 09:50:00推理,草莓,模型,消息,草莓,模型

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

...果比较有限。因此该研究想要探明，在使用比较少的额外推理计算时，就能能让模型性能提升多少？他们设计了一组实验，使用PaLM2-S*在MATH数据集上测试。主要分析了两种方法：（1）迭代自我修订：让模型多次尝试回答一个问...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

安兔兔评测pc版正式发布，欢迎大家下载体验

...行效率进行评估，小到简单的数学运算，大到复杂的逻辑推理和大语言模型问答等多个方面，更加全面地展现CPU在不同AI应用中的表现。由于CPU属于计算机的核心部件，所以在AI处理中起着至关重要的作用。GPU测试部分，与CPU的...……更多

2024-10-04 00:33:00评测,体验,测试,模型,处理,电脑

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

...于复杂数据关系的理解能力，还赋予了其基于先验知识的推理与推断能力。这一过程实现了知识数据与大模型的深度融合与相互促进，使得机器能够更加精准地把握人类语言的深层含义，并在实际应用中展现出更高的精准度与鲁...……更多

2024-09-23 09:53:00算法,落地,模型,价值,科技,数据

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

LeCun 的世界模型初步实现！基于预训练视觉特征，零样本规

...常有限…… 无法理解物理世界，没有持续性记忆，不能推理（只要推理的定义是合理的）、不能规划。」Yann LeCun 批评 LLM 的推文之一相反，他更注重所谓的世界模型（World Model），也就是根据世界数据拟合的一个动态模型。比...……更多

2024-11-19 09:48:00样本,模型,特征,视觉,训练,规划

清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减5

...授团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多

2025-03-14 17:22:00清华,推理,模型,团队,成本,硬件

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

腾讯最强！混元自研深度思考模型T1正式发布：吐字快、能秒回

...了自研深度思考模型混元T1正式版，这是腾讯自研的最强推理模型。腾讯表示，T1不仅吐字快、能秒回，还擅长超长文处理。通过大规模强化学习，并结合数学、逻辑推理、科学和代码等理科难题的专项优化，混元T1正式版进一步...……更多

2025-03-22 00:29:00腾讯,深度,模型,推理,腾讯,模型

香港金融科技周|度小满CEO朱光：推理大模型将深入到金融核心

...注的话题。度小满CEO朱光在科技周主论坛上表示，“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用，将从外围场景深入到核心业务，直接影响金融行业的核心决策质量，在为客户的产品和服务体验上带来巨大突...……更多

2024-11-21 13:55:00金融,香港,推理,模型,核心,业务

高通发布新款云ai推理加速卡

近日，高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计，提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大，单张150W的卡上可部署100B参数模...……更多

2023-11-16 09:38:00加速卡,高通,推理,高通,加速卡,高通公司

安谋科技下代“周易”NPU成功部署DeepSeek-R1：速

...的最高处理速度可达每秒40 tokens，并支持动态长度的模型推理输入。这也展现了安谋科技软件栈对大模型的成熟支持、深度优化，包括动态推理优化和硬件算力潜力的挖掘，从而显著提升推理速度和吞吐量。目前，软件栈已支持...……更多

2025-02-14 13:22:00周易,高达,速度,成功,科技,周易

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

NeurIPS 2024 | 数学推理场景下，首个分布外检测

本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收，第一作者王一鸣是上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通...……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

实测苹果M3 Ultra运行DeepSeek R1满血版：速

...着M3 Ultra在所有场景下都能超越A100，单用户进行单一模型推理时，主要依赖内存带宽和容量，无法完全发挥A100的潜力，在多用户推理和大模型训练场景下，M3 Ultra则完全无法与A100相提并论。此外，M3 Ultra在大语言模型推理速度测...……更多

2025-03-12 17:20:00实测,速度,苹果,运行,模型,速度

AMD的GPU跑AI模型终于Yes了？PK英伟达H100不带

...：「算力这块，你可以用别的芯片，但是这些芯片用来做推理还 OK，做训练的话还要等几年的样子，英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案，比如在同一个演讲中，李沐还提到了...……更多

2024-09-05 09:49:00英伟,模型,英伟,内存,推理,性能

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出，数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...用混合专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...被展示过了，但我喜欢你添加的新细节，特别是强调了“推理”类任务比其他任务受影响更大！还有不少学者、工程师也表示强烈推荐。敢打赌，其中一些见解最终将会用于改进Transformer。其中的实验再次证实了：复制层对创...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

Anthropic再反击！发布Claude 3.5吊打GPT

...本Claude 3.5 Sonnet。从官方披露的测试数据来看，其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言，“太卷了，现在AI竞争是要以周为单位了吗？” 从官方介绍来看，Claude 3.5全家桶仍会有3款系列模型，分别...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

openai发布多语言大规模多任务语言理解

...语言。其结构旨在评估模型在不同研究领域中需要常识、推理、解决问题和理解能力的任务中的表现。MMMLU的创建反映了OpenAI对测量模型实际能力的关注，尤其是在NLP研究中代表性不足的语言，纳入多种语言可确保模型在使用英...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

谷歌终于赢了OpenAI一回：实验版本Gemini 1.5

...友对 Gemini 1.5 Pro (0801) 的内容提取能力、代码生成能力、推理能力等进行了测试，我们来看下他的测试结果。来源：https://x.com/omarsar0/status/1819162249593840110首先，Gemini 1.5 Pro (0801) 的图像信息……更多

2024-08-05 09:36:00版本,实验,模型,测试,能力,生成