推理,模型,思路,原理,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

香港金融科技周|度小满CEO朱光：推理大模型将深入到金融核心

...注的话题。度小满CEO朱光在科技周主论坛上表示，“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用，将从外围场景深入到核心业务，直接影响金融行业的核心决策质量，在为客户的产品和服务体验上带来巨大突...……更多

2024-11-21 13:55:00金融,香港,推理,模型,核心,业务

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

...SA 预训练的模型在一般基准、长上下文任务和基于指令的推理中保持或超过了全注意力模型。同时，NSA在64k长度序列的解码、前向传播和后向传播过程中实现比全注意力机制显著的加速，验证其在整个模型生命周期中的效率。“...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下，希姆计算的大模型一体机能支撑企业将基座模...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

...达14.3%，显著高于DeepSeek-V3的3.9%，也远远超过行业的其他推理模型，比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符，或偏离用户指令的现象，会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多

2025-03-05 15:54:00东岩,幻觉,北大,对话,用户,模型

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

大模型步入推理Scaling时代,SambaNova如何挑战

...震。o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外，更重要的是，它揭示了大模型...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

东大发布深度推理法律垂域大模型

实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯（记者何洁通讯员毕胜）近日，东南大学法学院数字法学团队依托东南大学大数据计算中心，正式发布国内高校首个深度推理法律垂域大模型—...……更多

2025-03-19 08:25:00东大,推理,深度,模型,法律,法律

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...CLM-Baseline取得了更高的平均分，且在ARC（小学生科学问题推理）、HellaSwag（常识推理）、MMLU等任务上表现更好。 “小”模型成新趋势回到开头，“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”，其中包含1...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

真香！智谱大模型，有了首个免费的API

...同时，GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度，以及更多并发请求，大大降低了推理成本。在此基础上发展出的 GLM-4-Flash，则带来了一系列技术优势：数据预训练：引入大语言模型进入数据筛选流程，使用 10...……更多

2024-08-28 09:43:00真香,模型,模型,能力,应用,开发

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...用混合专家架构，超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

超强AI来袭！OpenAI最新AI模型 “草莓”即将上线，推

...但其实这个模型的能力可不容小觑，它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道，“草莓” 模型将视为一种推理模型，这意味着它能够处理一些需要多步骤来完成的请求，比如解答难度较大的代数题，...……更多

2024-09-12 10:02:00推理,草莓,模型,能力,模型,草莓

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

亚马逊推出“自动推理检查”工具，对抗 AI 幻觉

...拉斯维加斯举办的 re:Invent 2024 大会上，AWS 推出了“自动推理检查”（Automated Reasoning checks）工具，该工具通过交叉引用客户提供的信息来验证模型的响应准确性。AWS 宣称，这是“第一个”也是“唯一”的针对幻觉的防护措施。...……更多

2024-12-05 10:41:00亚马,亚马逊,幻觉,推理,对抗,检查

$IDC：中国大模型推理市场爆发，九章云极以\\\$

IDC：中国大模型推理市场爆发，九章云极以\"普惠算力\"领

近日，IDC发布《2025中国大模型推理算力市场分析报告》指出，大模型与生成式AI的推理算力建设已成为当前产业发展的关键环节。报告预测，2024年中国生成式AI基础设施市场规模将达到2091.9亿元。九章云极凭借在AI基础设施市场...……更多

2025-08-08 20:05:00普惠,赛道,中国,推理,基础设施,模型

联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-

...想展示了其在端侧算力方面的最新创新成果 —— “联想推理加速引擎”。据了解，这款由联想、清华大学及无问芯穹联合研发的推理引擎，是专为高效AI PC推理而设计的软硬件协同优化平台，可以让一台普通PC的本地推理能力，...……更多

2025-05-07 11:10:00新技,推理,新技术,能力,推理,模型

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...次采取扩容等措施保证流量异常增高后的稳定，这对Kimi推理算力、成本等也构成挑战。实际上，长文本能力已是国内外大模型追逐热点。复旦大学计算机科学技术学院教授张奇对搜狐科技表示，很多大模型仅停留在长度和简单...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

华为联合WPS AI，见证昇腾大模型推理应用启航

...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践，共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多

2024-07-08 11:01:00华为,推理,见证,模型,联合,应用

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

OpenAI CEO承认了！DeepSeek非常棒不会起诉

...了业界对于“AI算力需求”的看法。特别是DeepSeek推出的推理大模型DeepSeek-R1，其不仅性能比肩OpenAI o1 ，并且其所需的训练成本可能只有后者的约1/20（仅用了2048 个 H800 GPU，花了两个月的时间训练完成，仅花费了约558万美元），AP...……更多

2025-02-04 13:41:00软银,奥尔,奥尔特曼,模型,特曼,日本

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...收涨14.2%，报7.4港元。消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山