推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

DeepSeek开源惠四方（科技名家笔谈）

...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献，必须坚持历史视角，将其放在人工智能创新发展的...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

人工智能的第三支柱：数据存储

...周期，详细解读了AI管道六个阶段中数据从收集、训练到推理的存储细节。让我们简单了解一下人工智能数据周期的各个阶段。原始数据存档，内容存储：从各种来源安全高效地收集并存储原始数据，以用于训练模型。所收集数...……更多

2024-09-05 14:25:00人工智能,支柱,人工,存储,智能,数据

华为AI存储助力中国移动构建超大规模智算集群

...海量数据信息的投入。面对智算集群目前存在的可用度、推理体验等问题，华为推出业界首款AI存储——OceanStor A800，致力于成为支撑智算集群发展的关键基座。智算集群为千行万业发展新质生产力夯基筑石近年来，智能计算已...……更多

2024-12-19 18:16:00华为,集群,中国,中国移动,存储,规模

吴泳铭官宣3800亿投入后，阿里云如何打AI这场硬仗？

...发布新的模型，最重要的方向主要是两个，一个是Reasoning推理，一个是Omin全模态融合。”刘伟光提到。在应用方向上，这次大会，阿里云宣布推出AI Agent Store，从生成式AI向代理式AI发展，并表示将首先推动阿里旗下所有服务走...……更多

2025-04-10 17:12:00硬仗,阿里,投入,模型,阿里,模态

阿里推出全新推理模型：仅1/21参数媲美DeepSeek R

...况下，用强化学习实现了性能上的跨越。此外，阿里还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。QwQ-32B 在一系列基准测试中进行了评估，测试了数学推...……更多

2025-03-06 07:42:00阿里,推理,模型,参数,全新,能力

很强也很贵！OpenAI12天12场直播收官，官宣最新推理模

...，和网友猜测的一样，人工智能（AI）巨头OpenAI发布最新推理模型o3和o3-mini。前一天，OpenAI公司CEO山姆·奥特曼（Sam Altman）就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3？奥特曼表示是为了避免和英国电...……更多

2024-12-21 12:10:00推理,模型,直播,推理,模型,时间

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

连云港唯一！悟空智算入围国家算力强基揭榜行动

...研发中心，专注于算法研发和模型调优，凭借自主创新的推理加速技术，对 DeepSeek全参数版进行软硬件协同深度优化，实现了每秒超6900 Token的超高吞吐率，性能远超行业平均水平，大幅提升了大模型效率。此次入围的算力强基...……更多

2025-06-19 10:06:00连云,悟空,连云港,行动,国家,悟空

从线性注意力视角揭秘视觉Mamba,清华、阿里合作提出全新M

...模型的精度，同时保持了线性注意力优越的并行计算与高推理速度。论文链接：https://arxiv.org/abs/2405.16605 代码链接：https://github.com/LeapLabTHU/MLLA 视频讲解：https://www.bilibili……更多

2024-12-11 09:53:00阿里,清华,线性,视角,注意力,模型

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

大模型推理与训练的边界之争

随着大模型的发展日新月异，其推理和训练的边界问题也引起了广泛讨论。近日，清程极智CEO汤雄超在一场行业活动中明确表示，尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限，但从技术角度来看，这两个阶段...……更多

2024-11-07 20:18:00边界,推理,模型,训练,推理,模型

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

百度智能云两大基础设施再升级！打造AI时代最开放的智能基础设

...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点：推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力，实现算力性能与成本的双重突破。本次大会...……更多

2025-04-25 16:27:00基础设施,设施,智能,基础,升级,开放

阿里AI三连发，连夺三项第一

7月25日，阿里巴巴全新开源千问3推理模型，性能大幅提升，一举夺下「全球最强开源模型」王座，比肩顶级闭源模型Gemini-2.5 pro、o4-mini。本周阿里已连续开源3款重磅模型，分别斩获基础模型、编程模型、推理模型等主流领域的...……更多

2025-07-25 21:34:00三连,阿里,模型,全球,阿里,推理

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

PyTorch官宣：告别CUDA，GPU推理迎来Triton

...PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与...……更多

2024-09-07 09:48:00新时代,推理,内核,矩阵,乘法,英伟

阿里通义实验室黄斐：开源进入千问时代，即将发布的推理模型会更

...开源模型系列，将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日，全球开发者大会（GDC）在上海开幕，在阿里云魔搭社区主办的论坛上，据阿里巴巴通义实验室科学家黄斐介绍，到目前为止，整个通义千问（Qwen）系列...……更多

2025-02-21 23:22:00通义,阿里,推理,实验室,模型,实验

英伟达地表最强，黄教主被称作AI界“霉霉”

...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说，它就是“当今世界上最...……更多

2024-03-19 11:56:00英伟,地表,教主,英伟,模型,人工智能

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

算子开发到推理加速，一位00后开发者的“升级打怪”之旅

...框架降低了大模型训练的门槛，目前正在做大模型分布式推理加速，希望可以帮助其他开发者在生产环境中高效部署在线推理服务。在昇腾AI的生态里，像郑辉这样为大模型浪潮默默贡献自己力量的开发者不胜枚举。他们还不是...……更多

2024-04-27 19:00:00开发,算子,开发者,推理,之旅,升级

NeurIPS 2024 | 数学推理场景下，首个分布外检测

本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收，第一作者王一鸣是上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通...……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型