推理,模型,成本,模型,团队,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

开源版OpenAI再出「神作」，小模型吊打Llama 3！Ministral系列问世，边缘AI革命开启

...持高达128k上下文（目前在vLLM上为32k）。在知识、常识、推理、函数调用、效率等方面，为低于10B参数模型设立了新标杆。而且，Ministral 8B还有配备了滑动窗口注意机制（sliding-window attention），以实现更快和内存高效的推理。不...……更多

2024-10-23 09:56:00模型,边缘,革命,模型,指令,性能

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根据所遇到的信息灵活调整研究方向。值得注意的是，在对这个智能体的能力评测中，OpenAI特...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

谷歌 VS OpenAI：当搜索霸主和屠龙少年迈入同一条河流

...tra 的得分高达 90.0%，超过GPT-4的86.4%。同时，Gemini Ultra 在推理、数学、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型，在一系列多模态基准测试中，对标GPT-4V，Gemini Ultra 也展现出了先进的性能。图源：谷歌新...……更多

2023-12-08 11:02:00霸主,河流,少年,搜索,模型,模态

字节、阿里云、百度大模型价格混战：低价背后是数据竞争，爆款尚

...云事业部总裁刘伟光表示：“阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。我们预计2024年大模型API的日调用次数有望突破100亿。”上周，字节跳动刚刚高调入局大模型战场，豆包主力模型在企业市场的定价...……更多

2024-05-22 07:41:00阿里,字节,模型,尚未,背后,竞争

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率，研究者想出了多种多样的方法，但其中很多都会让模型牺牲一些准确度。近日，苹果和 Meta AI 的一个研究团队提出了一种新方法，可在保证准确度不明显下降的...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...被展示过了，但我喜欢你添加的新细节，特别是强调了“推理”类任务比其他任务受影响更大！还有不少学者、工程师也表示强烈推荐。敢打赌，其中一些见解最终将会用于改进Transformer。其中的实验再次证实了：复制层对创...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

DeepSeek大胆披露：理论利润率高达545%！

...平台开设了其官方账号，并发布了一篇名为《DeepSeek-V3/R1推理系统概览》的技术文章。在这篇文章中，DeepSeek首次向公众详细公布了其模型推理系统的优化细节，同时披露了成本利润率的关键信息。据文章介绍，DeepSeek在推算成本...……更多

2025-03-01 15:08:00利润率,高达,利润,理论,价格,成本

DeepSeek开源周才第二天有些公司就已经坐不住了

...了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ，还是个推理模型和传统模型的 “ 混血 ” 。我估计今天那些专门做模型测评的博主，都快要忙不过来了吧。。。再加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜到了今年推理模型必有...……更多

2025-02-26 08:04:00二天,公司,模型,推理,阿里,通义

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...”薛娇说。QASC挑战赛是美国艾伦研究所推出的一项常识推理阅读理解任务，它的挑战性在于不仅要求机器能够理解和检索知识，还要求机器将检索到的知识进行组合推理，最终给出合理的答案。“最开始的测试中，我们的模型...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

联想王传东：2027年AI PC将成为市场主流

...下也能使用；第三，更低的大模型使用成本，以本地免费推理为主、以云端公共推理为辅，一次性购买AIPC即可享受全生命周期的本地免费推理服务；第四，可信、安全的个人数据和隐私保障，个性化本地知识库、隐私数据的本...……更多

2023-12-17 21:00:00王传,主流,市场,推理,服务,个人

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第一。在腾讯全球数字生态大会上，腾讯公司副总裁、云与智...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

谷歌王者归来？最新推出的大模型到底有多强，能否挑战GPT-4

...问题，这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源：官方视频谷歌还发布了一个时长六分钟的视频，展现了测试员和Gemini的一些有趣互动，其中包括让Gemini识别图片并用多种语言...……更多

2023-12-07 18:27:00王者,模型,模型,视频,微软,测试

ChatGPT 的 AI 搜索正式上线！即将免费可用，实测后

...内增加多模态、工具使用等新功能。Q：Sora 的推迟是由于推理所需的计算资源或时间，还是出于安全考虑？Sam Altman：我们需要优化模型，确保安全性、防止模仿以及其他方面的准确性，并且还需要增加计算能力！Q：o1 将如何影...……更多

2024-11-04 13:32:00实测,细节,搜索,模型,搜索,问题

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...很多不同的GPU型号和显存大小。再加上，目前广泛应用于推理阶段的量化技术，比如可以用FP16或FP8精度，这会改变推理和训练/微调成本的比重。以上这些限制因素，都让模型规模的选择成为一个非常具有挑战性的问题。总体而...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...例如，OCRBench）的性能，但与低分辨率版本模型相比，在推理相关任务（例如，MMMU）上的准确率却会下降。此外，虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果，但在纯文本任务上的性能却有显著...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

百度加码AI见效？一季度智能云营收增42%，文心4.5模型6

...动力是来自各行业对生成式人工智能和基础模型在训练及推理方面的需求激增。” 百度集团执行副总裁、百度智能云事业群总裁沈抖解释称，随着基础模型近期迭代加速，各类模型训练需求快速增加，得益于百度在AI基础设施方...……更多

2025-05-22 22:25:00文心,模型,智能,模型,文心,智能

商汤联合发布白皮书，首次提出新一代AI基础设施评估体系

...。AI2.0时代,需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地,其核心要素,如计算、存储、网络以及数据服务都要做精细化的设计和重构,而非简单的服务器或GPU实例堆砌。《白皮书》明确了新一代AI...……更多

2024-01-02 21:30:00商汤,白皮,白皮书,基础设施,新一代,评估

黄仁勋首次回应DeepSeek冲击波：市场理解完全反了，本质

...中国AI（人工智能）初创公司深度求索（DeepSeek）的开源推理模型R1“令人兴奋不已”，而市场对于R1的反应中存在一些误解，R1的发布本质上利好AI市场。黄仁勋表示：“我认为市场对R1的反应是，‘天哪，AI已经完了’。你知道...……更多

2025-02-23 08:49:00冲击波,本质,冲击,需求,市场,英伟

李开复：现在卖AI大模型的方式行不通，需考虑技术和业务成本、

...标化、定制重、交付重的商业模式；另一方面则是要考虑推理成本，能够帮助企业客户核算 ROI，在不赔钱的前提下做规模增长，是模型能力在 ToB 方向落地的基础。当前，中国大模型初创公司的应用生态和融资环境与美国有着一...……更多

2024-11-09 09:50:00李开复,模型,成本,客户,方式,业务

李开复：已进入“AI教AI”时代，AI通过慢思考具备了反思能

...而且目前看起来远没有触及天花板。与此同时，大模型的推理成本在以每年降低10倍的速度快速下降，这为AI-First应用爆发提供了非常重要的条件。”在技术层面，李开复认为，虽然预训练阶段的Scaling Law（缩放法则）的增长趋势...……更多

2025-03-31 22:50:00李开复,迭代,能力,时代,模型,李开复

中国电信何忠江发布千亿参数大模型

...表示，星辰语义拥有超12亿风格数据、训练显存降低50%、推理提速4.5倍；中文意象理解生成能力提升30%，语义细粒度生成效果提升25%。在创意提效方面，星辰语义生产时间较此前生产工具减少92%，设计成本下降了95%。"总体而言，...……更多

2023-11-11 16:50:00中国电信,中国,模型,参数,电信,模型

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

安谋科技下代“周易”NPU成功部署DeepSeek-R1：速

...的最高处理速度可达每秒40 tokens，并支持动态长度的模型推理输入。这也展现了安谋科技软件栈对大模型的成熟支持、深度优化，包括动态推理优化和硬件算力潜力的挖掘，从而显著提升推理速度和吞吐量。目前，软件栈已支持...……更多

2025-02-14 13:22:00周易,高达,速度,成功,科技,周易

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

...性能损失 5%，已经是业界最高水平。除了「多」，训练、推理也又「快」又「稳」。从发布到上线仅三个月，生数科技就完成了对 Vidu 的快速迭代。为啥这么快？因为百舸会把不同地点、不同规模、不同集群的算力统一管理起来...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

连云港唯一！悟空智算入围国家算力强基揭榜行动

...研发中心，专注于算法研发和模型调优，凭借自主创新的推理加速技术，对 DeepSeek全参数版进行软硬件协同深度优化，实现了每秒超6900 Token的超高吞吐率，性能远超行业平均水平，大幅提升了大模型效率。此次入围的算力强基...……更多

2025-06-19 10:06:00连云,悟空,连云港,行动,国家,悟空

深夜登顶，全网刷屏！来自杭州的DeepSeek震惊硅谷

...上。”不到一个月之后，今年1月20日，DeepSeek正式开源R1推理模型。据DeepSeek介绍，其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、...……更多

2025-01-27 11:33:00硅谷,杭州,全网,模型,中国,美国

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理