推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

AI算力大战开启：英特尔AI芯片性能超越H100，谷歌云推出最强ARM芯片｜钛媒体AGI

...中，相比于英伟达H100 GPU，Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%，平均性能提高 50%，能效平均提高40%，而成本仅为H100的一小部分。英特尔预计，Gaudi 3将于2024年第二季度起出货，戴尔、惠普、联想、超微电脑等...……更多

2024-04-10 11:22:00英特,歌云,芯片,英特尔,大战,性能

全新英特尔至强可扩展处理器，打破数智化变革瓶颈的一板利斧

...三代至强® 可扩展处理器通过扩展出bfloat16加速功能，在推理加速能力之外又加强了训练能力；而第四代英特尔® 至强® 可扩展处理器又带来了全新的加速引擎——英特尔® AMX，进一步提升深度学习训练和推理性能，同时更适合...……更多

2023-12-20 19:21:00英特,智化,英特尔,瓶颈,变革,处理器

科研也完了，AI暴虐170位人类专家！Nature子刊：大模

...读、科研的解决方案，其通用能力覆盖了专业考试、有限推理、翻译、解决数学问题，甚至还能写代码。已有的研究考察了大模型在科研领域的表现，但基准数据集大多属于「回顾性质」的，比如MMLU、PubMedQA和MedMCQA，主要以问...……更多

2024-12-09 09:50:00暴虐,准确率,模型,高达,完了,科研

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

你敢要它就有！至强6新品治好选择困难症

...及AMX这类为AI任务优化的加速器，不论是传统的神经网络推理，还是Transformer大语言模型推理的性能都相较上一代至强处理器有大幅提升。主流的200亿参数以下的中、小规模的模型在至强6上都可以顺畅运行，再得益于至强本身在...……更多

2025-03-24 15:46:00新品,困难,选择,性能,产品线,处理器

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...考虑到大模型和异构多芯发展趋势，为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片，飞桨与文心联合，在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说，动静统一的自动并行能...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...拥有一个AI Agent。“如果说2024年是大模型落地应用之年，推理就会越来越重要。此前在训练芯片市场上，英伟达一骑绝尘，占有绝对的市场占有率，那么今天，推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

昆仑万维重磅发布天工AI高级搜索功能，做最懂金融投资、科研学

...AI高级搜索功能，具备四大亮点：·全面升级多层次分析推理能力·升级的金融投资专业AI搜索·升级的科研学术专业AI搜索·针对文档AI阅读分析的智能优化「天工AI高级搜索」不仅能提供精准的结果，更能通过多角度的专业优化，...……更多

2024-11-05 14:56:00天工,万维,昆仑,科研学术,搜索,重磅

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

实测苹果M3 Ultra运行DeepSeek R1满血版：速

...着M3 Ultra在所有场景下都能超越A100，单用户进行单一模型推理时，主要依赖内存带宽和容量，无法完全发挥A100的潜力，在多用户推理和大模型训练场景下，M3 Ultra则完全无法与A100相提并论。此外，M3 Ultra在大语言模型推理速度测...……更多

2025-03-12 17:20:00实测,速度,苹果,运行,模型,速度

最快的N卡和最快的A卡跑DeepSeek谁更快：RTX 50

...A卡跑DeepSeek谁更快？最新消息显示，RTX 5090在DeepSeek R上的推理性能比AMD的 RX 7900 XTX快得多，性能至少翻了一倍。测试显示，在多个DeepSeek R1型号中，RTX 5090明显领先于RX 7900 XTX，也比RTX 4090快了不少。在Distil……更多

2025-02-02 15:10:00更快,模型,推理,文章,生成,消息

大模型价格战“卷”向何方？｜深度

...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制，推理时只激活部分专家，以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2，就是其通过架构创新，实现了大模...……更多

2024-05-25 10:34:00何方,价格战,深度,模型,价格,模型

字节发布豆包1.5深度思考模型：“实拍级”图像生成

...型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中，它能够精准高效地处理复杂问题；在创意写作等通用任务方面，同样表现出色。该模型采用MoE架构，总参数为200B，激活参数是20B ，相较于业界同类...……更多

2025-04-17 11:54:00豆包,字节,深度,生成,模型,图像

AI正加速迈进应用落地关键期

...V3.1通过软件定义与更多芯片适配，能让超低精度训练、推理在中国自研芯片上更容易实现。业内人士指出，DeepSeek—V3.1的UE8M0FP8Scale助力国产AI软硬协同，AI正加速迈进应用落地的关键期，在政企示范引领、软硬协同创新、AI基建...……更多

2025-08-27 09:14:00关键期,落地,关键,应用,国产,精度

对话贾扬清：明年AI推理成本还会降低10倍以上，一两年内AI

...比之前更加乐观。他认为，“成本不是核心问题，Token的推理成本可能在接下去的一年还会再降低十倍，甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下，可能就是一两年的时间。”他表示，“核心...……更多

2024-10-30 13:59:00扬清,成本,推理,人工,对话,扬清

大模型应用疯狂加速，洗牌却在静悄悄进行了

...大能力，分别为：文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力，并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量，科大讯飞也做了多方面的准备。一方面，科大讯飞积极展开与业内巨头的合...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

四月AI芯片三连发，英伟达：无惧竞争！

...接竞争。在AI模型算力中，Gaudi3AI芯片的模型训练速度、推理速度都更出色，分别提升了40%和50%，平均性能提升达到了50%，能效更是提高了40%。更重要的是，Gaudi3AI芯片的成本比H100更低，妥妥的性能更强，价格更低。▲IntelGaudi3VSN...……更多

2024-04-21 12:25:00三连,英伟,芯片,竞争,芯片,英特

阿里发布全球最强开源模型千问3 通义App第一时间已上线

...布的千问3开源模型包含8款不同尺寸，均为全新的“混合推理模型”，智能水平大幅提升的同时也更省算力。其中，千问3旗舰模型Qwen3-235B-A22B是一款混合专家（MoE）模型，该模型创下所有国产模型及全球开源模型的性能新高；而...……更多

2025-04-29 11:35:00通义,阿里,模型,全球,通义,模型

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...率基础上，并通过改进视觉指令数据集和SGLang，提升了“推理、OCR等方面的性能”，意味着人类向AGI（通用人工智能）探索的道路上又迈进了一步。LLaVA-1.6的研发团队成员Haotian Liu在X平台发文原文二、更适合中国人体质的GPT-4V...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

微软：从“软件老大”到“AI帝国”

...Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。这款芯片采用了 5 纳米工艺制造，拥有 1050 亿个晶体管。 Azure Maia 100 美颜照｜Microsoft微软自己的DPU——Azure Boost也已全面上市。微软在今年早些时候……更多

2023-11-21 10:45:00帝国,微软,老大,软件,微软,模型

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

...性能损失 5%，已经是业界最高水平。除了「多」，训练、推理也又「快」又「稳」。从发布到上线仅三个月，生数科技就完成了对 Vidu 的快速迭代。为啥这么快？因为百舸会把不同地点、不同规模、不同集群的算力统一管理起来...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理