推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

京东云：智能体大规模“上岗”，企业深度应用正当时

...模型一体机软硬协同，支持千人规模企业并发需求，实现推理速度提升50%，满血版、标准版、轻量版为不同规模企业提供灵活选择，助力企业快速构建企业级AI服务能力，极大降低专业技术门槛。今天，京东云正式发布三大垂直...……更多

2025-05-20 14:47:00京东,大规,大规模,深度,智能,应用

精准狙击Llama 3.1？Mistral AI开源Larg

...l Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后，Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来，而这一模型的特点是 ——「足够大...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

AI真·炼丹：整整14天，无需人类参与

...能上有着显著的增强，还结合大容量末级缓存使AlphaFold2推理过程中关键的张量吞吐获得了大幅提升。英特尔®至强®CPUMax系列处理器其次，由于AlphaFold2所采用的深度学习模型规模巨大，推理过程中的张量运算不仅量大，且维度...……更多

2024-07-01 19:47:00人类,英特,英特尔,制药,处理,处理器

Anthropic再反击！发布Claude 3.5吊打GPT

...本Claude 3.5 Sonnet。从官方披露的测试数据来看，其在逻辑推理、编程、数学等方面中的表现性能均超越GPT-4o。网友直言，“太卷了，现在AI竞争是要以周为单位了吗？” 从官方介绍来看，Claude 3.5全家桶仍会有3款系列模型，分别...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发，他们通过为 LLM ...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

「清昴智能」完成数千万元Pre-A+轮融资，做懂国产芯片的模

文 | 周鑫雨编辑 | 邓咏仪36氪获悉，AI推理部署解决方案厂商“清昴智能”近日完成了数千万元Pre-A+轮融资，启赋资本、达晨财智领投，老股东奇绩创坛跟投。此前，清昴智能已获得某世界500强科技巨头公司的千万元战略投资。...……更多

2024-06-03 15:23:00数千,融资,芯片,模型,国产,智能

英特尔推出新款AI芯片：推理性能比英伟达H100快50%

...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型，以及1750亿参数GPT-3模型的训练时间。英特尔表示，Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

DeepSeek“朋友圈”不断扩围：10家国内外云厂商宣布接

...eepSeek-R1。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。截至2月5日，国内外已有众多云平台宣布上线DeepSeek- R1大模...……更多

2025-02-06 07:23:00家国,接入,不断,厂商,朋友,用户

百川智能发布baichuan3稳定语言模型

...处理和代码生成领域的强大实力。不仅如此，其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4，是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多

2024-01-29 19:57:00百川,模型,语言,智能,模型,百川

2024　ASC世界大学生超级计算机竞赛启动

...13日在上海大学举行的总决赛。预赛赛题主要聚焦大模型推理优化和渗流数值模拟两个技术领域。当前,随着大模型开发和应用的快速发展,对大模型推理性能和成本的优化受到业界重视。本届大赛的大语言模型推理优化赛题要求...……更多

2024-01-05 01:38:00竞赛,计算机,大学生,大学,世界,模型

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...例如，OCRBench）的性能，但与低分辨率版本模型相比，在推理相关任务（例如，MMMU）上的准确率却会下降。此外，虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果，但在纯文本任务上的性能却有显著...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型，也是首个支持用单台409...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑

京东推出言犀大模型，从产业端切入大模型赛道 | 最前线

...流、健康、金融等行业的Know-How，同时具备100多种训练和推理优化工具。大会现场，京东演示了将通用大模型转化为健康产业大模型的操作。原本需要10余名科学家花费一周时间完成的工作，利用言犀AI开发计算平台，1-2名算法人...……更多

2023-07-13 17:03:00京东,模型,赛道,产业,京东,模型

腾讯Angel机器学习平台获世界互联网大会领先科技奖

...腾讯Angel 机器学习平台，突破了万亿级模型分布式训练和推理以及大规模应用部署等难题，率先实现大模型技术从底层硬件到关键软件技术的自主研发，在业务场景广泛应用，显著推动实体产业和数字经济发展，提升社会效率。...……更多

2024-11-21 14:04:00科技奖,腾讯,机器,领先,大会,互联网

图结构转文本序列，大模型直接读懂！图推理性能大涨

...和属性，如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现？机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法：图中心性（PageRank和度）、图退化（k-core分解）...……更多

2024-12-03 13:33:00序列,推理,模型,文本,性能,结构

智启新元年：PC成为AI落地首选终端

...了具备高性能计算能力的通用加速芯片，是大模型训练、推理的主要算力来源；云计算的发展和普及，则使软硬件充分解耦，大模型开发者可以以相对低的成本调用大规模的算力、存储和网络资源，开发进程大大加快；同时，Tra...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

ChatGPT大流行的思考-解析篇

...器人的本质区别。2. ChatGPT如何实现知识的获取、存储、推理及实时更新那究竟GPT如何有如此优秀的表现呢？我们不妨从人类学习思路入手，我们学习一般可分为获取知识-存储知识-推理知识-更新知识，而这也是GPT发展及学习的...……更多

2023-02-17 21:00:00知识,模型,推理,数据,方法,学习

字节猛踩油门

...型3.0、视觉理解模型，并推出OS Agent解决方案及AI云原生推理套件，用于企业客户构建与部署Agent应用。其中，豆包1.5深度思考模型作为字节首款推理模型，具备“边想边搜”能力，同时借助视觉推理能力，可以综合理解图片中的...……更多

2025-04-18 22:26:00油门,字节,模型,火山,引擎,豆包

李彦宏发布文心大模型4.0工具版，推理成本降到1%

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。“也就是说，客户原来一天调用1万次，同样成本之下，现在一天可以调用100万次。”此外，李彦宏在演讲中分享了百度...……更多

2024-04-16 13:37:00李彦,文心,推理,模型,成本,工具

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

微软研究院推出orca2llm

...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术，同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型，在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多

2023-11-22 11:08:00微软,研究院,研究,微软,模型,推理

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。随便上传一张图，...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

为AI加速而生英特尔第五代至强CPU带来AI新表现

...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多

2023-12-25 19:02:00英特,英特尔,英特,英特尔,处理器,处理

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

挑战Scaling Law，Meta发布移动端350M小模型

...做个假设，如果把GPT-4（大约有1万亿参数）以50tokens/s的推理速度部署在生活中，你需要什么样的硬件？答案是1亿个H100 GPU。别说是移动设备了，家里都放不下。那如果降低标准，用LLaMA-v2 7B这样的模型，再加上8-bit量化呢？简单...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

Meta连甩AI加速大招首推AI推理芯片 AI超算专供大模

...Meta当下正将这些基础设施进一步升级进化。01.Meta首代AI推理加速器7nm制程、102.4TOPS算力MTIA（Meta Training and Inference Accelerator），是Meta第一个针对推理工作负载的内部定制加速器芯片系列。AI工作负载在Meta的业务中中无……更多

2023-05-19 14:01:00推理,芯片,模型,训练,基础设施,基础