推理,性能,再次,重点,模型,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...达1000AITOPS处理能力和128GB统一内存，实现无缝模型开发和推理先进架构：NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术，可有效提升AI工作负载扩展互联：配置为独立或私有云系统，以在桌面上驱动AI……更多

2025-03-31 08:42:00华硕,方寸,隆重推出,之间,计算机,模型

打乱/跳过Transformer层会怎样？最新研究揭开其信息

...被展示过了，但我喜欢你添加的新细节，特别是强调了“推理”类任务比其他任务受影响更大！还有不少学者、工程师也表示强烈推荐。敢打赌，其中一些见解最终将会用于改进Transformer。其中的实验再次证实了：复制层对创...……更多

2024-07-27 09:29:00流动,机制,研究,信息,中间层,顺序

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...比，苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升，并预计在Trainium 2上预训练模型时，效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic，宣布与AWS共同构建面向机器学习训练...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

AI推理速度提升超10倍，Groq LPU能否取代英伟达GP

...美国人工智能初创公司Groq最新推出的面向云端大模型的推理芯片引发了业内的广泛关注。其最具特色之处在于，采用了全新的Tensor Streaming Architecture (TSA) 架构，以及拥有超高带宽的SRAM，从而使得其对于大模型的推理速度提高了1...……更多

2024-02-21 14:03:00英伟,推理,速度,加速卡,内存,芯片

一文读懂黄仁勋CES重磅发布：最新5090芯片、世界最大AI

...成式AI可以生成图像、文本和声音，现在还有可以感知、推理、规划和行动的AI代理（AI Agent），以及物理AI。“2018年谷歌发布了Transformer，这完全改变了AI的格局，甚至完全改变了整个计算的格局。”黄仁勋表示，AI不仅仅是一个...……更多

2025-01-07 19:00:00一文,世界,重磅,芯片,模型,计算机

英特尔第五代至强可扩展处理器发布：AI推理性能提升42%！

...器，相比上代至强平均性能提升了21%，能效提升了36%，AI推理性能提升了42%，总拥有成本降低了77%！最高64核心，整体性能提升21%、AI推理性能提升42%、总拥有成本降低77%！据介绍，第五代至强（Xeon）延续了上代的Intel 7制造工...……更多

2023-12-16 13:49:00英特,英特尔,推理,处理器,性能,处理

刚刚，Llama 3.2 来了！支持图像推理，还有可在手机上

... Meta 对 Llama 模型来了一波大更新：不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型，还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此，Meta 还正式发布了 Llama Stack Distribution，其可……更多

2024-09-27 13:42:00推理,可在,图像,运行,版本,支持

对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

...前AI行业快速发展，竞争也越来越激烈，特别是各种高级推理模型之间的竞争。过去一段时间，中国科技公司陆续发布了3款自研的AI模型，分别是DeepSeek（深度求索）的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多

2024-12-04 09:48:00大佬,科技界,美国,模型,两个,小时

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

...达14.3%，显著高于DeepSeek-V3的3.9%，也远远超过行业的其他推理模型，比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符，或偏离用户指令的现象，会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多

2025-03-05 15:54:00东岩,幻觉,北大,对话,用户,模型

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...容生成的一致性和可控性； 5.算力适配通用化，在模型推理运行方面，针对重点行业客户应用，与多家国内外算力厂商的产品适配，形成了算力模型一体化产品； 6.模型进步持续化，为保障技术的持续领先，开普云将不断完善...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

为AI推理和专业工作站量身定制英特尔锐炫Pro B60/B

...炫Pro B系列，包含锐炫Pro B60和锐炫Pro B50 GPU，搭载了为AI推理和专业工作站量身定制的配置，扩展了英特尔锐炫Pro产品系列。英特尔CEO陈立武表示：“借助Computex这一机会，英特尔将继续强化对合作伙伴的承诺，建立面向未来的全...……更多

2025-05-20 22:49:00英特,英特尔,专业,工作站,推理,显卡

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

谷歌发布gemma2大语言模型，共有两种大小

...亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示，Gemma2-27B模型的性能媲美两倍规模的主流模型，而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

国产大模型首发中文逻辑推理，「天工大模型4.0」o1版来了

...去，如此自信的原因可能在于最近人们让大模型学会了「推理」的方法。就在 9 月份，OpenAI 正式公开前所未有的复杂推理大模型 o1，这是一个重大突破，新模型既具有通用的能力，也可以解决比此前的科学、代码和数学模型能...……更多

2024-11-28 10:00:00模型,逻辑推理,中文,推理,逻辑,国产

搞医学影像，为什么都青睐于CPU？

...ACS/RIS产品中，就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下，融合影像分析等技术，让医务人员通过旋转、缩放、分割、图像增强等操作，从多角度清晰了解到医学影像中各结构之间的空间位...……更多

2024-06-02 15:41:00医学影像,影像,医学,英特,英特尔,三维

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

...mazon Nova Premier：亚马逊最强多模态大模型，可处理复杂的推理任务，也可用于蒸馏客户定制化的模型。在现场，Andy也晒出了Amazon Nova在CRAG、BFCL、VisualWebBench和Mind2Web等Benchmarks上取得的分数。从成绩中不难看出，其在检索增强……更多

2024-12-05 09:45:00模态,一口,芯片,模型,一口气,亚马

LLM仍然不能规划，刷屏的OpenAI o1远未达到饱和

...模型，一举创造了很多历史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力，相比 GPT-4o 有巨大提升，让大模型的上限从「没法看」直接上升到优秀水平，不专门训练直接数学奥赛金牌，甚至...……更多

2024-09-25 09:48:00饱和,规划,模型,测试,规划,能力

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

京东云：智能体大规模“上岗”，企业深度应用正当时

...模型一体机软硬协同，支持千人规模企业并发需求，实现推理速度提升50%，满血版、标准版、轻量版为不同规模企业提供灵活选择，助力企业快速构建企业级AI服务能力，极大降低专业技术门槛。今天，京东云正式发布三大垂直...……更多

2025-05-20 14:47:00京东,大规,大规模,深度,智能,应用

精准狙击Llama 3.1？Mistral AI开源Larg

...l Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后，Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来，而这一模型的特点是 ——「足够大...……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成