提速,推理,显卡,微软,模型,性能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

ASC24超算大赛启动会在京举行，大模型推理等成为赛题

...在上海大学举行的总决赛。据悉，今年的赛题包括大模型推理优化、渗流数值模拟，以及国际通行基准测试HPL和HPCG等。来自高性能计算和人工智能领域的中国科学院院士、中国工程院院士、专家学者及参赛师生代表等参加了启...……更多

2024-01-07 19:35:00启动会,推理,模型,大赛,模型,上海大学

AI时代不甘落后：英特尔全新软硬件平台助力企业加速创新

...英特尔Gaudi3加速器在主流LLM中的训练时间平均提升了40%，推理速度提升了50%。并且Gaudi3加速器也可以根据客户的需求组件成计算集群，让AI性能成倍提升。目前包括戴尔、联想、超微等企业已经与英特尔达成合作，将会使用Gaudi...……更多

2024-04-16 14:08:00英特,英特尔,不甘落后,软硬,不甘,落后

ASML两款光刻机出口许可被撤销；比亚迪Q4纯电车销量超特斯

...备。（量子位）谷歌Gemini大逆转？斯坦福Meta华人证明其推理性能强于GPT-3.5斯坦福和Meta的学者进行了深入研究，证实了谷歌的模型Gemini在常识推理任务上并非落后于OpenAI的GPT模型。他们认为，之前基于有限数据集的评估未能完全...……更多

2024-01-03 15:09:00比亚,超特,斯拉,光刻,电车,销量

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下，希姆计算的大模型一体机能支撑企业将基座模...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

英伟达领投机器人公司；传微软即将发布 AI 芯片；日本对华水

...S 12 系统。（来源：IT 之家）消息称英伟达将推 RTX 4080 Ti 显卡，与 4080 同价10 月 7 日消息，据可靠爆料人「MEGAsizeGPU」消息，英伟达将在 2024 年初推出 RTX 4080 显卡的升级版，可能称为 RTX 4080 Super 或 RTX 4080 ……更多

2023-10-08 13:42:00英伟,微软,日本,机器人,水产,芯片

新智惠想智算机项目在高新区启动

...化、算子优化、集群网络优化提升国产GPU在大模型训练与推理场景中的性能，还能够适配国内外主流开源、商用大模型，降低客户在国产GPU上运行大模型的门槛与成本，加速大模型应用在政企市场落地，实现“一企一模型，一人...……更多

2024-05-20 10:00:00智惠,高新,高新区,项目,智惠,模型

英伟达宣布更新tensorrt-llm

...。英伟达将于本月晚些时候发布TensorRT-LLM0.6.0版本更新，推理性能提高5倍，并支持Mistral7B和Nemotron-38B等其它主流LLM。用户可以在8GB显存以上的GeForceRTX30系列和40系列GPU上运行，一些便携式Windows设备也能使用快速、准确的本地LLM……更多

2023-11-16 11:39:00英伟,更新,英伟,大会,支持,更新

谷歌 VS OpenAI：当搜索霸主和屠龙少年迈入同一条河流

...tra 的得分高达 90.0%，超过GPT-4的86.4%。同时，Gemini Ultra 在推理、数学、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型，在一系列多模态基准测试中，对标GPT-4V，Gemini Ultra 也展现出了先进的性能。图源：谷歌新...……更多

2023-12-08 11:02:00霸主,河流,少年,搜索,模型,模态

微软推出Surface Laptop Studio2维修教程

...4.4英寸的显示屏，分辨率为2400×1600，刷新率可达120Hz。在显卡方面，SurfaceLaptopStudio2根据版本不同分为英特尔集成显卡、NVIDIAGeforceRTX4050/4060/2000Ada三种不同规格。此外，该机还搭载了英特尔神经处理单元（NPU），这也是英特尔……更多

2023-11-18 20:48:00微软,维修,教程,英特,英特尔,微软

对话周鸿祎：ChatGPT像个油腻中年人

...拟，通过大模型的算力来模拟人脑对知识的记忆、理解和推理。以下为《中国企业家》对周鸿祎采访实录：ChatGPT太惊艳《中国企业家》：你是从什么时间开始关注ChatGPT的？周鸿祎：说起来大家可能觉得我在吹牛，但很早我就开...……更多

2023-02-22 18:00:00周鸿,油腻,中年人,对话,周鸿,智能

颜值高价格更便宜：iGame RTX 4080 SUPER

英伟达在CES 2024上发布了三款SUPER系列显卡，包括GeForce RTX 4070 SUPER、GeForce RTX 4070 Ti SUPER以及GeForce RTX 4080 SUPER，其中大家已经领略到了前面两款显卡的性能，平均性能提升幅度在8-10%，还是符合预期的，而今天……更多

2024-02-01 17:26:00显卡,评测,价格,显卡,测试,性能

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

...在MMLU（多任务语言理解）、Knowledge（知识）、Reasoning（推理）、Comprehension（理解）等关键指标上均超越了Meta Llama 2的13B模型。这一个故事，在2024年2月1日的发布会上，也被AI模型层公司面壁智能的CEO李大海不断提起。对标Mistral..……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

朱啸虎：AI的赚钱风向，彻底变了！

...怀疑 GPT-5 年底究竟能不能出来？即使出来了，相较GPT-4，推理能力上会不会在有显著提高？现在硅谷都说可能至少要十万张，甚至二三十万张 GPU 卡，才能看到显著的性能提升。但是即使你有卡，可能也没那么多可用来训练的数...……更多

2024-06-26 11:53:00啸虎,风向,模型,场景,数据,公司

谷歌发布gemma2大语言模型，共有两种大小

...亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示，Gemma2-27B模型的性能媲美两倍规模的主流模型，而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

Meta大模型LLaMA 3即将登场，参数量或达1400亿

...ok-1模型。根据Gemma和Grok-1的性能测试文档，它们在数学、推理、代码等多项基准测试方面的性能均超过了同规模的LLaMA2模型。截至目前，包括谷歌、xAI、MistralAI、DataBricks和StabilityAI等在内的多家科技公司发布了开源的大模型。有...……更多

2024-04-10 22:40:00模型,参数,模型,伯格,参数,扎克

高通发布新款云ai推理加速卡

近日，高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计，提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大，单张150W的卡上可部署100B参数模...……更多

2023-11-16 09:38:00加速卡,高通,推理,高通,加速卡,高通公司

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...展“人工智能+”行动等战略指引下，我国AI落地进程正在提速，推动更多行业迈向数字化、智能化转型升级，并带动以GPU为核心的智算中心的建设与发展。张建中坦言，GPU在整个计算服务器中的占比依然很低，不到10%，但未来这...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mist

...外，HuggingFace上还发布了7B模型的指令微调版本，在数学推理任务GSM8K上的性能实现大规模提升，分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本，1.4B版本也同步上线。神奇的是，训练数据量相比7B版本不……更多

2024-07-22 09:41:00血战,强势,模型,苹果,模型,数据

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

AMD最强AI芯片发布：性能是英伟达H100的1.3倍！

...争对手(H100)相当，并提供有竞争力的价格/性能，同时在推理工作负载方面表现出色。在功耗方面，AMDMI300X的额定功率为750W，比MI250X的500W增加了50%，比NVIDIAH200多了50W。ROCm 6.0开放软件平台AMD还推出了ROCm6.0开放软件平台，该最新...……更多

2023-12-07 22:24:00英伟,芯片,性能,性能,芯片,内存