提速,推理,显卡,微软,模型,性能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

NVIDIA RTX显卡AI推理提速5倍！

...理性能可以跑到每秒319tokens，相比其他后端的每秒61tokens提速足足4.2倍。RTX4090则可以从每秒tokens加速到每秒829tokens，提升幅度达2.8倍。基于强大的硬件性能、丰富的开发生态、广阔的应用场景，NVIDIARTX正成为本地端侧AI不可或缺...……更多

2023-11-16 20:13:00提速,推理,显卡,微软,模型,性能

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

有CPU就能跑大模型，性能甚至超过NPU/GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比，不仅能让端侧模型跑得更快，而且资源消耗量更少。咋做到的？？在CPU上高效部署低...……更多

2024-08-10 09:52:00新技,微软,提速,新技术,模型,手机

面壁智能的端侧大模型面壁MiniCPM正式亮相

...大的底层支撑，先是算力方面，凭借全流程高效infra10倍推理加速，能够将成本降低90%；其次在算法方面，面壁模型通过高效模型训练配置实现模型能力快速形成；数据处理方面，凭借现代化数据工厂形成从数据治理到多维评测...……更多

2024-02-01 21:36:00模型,智能,模型,智能,用户,数据

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

微软研究院推出orca2llm

...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术，同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型，在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多

2023-11-22 11:08:00微软,研究院,研究,微软,模型,推理

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

专家模型不要专家并行！微软开源MoE新路径

...好，所以要在左上角： GRIN作为MoE架构，总参数量约42B，推理时激活的参数为6.6B，打同级别（7B）的非MoE模型是手拿把攥，甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中，GRIN MoE表现优异，尤其是在编码和数学测试中。...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

为AI推理和专业工作站量身定制英特尔锐炫Pro B60/B

...炫Pro B系列，包含锐炫Pro B60和锐炫Pro B50 GPU，搭载了为AI推理和专业工作站量身定制的配置，扩展了英特尔锐炫Pro产品系列。英特尔CEO陈立武表示：“借助Computex这一机会，英特尔将继续强化对合作伙伴的承诺，建立面向未来的全...……更多

2025-05-20 22:49:00英特,英特尔,专业,工作站,推理,显卡

Dmine币与NVIDIA、Intel生态深度融合，优化GP

...DA加速与InteloneAPI异构计算技术，提升显卡运行效率，让AI推理更快、更节能。Dmine币如何优化NVIDIAGPU算力？1.CUDA加速，提高DeepSeekR1推理性能Dmine币集成CUDA并行计算技术，使RTX4090在DeepSeekR1推理速度提升40%，大幅降低延迟：T……更多

2025-03-19 21:02:00深度,生态,推理,显卡,任务,运行

intelarca770升级改进ai大模型

IntelArc锐炫虽然初入独立显卡市场，但表现可圈可点，尤其是随着驱动的不断优化，各方面性能都在持续突飞猛进，包括游戏，包括AI。比如最高端的ArcA770，不但集成XMXAI加速功能，还拥有16GBGDDR6大容量显存，非常适合做生成式A...……更多

2023-11-21 13:03:00模型,升级,性能,驱动,显卡,微软

AI芯片下半场：英伟达不再一家独大

...）”的新AI芯片组，目的是为ChatGPT等大语言模型的训练及推理提供英伟达芯片之外的替代方案。另据Tom’s Hardware消息，Athena使用的是台积电5nm工艺，专为大语言模型训练设计。曾有知情人士透露，在开发Athena期间，微软为了满...……更多

2023-11-16 23:46:00英伟,芯片,一家,芯片,英伟,微软

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

空间压缩术：英特尔携生态伙伴推出高性能双卡工作站

...的魔术一般，让小巧紧凑的产品组合，也能释放出色的AI推理算力。方寸之间，GPU显存密度的突破相比于千年前荔枝的“冷链”难题，英特尔更聚焦于“方寸之间”如何巧妙组合。当前主流工作站体积普遍维持在50升左右，虽小...……更多

2025-07-23 20:19:00英特,英特尔,工作站,高性能,生态,伙伴

推理性能飙升1.5倍！微软疯狂下单GB200芯片提升其AI算

...，新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外，微软还计划在低温数据中心部署GB200服务器，以缓解冷却系统的潜在压力。其他云服务提供商订单量则显著低于微软，如亚马逊在2...……更多

2024-10-20 11:52:00微软,推理,芯片,性能,疯狂,微软

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

...。Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

DeepSeek“朋友圈”不断扩围：10家国内外云厂商宣布接

...eepSeek-R1。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等。截至2月5日，国内外已有众多云平台宣布上线DeepSeek- R1大模...……更多

2025-02-06 07:23:00家国,接入,不断,厂商,朋友,用户

3天把Llama训成Mamba，性能不降，推理更快！

...Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于到底能不能其乐融融，咱就不管了，之所以有此场景...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

微软紧随英伟达发布芯片，老黄还不慌吗？

...可以加快数据处理速度，尤其是在语音和图像识别方面。提速的关键，自然是算力。为了提升算力，微软也是下了血本：采用台积电的5nm制程工艺，晶体管数量达到1050亿个。和今年4月被曝光的信息相比，Maia的制程工艺、设计架...……更多

2023-11-23 09:36:00老黄,英伟,微软,芯片,芯片,英伟

微软宣布Team Copilot发布，年内将推出初步预览版

...电脑，二是在信息日益增加的世界，电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为，现在这波AI浪潮能为微软找到实现这两大梦想的答案。随后，Nadella聚焦Copilot。纳德拉提到了包含随时可用本地API...……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能

收入占比40%、电话会议点名16次，英伟达：推理端的需求被低

...让人印象深刻的是，英伟达在财报电话会议的一个观点：推理端的爆发，可能很多人还是低估了。据英伟达电话会议披露，公司全年数据中心里已经有40%的收入来自推理业务，超出了绝大部分人预期。而在这次财报电话会议里，...……更多

2024-03-02 13:38:00英伟,电话会议,推理,收入,需求,端的

阿里最新开源推理模型发布：性能比肩DeepSeek-R1

阿里通义发布最新开源推理模型，称其性能比肩DeepSeek-R1。3月6日凌晨，阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩De...……更多

2025-03-06 13:22:00阿里,推理,模型,性能,模型,通义

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

英伟达宣布rtx系列显卡支持微软copilot+计划

...划，宣告了其拥抱人工智能的决心。英伟达宣布其RTX系列显卡将大力支持微软的全新Copilot+计划，该计划旨在为Windows11系统带来一系列强大的本地化功能。IT之家注意到，首批适配的设备包括来自华硕的五款笔记本电脑以及来自...……更多

2024-06-03 09:24:00英伟,微软,显卡,支持,英伟,功能

PC迎来AI时刻，英特尔、微软、联想等纷纷布局，产品价格将迎

...算力是上一代的8倍，可在PC上实现高能效的AI加速和本地推理，并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步，上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU，算力为16TOPS，AI性能相比上一代提升...……更多

2023-12-12 16:27:00英特,英特尔,微软,布局,时刻,价格

RTX 40系GPU AI性能首测

...RTX40系列多款型号的显卡、笔记本电脑GPU在StableDiffusion的推理性能表现，其中在ULBenchmarkSD1.5TRTvs.OpenVINO的对比测试中RTX4090笔记本电脑GPU相对于Arc核显有超过27倍的性能提升。使用吐司基准测试完整LoRA模型在StableDif……更多

2024-05-04 17:17:00性能,生成,测试,创作,火星,图片

AMD MI300绝杀英伟达H100？跑GPT-4性能超25

...，因此它们一直被诟病生成的回答是基于概率，而非基于推理。这也就意味着，在当前的AI热潮中，这些模型架构可能无法幸存下来。毕竟，由于发展速度太快，如今的LLM寿命相对较短。昨天还炙手可热的模型，一两周后可能就...……更多

2023-11-06 15:12:00英伟,大决战,芯片,性能,英伟,芯片

o3 压台登场：OpenAI 卷动推理 AI 模型风云，迈向

...enAI 的 o3 系列大模型压台登场，官方称在某些场景下，其推理能力非常接近通用人工智能（AGI）。名称最新的 AI 模型为何跳过 o2，叫做 o3 呢？OpenAI 公司首席执行官山姆・阿尔特曼（Sam Altman）在今天早上的直播活动，表示是为...……更多

2024-12-21 09:17:00巅峰,推理,模型,风云,模型,测试

微软发布Azure ND H100 v5虚拟机

...比上一代虚拟机性能更强大，可显著提升AI模型的训练和推理速度。同时，微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外，NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术，每个GPU可提供400Gb/s的带...……更多

2023-11-21 20:20:00微软,英伟,微软,模型,带宽,速度