提速,推理,显卡,微软,模型,性能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

NVIDIA RTX显卡AI推理提速5倍！

...理性能可以跑到每秒319tokens，相比其他后端的每秒61tokens提速足足4.2倍。RTX4090则可以从每秒tokens加速到每秒829tokens，提升幅度达2.8倍。基于强大的硬件性能、丰富的开发生态、广阔的应用场景，NVIDIARTX正成为本地端侧AI不可或缺...……更多

2023-11-16 20:13:00提速,推理,显卡,微软,模型,性能

手机跑大模型提速4-5倍！微软亚研院开源新技术，有CPU就行

有CPU就能跑大模型，性能甚至超过NPU/GPU！没错，为了优化模型端侧部署，微软亚洲研究院提出了一种新技术——T-MAC。这项技术主打性价比，不仅能让端侧模型跑得更快，而且资源消耗量更少。咋做到的？？在CPU上高效部署低...……更多

2024-08-10 09:52:00新技,微软,提速,新技术,模型,手机

面壁智能的端侧大模型面壁MiniCPM正式亮相

...大的底层支撑，先是算力方面，凭借全流程高效infra10倍推理加速，能够将成本降低90%；其次在算法方面，面壁模型通过高效模型训练配置实现模型能力快速形成；数据处理方面，凭借现代化数据工厂形成从数据治理到多维评测...……更多

2024-02-01 21:36:00模型,智能,模型,智能,用户,数据

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

微软研究院推出orca2llm

...然后生成、回忆-原因-生成、提取-生成和直接回答等各种推理技术，同时还能为不同的任务选择不同的解决方案策略。Orca2模型相比较Llama2和WizardLM等大型语言模型，在痛苦理解、常识推理、多步推理、数学问题解决、阅读理解...……更多

2023-11-22 11:08:00微软,研究院,研究,微软,模型,推理

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

专家模型不要专家并行！微软开源MoE新路径

...好，所以要在左上角： GRIN作为MoE架构，总参数量约42B，推理时激活的参数为6.6B，打同级别（7B）的非MoE模型是手拿把攥，甚至比14B的Phi-3还要略胜一筹。在上面的这份成绩单中，GRIN MoE表现优异，尤其是在编码和数学测试中。...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

AI芯片下半场：英伟达不再一家独大

...）”的新AI芯片组，目的是为ChatGPT等大语言模型的训练及推理提供英伟达芯片之外的替代方案。另据Tom’s Hardware消息，Athena使用的是台积电5nm工艺，专为大语言模型训练设计。曾有知情人士透露，在开发Athena期间，微软为了满...……更多

2023-11-16 23:46:00英伟,芯片,一家,芯片,英伟,微软

intelarca770升级改进ai大模型

IntelArc锐炫虽然初入独立显卡市场，但表现可圈可点，尤其是随着驱动的不断优化，各方面性能都在持续突飞猛进，包括游戏，包括AI。比如最高端的ArcA770，不但集成XMXAI加速功能，还拥有16GBGDDR6大容量显存，非常适合做生成式A...……更多

2023-11-21 13:03:00模型,升级,性能,驱动,显卡,微软

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

...。Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

推理性能飙升1.5倍！微软疯狂下单GB200芯片提升其AI算

...，新一代GB200服务器系统在Llama 3.1 700亿参数大模型上的AI推理性能对比H200提高了足足1.5倍。此外，微软还计划在低温数据中心部署GB200服务器，以缓解冷却系统的潜在压力。其他云服务提供商订单量则显著低于微软，如亚马逊在2...……更多

2024-10-20 11:52:00微软,推理,芯片,性能,疯狂,微软

3天把Llama训成Mamba，性能不降，推理更快！

...Mamba模型，并且设计了新的推测解码算法，加速了模型的推理。先来看一张其乐融融的图片（一眼AI）：右边的小羊驼代表Llama，而左边的蛇（Mamba）也是我们的老熟人了。至于到底能不能其乐融融，咱就不管了，之所以有此场景...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

微软紧随英伟达发布芯片，老黄还不慌吗？

...可以加快数据处理速度，尤其是在语音和图像识别方面。提速的关键，自然是算力。为了提升算力，微软也是下了血本：采用台积电的5nm制程工艺，晶体管数量达到1050亿个。和今年4月被曝光的信息相比，Maia的制程工艺、设计架...……更多

2023-11-23 09:36:00老黄,英伟,微软,芯片,芯片,英伟

收入占比40%、电话会议点名16次，英伟达：推理端的需求被低

...让人印象深刻的是，英伟达在财报电话会议的一个观点：推理端的爆发，可能很多人还是低估了。据英伟达电话会议披露，公司全年数据中心里已经有40%的收入来自推理业务，超出了绝大部分人预期。而在这次财报电话会议里，...……更多

2024-03-02 13:38:00英伟,电话会议,推理,收入,需求,端的

微软宣布Team Copilot发布，年内将推出初步预览版

...电脑，二是在信息日益增加的世界，电脑能不能帮助人类推理、规划以及更有效地运用所有的信息。纳德拉认为，现在这波AI浪潮能为微软找到实现这两大梦想的答案。随后，Nadella聚焦Copilot。纳德拉提到了包含随时可用本地API...……更多

2024-05-22 20:01:00微软,微软,纳德拉,纳德,模型,功能

英伟达宣布rtx系列显卡支持微软copilot+计划

...划，宣告了其拥抱人工智能的决心。英伟达宣布其RTX系列显卡将大力支持微软的全新Copilot+计划，该计划旨在为Windows11系统带来一系列强大的本地化功能。IT之家注意到，首批适配的设备包括来自华硕的五款笔记本电脑以及来自...……更多

2024-06-03 09:24:00英伟,微软,显卡,支持,英伟,功能

PC迎来AI时刻，英特尔、微软、联想等纷纷布局，产品价格将迎

...算力是上一代的8倍，可在PC上实现高能效的AI加速和本地推理，并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步，上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU，算力为16TOPS，AI性能相比上一代提升...……更多

2023-12-12 16:27:00英特,英特尔,微软,布局,时刻,价格

RTX 40系GPU AI性能首测

...RTX40系列多款型号的显卡、笔记本电脑GPU在StableDiffusion的推理性能表现，其中在ULBenchmarkSD1.5TRTvs.OpenVINO的对比测试中RTX4090笔记本电脑GPU相对于Arc核显有超过27倍的性能提升。使用吐司基准测试完整LoRA模型在StableDif……更多

2024-05-04 17:17:00性能,生成,测试,创作,火星,图片

AMD MI300绝杀英伟达H100？跑GPT-4性能超25

...，因此它们一直被诟病生成的回答是基于概率，而非基于推理。这也就意味着，在当前的AI热潮中，这些模型架构可能无法幸存下来。毕竟，由于发展速度太快，如今的LLM寿命相对较短。昨天还炙手可热的模型，一两周后可能就...……更多

2023-11-06 15:12:00英伟,大决战,芯片,性能,英伟,芯片

微软发布Azure ND H100 v5虚拟机

...比上一代虚拟机性能更强大，可显著提升AI模型的训练和推理速度。同时，微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外，NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术，每个GPU可提供400Gb/s的带...……更多

2023-11-21 20:20:00微软,英伟,微软,模型,带宽,速度

谷歌和微软两位“印度老乡”CEO，正面硬刚

...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”，Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

传统与AI性能两开花：AMD Zen 5架构处理器全解析

...，除了面向AI训练的服务器级别的硬件之外，主要用于AI推理的消费级处理器同样也需要强大的算力，让AI应用更加高效。在台北Computex2024中，AMD发布了Zen5架构处理器，包括锐龙AI300系以及锐龙9000系处理器，就在上周，AMD于洛杉...……更多

2024-07-16 16:09:00架构,处理器,性能,传统,处理,处理器

发布一揽子新品，AMD再次挑战英伟达！但败局早已注定？

...在加快追赶英伟达的步伐，以最新的Instinct MI325X为例，其推理性能甚至比英伟达刚发货的H200还高20%以上。不过强大的推理性能是靠远大于H200的显存所换来的，MI325X拥有多达256GB的HBM3E内存，这是目前全球性能最强的内存，连带着...……更多

2024-10-15 17:56:00英伟,败局,新品,再次,英伟,性能

微软、英伟达纷纷押注小模型，大模型不香了？

...LLM之间的性能差距正在迅速缩小，特别是在多项选择题、推理和数学问题等特定任务中，顶级模型之间的差异极小。例如，在多项选择题中，Claude 3 Opus、GPT- 4 和Gemini Ultra的准确率均超过83%，而在推理任务中，Claude3 Opus、GPT-4和Ge...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

清华提出CharacterGLM；DeepMind联创发全新

...｜微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集，由微软、UCLA和UW联合开发，包含6141个数学问题，涵盖丰富的任务类型、推理能力和图像类型。特点：旨在提供一个全面、多样、复杂的视觉数学推理挑战...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

国产低价显卡坞评测：能让轻薄本用上本地大模型

...消息是，尽管CUDA是N卡专属，但这并不意味着A卡不可以AI推理加速，通过DirectML、GGML或者OpenCL，A卡可以绕开这个限制，使用GPU进行AI推理。在这里，我直接选用农企推荐的第三方解决方案LM Studio，这是一个闭源、跨平台和跨供应...……更多

2024-04-30 11:00:00显卡,模型,评测,国产,低价,显卡

微软：从“软件老大”到“AI帝国”

...Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载运行云端训练和推理。这款芯片采用了 5 纳米工艺制造，拥有 1050 亿个晶体管。 Azure Maia 100 美颜照｜Microsoft微软自己的DPU——Azure Boost也已全面上市。微软在今年早些时候……更多

2023-11-21 10:45:00帝国,微软,老大,软件,微软,模型

page 1/1000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

太原移动通信进入万兆时代

11月21日，山西移动太原分公司率先部署50G PON(无源光网络)，并在小店区紫云府小区成功开通全省首个50G PON万兆家庭用户

2024-11-22 17:58:00