模型,模型,数据,内存,性能,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

手机市场深陷泥沼，厂商如何破冰？

...题，在这一关键节点，厂商们亟需新的解题思路。3、大模型被认为是下一突破点，但仍没合适的落地方式。自2023年初大模型成为互联网发展技术趋势的关键词，手机厂商关于大模型的探讨就一直没有停止。从逻辑上讲，手机厂...……更多

2024-01-09 10:18:00泥沼,厂商,手机,市场,手机,模型

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型

深度求索公司研发的DeepSeek大模型最近“出圈”，其实，国内学术界和产业界使用这个系列的大模型已有一段时间。解放日报·上观新闻记者今天采访时了解到，上海交通大学计算机科学与工程系教授赵海去年已弃用GPT-4，改用De...……更多

2025-01-29 21:29:00上海,下岗,模型,智能,开发,企业

苹果AI版iOS首日火爆：聊天秒变高情商，大模型成最强嘴替

...变得儒雅随和：开启Apple Intelligence后，苹果自研的端侧大模型就会被下载到设备当中。根据手快的网友体验反馈，不像其他家的AI那样动不动就是拒绝服务。与此同时，苹果自家大模型的报告也已出炉，披露了大量技术细节。报...……更多

2024-07-31 09:39:00情商,火爆,模型,苹果,模型,苹果

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

落地端侧被认为是大模型走向普及的关键。个人PC和智能手机是当前受众最为广泛的两大终端品类。2023年下半年以来，全球范围内各大PC、手机厂商纷纷通过硬件扩容，尝试将大模型在物理意义上融入终端。直到近期，大模型融...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

1-bit大模型还能再突破！新一代BitNet架构启用4位激

...et系列的原班人马推出了新一代架构：BitNet a4.8，为1 bit大模型启用了4位激活值，支持3 bit KV cache，效率再突破。量化到1 bit的LLM还能再突破？这次，他们对激活值下手了！近日，BitNet系列的原班人马推出了新一代架构：BitNet a4.8...……更多

2024-12-06 09:55:00架构,激活,新一代,模型,突破,激活

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...AWS re:Invent大会上，AWS（亚马逊云科技）一口气发布6款大模型、预告2款大模型，还推出3nm第三代AI训练芯片Trainum3及其迄今最强AI服务器Trn2 UltraServer。这是Amazon Nova系列基础模型首次亮牌。包括Micro、Lite、Pro、Premier四……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

万字技术干货！LLM工程师必读量化指南，可视化图解揭秘大模型

...量化」的基本概念和分支方法进行了全方位总结。大语言模型（LLM）通常过于庞大，无法在消费级硬件上运行。这些模型的参数可能超过数十亿，通常需要显存较大的GPU来加速推理过程。因此，越来越多的研究开始关注如何缩小...……更多

2024-08-01 09:38:00干货,可视化,模型,工程师,指南,工程

amd旗舰aigpu加速器mi300x对比英伟达h100

...0的1.3倍FP16TFLOPS精度是H100的1.3倍在1v1比较中，训练Llama270B模型速度比H100快20%在1v1比较中，训练FlashAttention2模型速度比H100快20%在8v8Server比较中，训练Llama270B模型速度比H100快40%在8v8Server比较中……更多

2023-12-08 05:06:00英伟,加速器,旗舰,芯片,堆栈,加速卡

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来，大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

宝德携手英特尔至强W处理器加速数智创新应用

...盘，具备丰富的异构扩展性和灵活的连接能力，可支持大模型快速导入导出，从多方位驱动AIGC算力，满足不同行业用户的多样化需求。它拥有16个DDR4内存DIMM槽，具备出色的图形处理能力和数据计算能力，并且提供人机共存的静...……更多

2024-10-11 15:45:00宝德,英特,英特尔,处理器,处理,应用

微软发布Azure ND H100 v5虚拟机

...100TensorCoreGPU，比上一代虚拟机性能更强大，可显著提升AI模型的训练和推理速度。同时，微软选择了第四代英特尔XeonScalable处理器作为新一代计算机处理单元。此外，NDH100v5VM还采用了英伟达Quantum-2ConnectX-7InfiniBand技术，每个GPU……更多

2023-11-21 20:20:00微软,英伟,微软,模型,带宽,速度

英伟达发布GB200计算卡：2080亿个晶体管，AI性能提升

...算卡的算力还远远不够，尤其是像Sora这样的文生视频的模型出来，更是对计算卡的算力提出了更高的要求，于是英伟达也适时地推出了下一代GPU，在AI性能上有着突飞猛进的进步，可以说拉了竞争对手整整一代。英伟达在今天凌...……更多

2024-03-19 11:53:00英伟,晶体管,晶体,性能,英伟,训练

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...达：速度快20倍，价格仅为1/5AI推理指的是在训练好一个AI模型之后，使用这个模型对新的数据进行预测或决策的过程。AI推理的性能和效率对于实时应用至关重要，例如自动驾驶汽车、实时翻译或在线客服聊天机器人等。Cerebras I...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

马斯克承诺开源版大模型来了！Grok-1：3140亿参数迄

...之心开源社区有福了。说到做到，马斯克承诺的开源版大模型 Grok 终于来了！今天凌晨，马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家（MoE）模型‘Grok-1’，以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多

2024-03-18 11:51:00马斯,马斯克,权重,架构,模型,参数

一毛钱写两本红楼梦，智谱AI再降价，已服务30万企业用户

...AI Open Day正式举办。在现场，智谱AI发布了全新的开源大模型GLM-4系列、新API模型、MaaS 2.0大模型开放平台、智能体等等产品。5月的大模型“大促月”还没结束，智谱也再度跟进降价。比如，GLM-4-Flash轻量化版本，在企业优惠价下...……更多

2024-06-07 09:25:00红楼梦,红楼,用户,服务,企业,模型

美光、SK海力士公布SOCAMM内存模块：尺寸更小功耗更低

...超过2.5倍的带宽，能够更快地访问大型训练数据集和复杂模型，同时提升推理工作负载的吞吐量。SOCAMM的尺寸为14 x 90毫米，仅为行业标准RDIMM尺寸的三分之一，有助于实现更紧凑、高效的服务器设计。同时，由于采用LPDDR5X技术...……更多

2025-03-19 18:27:00力士,功耗,模块,尺寸,内存,内存

终结数据孤岛！百度智能云亮相TDBC大会：重塑数据与AI的连

...,而是深陷数据治理的复杂迷宫中。当业界追逐千亿参数模型时,数据正成为制约AI价值落地的隐形瓶颈。在大模型技术高歌猛进的表象之下,数据困境呈现多维绞杀态势。文本、图像、音频、视频等多模态数据如同破碎拼图,传统工...……更多

2025-07-19 21:47:00数据,孤岛,大会,方式,智能,数据

前有雷军亲自交车，后有黄仁勋送货上门？全球首款AI超芯牛在哪

...数据。如果没有DGX H200，用户可能需要数月才能构建大型模型，而借助一站式的超级AI芯片DGX GH200部署，时间将大幅减少至数周，就能构建大型模型，特别是对目前备受期待的GPT-5模型，它会助力带来令人疯狂的性能升级。英伟达...……更多

2024-04-25 16:08:00雷军,送货,全球,英伟,内存,芯片

四月AI芯片三连发，英伟达：无惧竞争！

...款产品中，Intel新一代Gaudi3与NVIDIAH100展开直接竞争。在AI模型算力中，Gaudi3AI芯片的模型训练速度、推理速度都更出色，分别提升了40%和50%，平均性能提升达到了50%，能效更是提高了40%。更重要的是，Gaudi3AI芯片的成本比H100更低...……更多

2024-04-21 12:25:00三连,英伟,芯片,竞争,芯片,英特

AI大模型有望再扩1000倍！剑桥耶鲁康奈尔：PNN是变革关

...一新兴的前沿领域还鲜少有人涉足，但绝对值得深耕！AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功，LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象，当前的模型规模如何能再扩大10倍...……更多

2024-07-15 09:33:00康奈尔,康奈,耶鲁,剑桥,变革,模型

国产GPU突破！摩尔线程发布Torch-MUSA v2.0.

...A中，用户只需指定torch.device(\"musa\")，即可将现有的PyTorch模型迁移到MUSA架构的GPU上运行，无需大幅修改代码，目前Torch-MUSA已完全开源，可通过GitHub获取源代码。作为本次升级的核心亮点，Torch-MUSA v2.0.0率先在国产GPU上实现了……更多

2025-05-09 19:12:00摩尔,线程,国产,突破,支持,支持