• 我的订阅
  • 科技

成本降低12倍!英伟达升级版大模型芯片明年投产,黄仁勋:AIGC时代来了

类别:科技 发布时间:2023-08-09 11:49:00 来源:澎湃新闻
成本降低12倍!英伟达升级版大模型芯片明年投产,黄仁勋:AIGC时代来了

美国AI(人工智能)芯片巨头英伟达发布数据中心领域重磅芯片,剑指竞争对手AMD。

当地时间8月8日,英伟达(NVDA.US)CEO黄仁勋身穿经典皮衣,在计算机图形学顶会SIGGRAPH 2023现场发布新一代GH200 Grace Hopper超级芯片,并宣布将在2024年第二季度投入生产。GH200专为人工智能大模型设计,用于扩展全球的数据中心。

黄仁勋表示,生成式AI(AIGC)时代来临,英伟达将继续大力推动生成式AI发展的决心。

《华尔街日报》指出,这是英伟达对于AI数据中心芯片市场最大竞争对手AMD的“反击”,英伟达此前就已经预告将发布与AMD的Insight MI300X CPU + GPU对打的产品,后者是今年6月AMD刚刚发布的大模型专用芯片。

GH200超级芯片将于明年投入生产,较H100更强

GH200全球首发采用HBM3e高带宽内存,与英伟达目前最高端的AI芯片H100使用同样的GPU,但不同之处在于,GH200将同时配备高达141G的内存和72核ARM中央处理器,每秒5TB带宽。和现有Grace Hopper型号相比,最新版本的GH200超级芯片能够提供3.5倍以上的内存容量和3倍以上的带宽。和H100相比,GH200超级芯片的内存增加了1.7倍,带宽增加了1.5倍。全新一代的GH200预计明年二季度开始生产。

黄仁勋表示,一台服务器可以同时装载两个GH200超级芯片,大型语言模型的推理成本将会大幅降低。

据介绍,投资800万美元Grace Hopper,就相当于8800个价值1亿美元的x86 GPU,意味着成本降低12倍,能耗降低20倍。

GH200专为加速计算和生成式AI时代而打造,以巩固英伟达在AI界的主导地位,应对其老对手AMD于6月推出的数据中心APU(加速处理器)Instinct MI300系列的更新。

更厉害的地方在于,在内存和运算能力得到大幅度提升的基础上,GH200超级芯片还可以基于NVLink技术继续拓展互连,让GPU有能力访问全部的CPU内存,帮助客户减少机器数量并更快地完成工作。为了突出产品的这一特性,黄仁勋在演讲中屡次幽默地重复自己的口头禅:“你买得越多,就省得越多(The more you buy, the more you save)。”

“任何人都可以成为程序员”

在本次演讲中,生成式AI成为了被黄仁勋挂在嘴边的一大关键词。他在演讲中展示了图像和AI之间的不可分割性,表示AI既能够在虚拟世界中学习,也能够帮助搭建虚拟世界。

“大型语言模型是一个新的计算平台……人类就是新的编程语言,我们已经使计算机科学民主化,现在任何人都可以成为程序员,”黄仁勋在会议上说道,“时隔15年左右,终于有新的计算平台出现了,计算机本身必然会以截然不同的方式处理信息。”

美国科技媒体TechCrunch评价道,作为一款最新的、专门面向数据中心的AI开发硬件,在性价比高且耗能低的GH200即将推出的当下,再花费数百万美元为CPU机架等上一代计算资源进行投资研发将成为一种愚蠢的行为。虽然黄仁勋并未在演讲中提及AI目前面临的许多挑战、监管乃至概念上的变化,但他为观众展现了一个属于AI的积极前景。

英伟达的工作站GPU(图形处理芯片)系列也借本次发布会全面上新,一口气推出了4款新品:RTX 6000、RTX 5000、RTX 4500和RTX 4000。其中,性能最强的RTX 6000具有48GB的显存,18176个CUDA核心,568个Tensor核心,142个RT核心,和高达960GB/s的带宽。

针对企业客户,英伟达还为RTX 6000推出了最新的一站式解决方案RTX工作站。新的RTX工作站由英伟达和BOXX、戴尔科技、惠普和联想合作推出,支持最多4张RTX 6000 GPU,可以在15小时内完成8.6亿token(文本中的最小单位,一个单词或一个标点符号)的GPT3-40B的微调。

第三方开发者平台接入AI超算服务

对于开发者而言,英伟达将发布的全新统一工作空间是一个值得关注的话题。该空间被命名为NVIDIA AI Workbench,能够为开发者提供一个统一、易用的工作空间,使他们有能力在个人电脑或工作站上快速创建、测试和微调生成式 AI 模型,然后将这些模型扩展到几乎所有数据中心、公有云或 DGX Cloud。

OpenUSD的开发也是本次演讲中的重点内容。就在本次演讲一周前的8月1日,美国3D内容行业的5家主要公司苹果、英伟达、皮克斯、Adobe和Autodesk联合成立了OpenUSD联盟(AOUSD)。OpenUSD技术是英伟达Omniverse平台的基础,可能会成为未来“元宇宙”的3D图形标准。

黄仁勋在演讲中宣布了英伟达 Omniverse 平台的重要更新,将为开发者、企业和行业带来新的基础应用和服务,使他们能够使用OpenUSD 框架和生成式AI优化改进3D流程。

另外,英伟达将发布四款全新Omniverse Cloud API,包括RunUSD、ChatUSD、 DeepSearch 和 USD-GDN Publisher,使开发者能够更加流畅地实施和部署 OpenUSD流程和应用。

合作伙伴方面,英伟达正在与人工智能初创公司Hugging Face展开合作,将支持Hugging Face名为“作为服务的聚类训练(Training Cluster as a Service)”的项目,简化企业创建新生成式AI模型的过程,这也意味着开发人员可以在Hugging Face平台上直接使用英伟达的超算服务。

5月25日,英伟达发布截至4月30日的2024财年第一季度财报,收入为71.9亿美元,高于市场预期的65.2亿美元,与上年同期的82.88亿美元相比下降13%,与上一财季的60.51亿美元相比增长19%。

Wind数据显示,英伟达2023年迄今的涨幅达到205.71%。或许是受到美股大盘集体走弱影响,英伟达美东时间8月8日股价低开低走,收跌1.66%,报446.64美元,总市值1.10万亿美元。英伟达将于太平洋时间8月23日(北京时间8月24日凌晨)发布截至2023年7月30日的2024财年第二财季财报。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-09 15:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达推出新款gh200gracehopper超级芯片平台
英伟达(Nvidia)周二发布了一款升级版的下一代GraceHopper超级芯片平台,该平台采用了HBM3e内存技术,专为人工智能和高性能计算而设计
2023-08-10 09:59:00
斯坦福AI虚拟小镇开源;英伟达再推超级芯片;OpenAI发布爬虫机器人 | 本周硅谷发生了什么?
...与文化”App上推出AI生成明信片等功能 8月9日,谷歌推出升级版"艺术与文化"(Arts & Culture)应用程序
2023-08-14 15:59:00
英伟达blackwell计算引擎制造商推出的ai模型
...推出的H100在5个堆栈间提供80GB内存容量与3.35TB/秒带宽;升级版H100则与同样由英伟达制造的“Grace”CG100Arm服务器处理器搭配
2024-03-20 02:59:00
围剿ChatGPT
...后,Bard在处理常识推理和编程问题等任务时能力更强,升级版Bard很快推出。“随着时间的推移,将出现能力更强大的模型。我在乎的不只是领先,完全掌控AI模型对我们来说非常重要
2023-04-25 14:30:00
谷歌不服输:大模型PaLM2剑指GPT-4,Bard会写20种代码,推出办公助手“Duet AI”
...文字、图片等多模态的逻辑整合版输出结果。与此同时,升级版的Bard所能支持的语言拓展至包括日韩语的40种语言。Bard给出自行车购买指引
2023-05-11 07:12:00
曝switch2主芯片选三星代工原因!未来有续航更久的Switch2 OLED
...。另一位彭博社消息人士透露,三星还推动在未来Switch 2升级版中采用OLED面板。外媒Wccftech还援引一位熟悉三星的消息人士的话称
2025-05-22 12:03:00
英伟达市值超3.5万亿美元逼近全球第一;库克时隔半年再度访华;腾讯技术奠基人曾宇申请退休
...公开测试。微软表示这些工具是生成式AI Copilot的进一步升级版。马斯克xAI正式发布API马斯克的人工智能公司xAI发布了其应用程序编程接口(API)
2024-10-22 13:43:00
英伟达官宣Rubin GPU:3nm工艺,HBM4显存,新一代的AI之王
...在今年下半年和大家正式见面,而2025年将会是Blackwell的升级版也就是Blackwell Ultra,看起来应该是规格更大
2024-06-03 14:57:00
AI生态向硬件延伸!下一个值得博爆发点
...计算,需要买入6160元的底仓,大概6成仓位左右通信ETF的升级版网格在公号底部--网格定投--自动化网格交易拿👇
2024-02-11 22:05:00
更多关于科技的资讯:
近年来,我国商业保险发展速度较快,产品的种类也日渐丰富,除了大家比较熟悉的车损险、医疗险、航空险等,依托宠物经济应运而生的宠物保险也受到越来越多的关注
2025-11-14 12:19:00
携程商旅设立千万级保障金,推动行业迈向\
11月9日,2025年携程集团全球合作伙伴峰会商旅分论坛暨携程商旅伙伴大会在土耳其伊斯坦布尔举办。会上,携程商旅顺应行业"高品质服务"及"全球化发展"两大趋势
2025-11-14 12:59:00
大华股份亮相全球智慧城市大会
近日,2025全球智慧城市大会在西班牙巴塞罗那会展中心盛大启幕。大华股份携全栈式智慧城市解决方案重磅亮相,围绕城市安全
2025-11-14 12:59:00
虹软科技AI视觉赋能BOLON AI Glasses重磅发布,与Rokid乐奇深度合作打造创新体验
BOLON AI Glasses正式发布,这是国内领先的 AR 眼镜制造商 Rokid 乐奇与 BOLON 眼镜联合打造的全新一代 AI 眼镜
2025-11-14 12:59:00
2025青岛虚拟现实创新大会将启,星鲨研究院探索“具身智能”前沿
鲁网11月14日讯“在这里,唯一限制你的是你自己的想象力。”科幻电影《头号玩家》中对于“绿洲”的这一描述,恰如其分地展现了虚拟现实产业的无限可能
2025-11-14 10:18:00
中新经纬11月14日电 据“网信中国”微信公众号14日消息,网信部门从严整治利用AI仿冒公众人物开展直播营销问题乱象。近期
2025-11-14 10:30:00
大麦娱乐推出全新品牌“大麦国际” 提供全球演出购票、观演服务
购买海外演出门票,现在有了新选择。11月14日,大麦娱乐宣布推出旗下全新业务品牌、全球演出服务平台“大麦国际(MAISEAT)”
2025-11-14 10:45:00
大河网讯 11月11日,全省数字影像检查“云胶片”联盟采购工作顺利开标,产生了拟中选结果,中原算力科技发展有限公司等6家企业拟中选
2025-11-14 10:53:00
鲁网11月13日讯11月13日,山东瑞程数据科技有限公司与济宁学院联合攻关的“多模态肉品AI快检系统”核心技术,在第十四届中国创新创业大赛颠覆性技术创新大赛中斩获优秀奖
2025-11-14 10:54:00
记者走基层|“黑科技”上线,让温暖精准入户
11月12日,河北邢襄热力集团邢台供热分公司二工区三班班长丁帅,在三义庙换热站查看设备运行情况。 河北日报记者 宋 平摄随着11月15日临近
2025-11-14 08:02:00
11月13日,太原公共交通控股(集团)有限公司(以下简称“太原公交”)与中车时代电动汽车股份有限公司(以下简称“中车电动”)举行框架合作协议签约仪式
2025-11-14 07:50:00
记者走基层|智能安全帽,让矿工有了AI“卫士”
11月5日,中煤张家口煤矿机械有限责任公司所属恒洋电器有限公司工作人员介绍智能安全帽产品。河北日报记者 魏 雨摄“嘀嘀
2025-11-13 08:03:00
“长与短”周期变革,“快与慢”时效重构,“热与冷”业态碰撞—— “双11”三重奏,解读消费新变局□南京日报/紫金山新闻记者黄琳燕11月12日中午
2025-11-13 08:05:00
南报网讯(记者周容璇)日前,在南京医药中央物流中心,一辆白色无人车平稳地穿梭于主仓库与宝湾库区之间,仅用15分钟便完成了一次驳货作业
2025-11-13 08:05:00
向“质”攀升,南京机器人解锁“智造”新图景
全链条持续发力,以硬核技术竞逐市场向“质”攀升,南京机器人解锁“智造”新图景□南京日报/紫金山新闻记者徐宁 实习生黄倩机器人是智能制造的核心组成部分
2025-11-13 08:05:00