• 我的订阅
  • 科技

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

类别:科技 发布时间:2025-01-07 14:17:00 来源:浅语科技

就在刚刚,老黄穿着全新的皮衣,在CES上一波接一波放大招。

先是发布了自家最新的GPU——RTX 5090。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

直接来看下基于Blackwell架构的最新GPU主要性能:

拥有920亿个晶体管

具备4000 AI TOPS(每秒万亿次操作)的性能

能够实现380 RT TFLOPS(每秒万亿次浮点运算)的光线追踪性能

具备1.8 TB/s 的内存带宽,能够快速地读取和写入数据

具有125 Shader TFLOPS 的着色器性能

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

这一50系列GPU的价格也直接一道公布:

RTX 5090:1999美元(约14651元)

RTX 5080:999美元(约7321元)

RTX 5070 Ti:749美元(约5489元)

RTX 5070:549美元(约4023元)

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

而Blackwell架构关键的互联技术也上了波新的——NVLink72。

依旧是快速来看下主要性能亮点:

72个Blackwell GPU具备1.4 ExaFLOPS TE FP4计算能力

晶体管数量达到130万亿

拥有2592个 Grace CPU核心

72个ConnectX - 8网络接口卡

576个存储芯片,总容量14TB,带宽1.2PB/s

18个NVLink交换机,全连接带宽130 TB/s

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

非常有意思的是,老黄现场还手持巨大的样品,宛如一个盾牌,开始了整活儿:

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

除此之外,AI超算,现在迎来了PC时刻。

因为就在刚刚,老黄一道还发布全球最小的个人AI超级计算机——Project Digits。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

有多强悍?

2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑!

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

如果把两台Project Digits一块“食用”,那么还可以跑4050亿参数的大模型。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

据了解,每个Project DIGITS配备了128GB统一、相干内存和高达4TB的NVMe存储,仅需标准电源插座即可运行。

并且在桌面系统上对大模型搞完开发或推理之后,还可以无缝部署到加速云或数据中心基础设施里。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

正如老黄在现场所说的那样:

AI将成为每个行业、每个应用的主流。

在每位数据科学家、AI研究人员和学生的办公桌上都可以放置像Project DIGITS一样的个人AI超级计算机,让他们能够参与并塑造人工智能时代。

而且Project DIGITS不用等太久哦,今年5月份就会开始提供,起售价3000美元(约21978元)。

那么Project DIGITS又是如何做到又小又彪悍的呢?

搭载了全新的GB10超级芯片

Project DIGITS的关键,就在于它搭载的全新Grace Blackwell超级芯片(GB10)。

这个系列芯片想必大家并不陌生了,基于Grace Blackwell架构,是一款片上系统(SoC)。

在FP4精度下可以提供高达1千万亿次浮点运算的AI性能。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

GB10包含了英伟达Blackwell GPU(具有最新一代 CUDA 核心和第五代 Tensor Cores),通过 NVLink-C2C 芯片到芯片互连连接到高性能 NVIDIA Grace CPU(采用 Arm 架构的 20 个节能核心)。

据了解,联发科参与了GB10的设计,对提升能效、性能和连接性等方面起到了一定作用。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

?基于这样的架构,企业和研究人员可以在本地运行Linux系统的Project DIGITS上进行模型原型设计、微调与测试,再部署到NVIDIA DGX Cloud等上面。

用户还可以访问因为大的AI软件库,包括NGC目录和开发者门户中的软件开发工具包、编排工具、框架和模型等,可用NVIDIA NeMo框架微调模型、NVIDIA RAPIDS库加速数据科学,运行PyTorch等常见框架。

还可利用NVIDIA Blueprints和NVIDIA NIM微服务构建智能AI应用;据了解,从实验到生产环境时,NVIDIA AI Enterprise许可证提供企业级安全等支持。

允许商用的世界基础模型Cosmos

与此同时,老黄还宣布英伟达将开源允许商用的世界基础模型——Cosmos。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

Cosmos平台既包括用于生成物理世界合成数据的扩散及自回归Transfomer模型,还有视频Tokenizer以及用来加速视频处理的管道。

其中,Cosmos基础模型在2000万小时的驾驶和机器人视频数据上训练而成,主要用来加速自动驾驶和下一代机器人训练研发。

开发者既可以用Cosmos生成物理合成数据,也可以用英伟达NeMo框架+私有视频数据进行微调。

而如此发布也是基于目前AI技术的发展大势。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

具体而言,本次CES大会上,老黄一共介绍了三类模型:

Nano:超低延迟的实时模型,优化用于边缘部署;

Super:高性能基线模型,适用于开箱即用的微调和部署;

Ultra:最高准确度和质量,适合模型定制;

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

据介绍,这些模型的参数大约为40亿~140亿,任何企业无论规模大小,都可以自由使用Cosmos模型。

目前已公布的第一批试用者包括机器人公司1X、Agility Robotics,以及自动驾驶领域的Uber、小鹏、比亚迪等。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

对了,老黄这次特意官宣丰田将基于英伟达芯片和操作系统开发下一代新能源汽车。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

从用法展示来看,Cosmos已经能够帮助工业界和自动驾驶生成大量数据,从而加速相关AI技术研发了。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

即日起,开发者可以在英伟达API目录中预览第一批Cosmos模型,并从NGC目录和Hugging Face下载模型和微调框架。

另外,Cosmos也为进一步扩展Omniverse(英伟达工业数字化和物理AI仿真平台)提供了新的可能。

开发者可在Omniverse中构建3D场景,渲染输出后用于Cosmos模型生成合成虚拟环境,最终用于物理人工智能训练。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

还有比较壮观的场面,就是老黄站在一排机器人的中间,颇有具身智能boom时代的意味。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

还有两个新模型服务

除了非常fashion的世界模型之外,老黄这次还发布了两个大方向的模型服务。

一个是AI基础模型,主要适用于RTX AI PC,主打的就是轻松、灵活开发。

具体而言,通过连接到图形用户界面(GUI)的NIM微服务,用户可轻松访问和部署最新生成式 AI 模型。

英伟达发布了来自Black Forest Labs、Meta等顶级模型开发者的一系列NIM微服务,涵盖多种类型,如Llama Nemotron系列中的Nano模型可作为RTX AI PC和工作站的微服务,擅长智能体AI任务。

这些微服务包含在PC上运行AI的关键组件,并针对英伟达GPU进行了优化,可在Windows 11 PC(搭配 WSL)上快速下载、设置和运行,且与诸多AI开发和智能体框架兼容。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

NIM微服务之外,AI蓝图(AI Blueprints)也即将在PC上可用。

AI蓝图是基于NIM微服务构建而来,主要为数字人类、内容创作等提供预配置参考工作流程。

例如PDF转播客蓝图可提取PDF内容生成脚本及音频,3D引导生成式AI蓝图能让艺术家利用3D场景更好地控制图像生成。

具体到产品,英伟达预览了Project R2X,这是一个具有视觉功能的PC虚拟形象,可通过NVIDIA RTX Neural Faces算法渲染面部,并由新的Audio2Face - 3D模型驱动动画,能连接多种AI服务和微服务。

据了解,从今年2月开始,NIM微服务和AI蓝图就可以使用了,多家PC制造商和系统构建商将推出支持NIM的RTX AI PC。

同样是基于NIM微服务,英伟达这次还推出了Nemotron模型家族,包括:

Llama Nemotron大型语言模型

Cosmos Nemotron视觉语言模型

这两个大模型则是更倾向于AI智能体方向。

Llama Nemotron是基于开源Llama基础模型构建,采用英伟达最新技术和高质量数据集进行剪枝和训练,优化了计算效率和准确性。

擅长指令遵循、聊天、函数调用、编码和数学等,尺寸经过优化可在多种英伟达加速计算资源上运行。

尺寸方面同样包含Nano、Super 和 Ultra三种大小:

Nano成本效益高,适用于低延迟实时应用和PC及边缘设备;

Super在单个GPU上提供高吞吐量和高精度;

Ultra为数据中心规模应用设计,精度最高。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

Cosmos Nemotron视觉语言模型则是结合了英伟达的NIM微服务,可以让开发者构建能分析和响应图像及视频的智能体,应用于多个领域。

One More Thing

就在老黄登上CES之前,英伟达股价又又又创下了历史新高!

涨幅超3%,收盘价为149.43美元(高于去年11月7日创下的每股148.88美元收盘纪录),最新估值达到3.66万亿美元,成为仅次于苹果的全球第二大上市企业。

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

△图源@YahooFinance

不知道这次发布的东西是否符合大家的期待捏?

定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了

参考链接:

[1]https://www.youtube.com/live/k82RwXqZHY8

[2]https://x.com/YahooFinance/status/1876376522766024882

责任编辑:落木

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-01-07 17:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...仁勋还在GTC大会推出了新一款服务软件NIM,下一代AI超级计算机、英伟达Project GR00T 人形机器人基础模型
2024-03-19 13:00:00
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...,每秒1.8TB,是上一代性能的两倍,这使得AI工作负载与计算机图形工作负载能够混合在一起。“计算机图形的未来是神经渲染,AI与计算机图形的融合。”黄仁勋表示,真正令人惊叹的
2025-01-07 19:00:00
GTC对话黄仁勋:我眼中的GPU,和别人有很大差别
...或者下载它、在另一个云端运行它,或者下载在你的本地计算机上运行。当运行你的工作站、你的数据中心时,这项服务将使它们非常高效,所以这是一种在环境中使用的新方式。现在,当你作为一
2024-03-22 08:00:00
GTC 2024硬件一览:史上最强AI芯片GB200发布!
...出场。一上来就直奔今天的主题——AI,并表示“加速式计算机的生产力已经到达了一个转折点,生成式AI正在加速发展,而我们需要以一种全新的方式进行计算,才能够进一步提高计算机生产
2024-03-24 17:39:00
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...alesforce 和 Lightrick 等客户已经在使用谷歌云的 TPU v5p 超级计算机来训练大模型。谷歌之外
2023-12-15 11:26:00
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...19天内(通常需要3年)建造了一个拥有100,000个GPU的超级计算机集群。这展示了我们的平台的力量,以及我们能够将整个生态系统集成在一起的能力。Q:是否认为分布式计算和推
2024-10-23 12:25:00
黄仁勋:只需2年,英伟达甚至整个行业就会面目全非
...力相比CPU大幅提升。而神经网络和深度学习的发展,也让计算机获取知识变得更加快捷,带来了计算机的智能化飞跃。传统计算方式依赖于预设的算法模型,缺少学习和理解能力。而结合深度学
2023-11-04 09:34:00
AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训
...过,马斯克依旧希望建造一台配备10万块英伟达GPU的超级计算机,将其称为「Gigafactory of Compute」
2024-07-16 16:00:00
微软难以摆脱英伟达 |焦点分析
...v4,他们目前已将4000个TPU v4串联在一起,构建了一台超级计算机,并在自己的云服务中部署了数百台TPU v4超级计算机
2023-11-20 13:32:00
更多关于科技的资讯: