• 我的订阅
  • 财经

Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai

类别:财经 发布时间:2024-04-26 13:43:00 来源:至顶头条

Nvidia今天透露,已经收购了Run:ai,一家开发优化显卡集群性能软件的初创公司。

此次收购交易的条款并未披露。TechCrunch援引两位知情人士的话报道称,此次交易对Run:ai的估值为7亿美金,这几乎是这家总部位于特拉维夫的初创公司在收购之前筹集的资金金额的6倍。

Nvidia斥资7亿美金收购GPU集群优化初创公司Run:ai

Run:ai的正式名称为Runai Labs Ltd,提供的软件主要用于加速配备了GPU的服务器集群。据该公司称,由其技术支持的GPU环境可以运行的AI工作负载比其他方式要多出10倍,而且它是通过修复几个经常影响GPU驱动的服务器的常见处理效率低下问题来提高AI性能的。

Run:ai解决的第一个问题,源于AI模型通常使用多个显卡进行训练。为了将神经网络分布在GPU集群上,开发人员会将其分成多个软件片段,并在不同的芯片上训练每个片段。这些AI片段必须在训练过程中定期相互交换数据,这可能会导致性能问题。

如果AI片段必须与当前未运行的神经网络的不同部分交换数据,则必须暂停处理,直到后一个模块上线,由此产生的延迟会减慢AI训练的工作流程。Run:ai可以确保促进数据交换所需的所有AI片段同时在线,从而消除不必要的处理延迟。

Run:ai的软件还避免了所谓的内存冲突。在这种情况下,两个AI工作负载会尝试同时使用GPU内存的同一部分。GPU会自动解决此类错误,但故障排除过程需要时间。在AI训练过程中,修复内存冲突所花费的时间会显着增加并减慢处理速度。

在同一GPU集群上运行多个AI工作负载还可能导致其他类型的瓶颈。如果其中一个工作负载需要的硬件超出预期,那么它可能会使用分配给其他应用的基础设施资源并放慢这些应用的速度。Run:ai提供的功能可以确保每个AI模型都获得足够的硬件资源,在没有延迟的情况下完成分配的任务。

Nvidia副总裁、DGX云部门总经理Alexis Bjorlin在一篇博客文章中详细介绍了这一点,他说:“该公司在Kubernetes上构建了一个开放平台,这是现代AI和云基础设施的编排层,支持所有主流的Kubernetes变体,并与第三方AI工具和框架进行了集成。”

Run:ai主要销售核心基础设施优化的平台以及其他两种软件工具。首先是Run:ai Scheduler,它提供了一个为开发团队和AI项目分配硬件资源的接口,其次是Run:ai Dev,可以帮助工程师更快地设置用于训练神经网络的编码工具。

Nvidia已经在自己的多款产品中附带了Run:ai的软件,包括Nvidia Enterprise,是Nvidia为自己数据中心GPU提供的一套开发工具,以及DGX系列AI优化型设备。Run:ai也可在DGX Cloud上使用,并且通过该产品,企业可以访问主流公有云中的Nvidia AI设备。

Bjorlin表示,“在可预见的未来”,Nvidia将继续在当前定价模式下提供Run:ai的工具,与此同时,Nvidia将发布该软件的增强功能,重点关注有助于优化DGX云环境的功能。

Bjorlin详细介绍道:“客户可以期望他们将受益于更好的GPU利用率、改进的GPU基础设施管理以及开放架构带来的更高灵活性。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-26 14:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

两个月市值冲上600亿,张一鸣的老对手要翻身了?
...020年,目前只投入了数千万元建设,包含200张显卡的训练集群,并组建了超过200人的研发团队。也就是说,虽然昆仑万维介入了AIGC行业,但目前还没有太大的投入。不过,昆仑万
2023-04-19 14:07:00
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...的精力构建想法原型并大规模训练新架构。而在大型计算集群上训练 LLM 的主要挑战是最大限度提高训练作业的可靠性和正常运行时间。xAI 提出的自定义训练协调器可确保自动检测到有
2024-03-31 04:00:00
小米屈恒:人车家全生态的硬核创新进入到了井喷期
...米超级大压铸全栈自研,不仅自研了材料,还自研了设备集群系统,几乎完成了大压铸产业链里所有环节的自研。在设计方面,该项目首创一体化大压铸的正向闭环设计方法,发明了超长流程材料-
2024-01-06 11:50:00
...要利用采集的数据产生大量场景,在云端搭建数据与仿真集群,来复现或者修改corner case。据51Sim CEO鲍世强介绍,行业过往所用的仿真软件绝大部分都是国外产品,这些
2024-02-27 20:56:00
英伟达新版旗舰AI芯片售价炒到4万美金 “算力垄断”难被打破
...最新版旗舰AI芯片H100近日在网上的售价已经被炒到4万多美金,反映了科技行业对训练和部署人工智能软件的需求仍未被满足。受AI芯片需求的提振,英伟达今年以来股价累计涨幅超过8
2023-04-16 23:42:00
雷军:小米澎湃OS、大压铸团队共同获得小米百万美金技术大奖
...米超级大压铸全栈自研,不仅自研了材料,还自研了设备集群系统,几乎完成了大压铸产业链里所有环节的自研,让小米成为全球唯二、中国唯一同时掌握大压铸集群和大压铸合金自研能力的企业,
2024-01-04 16:15:00
6925亿元!OpenAI将成硅谷史上融资最多公司
...Information报道,2022年OpenAI的亏损大约翻了一番,达到5.4亿美金,主要源于ChatGPT的巨额支出以及从谷歌挖了许多重要人才
2023-05-11 11:43:00
GPU缺口45万片?中国大模型产业链有新动向
...发展,正在体系化考虑大模型业务,比如,思考自建算力集群,产业链也开始要解决更多大模型系统化发展带来的挑战。 01中美大模型或将走向不同“分野”很难想象,一个只有两三百人的会
2023-08-31 09:57:00
36氪专访丨一万元一块的智能手表,让这家公司值200亿美金
...利,成为行业毫无疑问的“隐形巨头”——靠着均价400+美金左右的高端智能手表,在美股上市多年的佳明,2022年的营收在50亿美元左右,市值达到200亿美金。很难想象的是,这家
2023-07-05 17:08:00
更多关于财经的资讯: