• 我的订阅
  • 科技

artemis今年正式投产,将应用于数据中心的推理

类别:科技 发布时间:2024-02-12 20:47:00 来源:浅语科技

据媒体报道,Meta第二代自研AI芯片Artemis今年正式投产。

据了解,新的芯片将被应用于数据中心的推理任务,与英伟达等供应商的GPU一起协同工作。

Meta发言人之前表示:我们相信,我们自主开发的加速器将与市面上的GPU相得益彰,为Meta的任务提供最佳的性能与效率平衡。

除了更高效地运行推荐模型外,Meta还需要为自家的生成式AI应用,以及正在训练的GPT-4开源竞品Llama3提供算力。

MetaCEO扎克伯格此前宣布,计划到今年年底部署35万颗英伟达H100GPU,使得Meta共拥有约60万颗GPU用于运行和训练AI系统。

除了Meta之外,OpenAI和微软也在试图打造自己专有的AI芯片以及更高效的模型,来打破螺旋式上升的成本。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-13 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,老黄总共提到了16次“推理”这个词提
2024-03-02 13:38:00
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...AMD、英特尔竞赛英伟达表示,H200可以部署在各种类型的数据中心,包括本地、云、混合云和边缘,其全球生态系统合作伙伴服务器制造商(如华硕、戴尔、惠普、联想等)可以利用H20
2023-11-14 14:05:00
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...据公司(IDC)的研究,AI推理芯片在2020年已经占据了中国数据中心市场的50%以上份额,并预计到2025年,这一比例将增长至60
2024-08-29 09:49:00
Meta首次公布AI芯片细节 功耗低于英伟达
...事销售云计算服务的业务,过去公司从未公开谈论其内部数据中心芯片项目。为了更好地支持人工智能项目,科技巨头竞相在企业内部研发AI芯片。Facebook母公司Meta在5月18日
2023-05-19 14:00:00
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...14%,净利润728.8亿美元,同比增长145%。其中,备受关注的数据中心业务在第四财季和全年收入均创新高,分别为356亿美元和1152亿美元
2025-02-27 11:55:00
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...)。根据人工智能科学家贾扬清分享的数据显示,目前,数据中心每月每千瓦的平均价格约为20美元,这意味着572张Groq LPU加速卡每年的电费为105
2024-02-21 14:03:00
...研AI推理芯片Artemis。预计Meta可于年内完成该芯片在自有数据中心的部署,与英伟达GPU协同提供算力。该芯片是Meta去年宣布的内部芯片生产线的第二代产品
2024-02-03 21:39:00
英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%
...英伟达更是在官方公告中宣布了全新的H200和B100,将过去数据中心芯片两年一更新的速率直接翻倍。以推理1750亿参数的GPT-3为例
2023-11-14 13:41:00
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...于公司在AI方面的快速进展以及云计算客户的购买承诺,数据中心GPU的收入预计将在第四季度达到4亿美元,2024年将超过20亿美元
2023-11-06 15:12:00
更多关于科技的资讯: