• 我的订阅
  • 国际

响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”

类别:国际 发布时间:2024-02-22 16:46:00 来源:红星新闻

就在全世界还沉浸在Sora带来的视觉震撼时,AI圈又出了一个“王炸”产品,这一次是在芯片领域。

自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。

响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”

▲Groq芯片

不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速度震撼了业界。搭载Groq芯片的大模型回复用户的速度极快,达到普通人打字速度的75倍,比英伟达芯片的响应速度快10倍以上。对于习惯了ChatGPT等AI产品“一个字一个字蹦出答案”的用户来说,如今看到AI模型生成文章的速度比“眨眼睛还快”,其震撼程度可想而知。

Groq芯片大获好评

响应速度比英伟达快十倍以上

Groq在20日宣布对AI云服务平台进行免费开放体验,该公司官方账号还在社媒发文,鼓励粉丝积极参与互动。这次Groq在服务器上运行了Meta公司开发的Llama二代大模型等产品,因为和ChatGPT等闭源产品不同,Llama等模型是开源产品,允许其他厂商使用。

很快,体验了“无卡顿”状态的用户们对Groq发出了惊叹和赞美,“刷屏”了整个AI圈。比如,一位市场营销行业的用户截屏说明了自己的体验:Groq云服务平台针对他提出的专业领域问题,仅用4秒钟就生成了上千个英文单词的回答,而且这一回答真实可信,并附有注释和资料来源。

还有人用实验证明,Groq云服务平台搭配Llama2-70B模型,可以在7分钟之内打出和莎士比亚名篇《哈姆雷特》同样多单词量的文章,这一速度至少是普通人打字速度的75倍。有业界人士评论称,Groq芯片在响应速度上完全秒杀英伟达,给那些“喜欢低延迟体验”的用户带来了极大的惊喜。

响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”

▲Groq官网鼓励用户体验“全球最快的大模型输出速度”

在此之前,用户们已经普遍习惯了由英伟达芯片驱动下的AI大模型十分缓慢的答复速度,“就像看着对面打字的人一个字一个字地往外蹦出答案”。而在Groq云服务平台,用户可谓“目不暇接”,AI生成答案的速度远远超过肉眼阅读的速度。

专业测评显示,Groq芯片搭配Llama二代模型可以达到每秒近500个token,如果搭配其他小厂商的模型甚至能达到每秒700token的文字处理速度。而根据公开数据测算,英伟达旗下芯片驱动的GPT大模型的文字生成速度大约为每秒40个token。

技术路线不同形成速度优势

专家称不应过度拔高其表现

众所周知,英伟达已经成为AI时代全球最大的芯片赢家,凭借着极其强大的性能让各路AI厂商疯狂“抢货”。英伟达就像AI时代的“军火商”,旗下的芯片成为各路豪强争抢的先进武器。那么,为何Groq芯片的响应速度会远超英伟达呢?这里主要是因为Groq选择了完全不同的技术路线。

Groq公司官网介绍,该公司是全球范围内首个创造了LPU(语言处理单元)技术路线的芯片厂商,而英伟达采用的是主流的GPU(图形处理单元)路线。LPU架构是Groq公司专为AI推理所设计的,线路极其精简,也没有GPU需要的高性能且昂贵的内存结构。另外,通过LPU也在能效上更胜一筹,让芯片更“饱和”地进行计算,提高了处理效率。

正因如此,LPU在速度上“独领风骚”,但GPU在深度学习上还是没有竞争对手可以匹敌。目前Groq生产的LPU芯片还不能被用于训练大模型,只能用于AI推理(即使用训练好的AI大模型生产答案)。

响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”

▲Groq官网称自家芯片(左)的设计效率远超竞争对手(右)

阿里前技术副总裁贾扬清点评道,虽然他本人非常欣赏Groq公司,但LPU芯片的成就不应该被过度拔高。他举例表示,Groq以极端方式追求处理速度而牺牲内存和并行运算能力,导致能由一块英伟达芯片处理的计算量理论上需要几百块Groq芯片组装到一起才能完成。这样虽然英伟达芯片的单价更为昂贵,但如果选择使用Groq芯片训练大模型,还要付出更多倍的代价。

Groq创始人兼CEO乔纳森·罗斯此前对媒体表示,在大模型推理场景下Groq芯片的速度比英伟达快10倍,但价格和耗电量都仅为后者的十分之一。这一点也被业内人士指出是“片面的宣传”。

芯片行业专家姚金鑫也以个人名义撰文表示,英伟达作为AI芯片领域绝对的领先者,人们期待出现挑战英伟达的对手,但对Groq芯片的表现不应过度拔高。姚金鑫称,“速度在这里成了Groq的双刃剑”,Groq的架构建立在小内存、大算力的基础上,因此有限的内容对应着极高的算力,导致其速度非常快。但是反过来说,Groq极高的速度是建立在很有限的吞吐能力上的,每张芯片能够处理的内容量太小。

创始人曾是谷歌工程师

豪言将把计算成本“降至零”

Groq公司总部坐落在美国加州山景城,这里也是谷歌等众多科技巨头的总部所在地,这也和创始人乔纳森的出身有关。

乔纳森曾经是谷歌工程师,在工作中他痛感传统的CPU和GPU等处理单元的表现存在很大“瓶颈”,芯片的运算能力并没有被发挥到极致。因此他选择了辞职创业,招募了很多硅谷巨头企业的工程师一起研究新的技术路线。乔纳森曾表示,Groq的公司使命必须是有颠覆性的,“我们致力于将计算的成本降至零,以此释放人工智能的所有潜力”。

运用自己强大的技术能力、人脉和管理经验,Groq被乔纳森经营得有声有色。2022年12月,Groq宣布获得由老虎环球基金领投的C轮融资,融资额度高达300亿美元,该公司也因强大的“吸金”能力让AI圈刮目相看。2023年8月,Groq宣布选择三星Foundry泰勒工厂为其生产4纳米制程的AI加速器芯片。这座工厂是三星在美国大手笔建造的标志性项目,Groq成为其第一家客户,也标志着三星正式加入AI赛道的战场。

而到了今天,Groq又以“10倍英伟达”的闪电速度再次刷屏出圈,这家规模很小的初创企业成为了AI行业格局中不可忽视的搅局者。乔纳森曾经总结过自己的经营哲学,“我喜欢小团队快速作战,就像出发狩猎大象的猎人只需要带很少的干粮就能活很久。一旦打下了大象,就可以够他吃很长时间了。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-22 17:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

软银孙正义再放豪言 超级人工智能时代要来了?
...辑:赵云在刚刚宣布连续两个季度实现盈利后,软银集团创始人孙正义近日再放豪言,不仅描绘了创造“比人类聪明数千倍”人工智能的雄心壮志,还提出要打造超级人工智能时代(ASI),“无
2024-06-25 14:45:00
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...要庞大的资金支持。硅谷著名AI投资人Daniel Gross说:“MatX创始人的行动代表了这个世界AI发展的一种趋势
2024-03-30 11:11:00
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...son、Mike Novogratz、Immad Akhund、Jawed Karim和Charlie Cheeve
2024-06-27 09:25:00
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...加州库比蒂诺,公司成立仅两年,目前团队只有 35 人,创始人是一对哈佛辍学生 Gavin Uberti(前 OctoML 和前 Xnor
2024-06-27 09:24:00
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...角兽曾经得到多个知名投资者的支持,其中包括OpenAI联合创始人Sam Altman、AMD前CTO Fred Weber等
2024-08-29 09:49:00
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...队来源于谷歌最初的张量处理单元(TPU)工程团队。Groq 创始人兼CEO Jonathan Ross是谷歌TPU项目的核心研发人员
2024-02-21 14:03:00
实力“媲美”英伟达,壁仞科技最快年内赴港IPO
...具有深厚的技术积累和独到的行业洞见。其中,壁仞科技创始人张文是哈佛大学法学博士学位,曾在联合国和华尔街工作多年,先后担任高级律师和华尔街泛美亚市场资深投资人等要职。联席CEO
2023-07-20 18:13:00
今早,黄仁勋宣布:最强AI芯片来了
...晚如约而至。北京时间今天(3月19日)凌晨4点,英伟达创始人黄仁勋身着标志性的皮衣,登上GTC 2024大会的演讲台
2024-03-19 09:40:00
国内首款12nm大算力存算一体芯片发布,用于智能驾驶、工业领域|硅基世界
...Tier1和算法提供商共计超55家客户支持。会后,后摩智能创始人兼CEO吴强对钛媒体App表示,存算一体架构将存储和计算功能融合,比传统架构更接近人脑的计算方式,具备远高于传
2023-05-11 12:00:00
更多关于国际的资讯: