• 我的订阅
  • 头条热搜
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...B左右的内存,即使完全忽略内存消耗,也需要305张Groq LPU加速卡才够用。如果考虑到内存消耗,可能需要572张Groq LPU加速卡。官方数据显示,Groq LPU的平均功耗为185W,即使不计算外围设备的功耗,572张Groq LPU加速卡的总功耗也高...……更多
amd旗舰aigpu加速器mi300x对比英伟达h100
...00高出60%。性能:AMD公司在演讲过程中,对比英伟达的H100加速卡,分享了MI300X的性能参数情况,IT之家附上数值如下:内存容量是H100的2.4倍内存带宽是H100的1.6倍FP8TFLOPS精度是H100的1.3倍FP16TFLOPS精度是H100的1.3倍在1v1比较中,训练L……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...进行大幅提升。英伟达于2022年发布了基于Hopper架构的H100加速卡,而现在推出基于Blackwell的加速卡在性能上也得到了全面提升,更擅长处理AI相关任务。从外观来看,Blackwell GPU的体积明显大于H100,采用台积电的4纳米(4NP)工艺...……更多
AMD发布最强AI芯片,对标英伟达Blackwell,2025年上市
... 300 系列处理器。 对标英伟达最强 AI 芯片:Instinct MI355X 加速卡最近,全球 AI 芯片供不应求,AMD 已成为 GPU 领域的重要玩家,今天该公司宣布了最新的 AI 加速器和用于 AI 基础设施的网络解决方案。具体而言,AMD 推出了 AMD Instin...……更多
英伟达尖端图像处理半导体h200开始供货
...运算处理装置)组合的新产品用于最新的LLM上。“最强AI加速卡”GB200包含了两个B200BlackwellGPU和一个基于Arm的GraceCPU ,推理大语言模型性能比H100提升30倍,成本和能耗降至25分之一。GB200采用新一代AI图形处理器架构Blackwell,黄仁...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...列全新的产品,包括新一代的AI PC处理器、EPYC处理器、GPU加速卡等多款重磅产品。作为英伟达为数不多的友商,AMD对这一波新品寄予厚望,发布会还特意邀请了OpenAI、微软等巨头的大佬来站台,然而市场对其产品却不看好,其股...……更多
英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出|硅基世界
...售的两款“特供版”AI 芯片产品。具体包括两种硬件形态加速卡:一款型号为HL-328的OAM兼容夹层卡(Mezzanine Card),预计将于今年6月24日推出;另一款是型号为HL-388的PCle加速卡,预计将于今年9月24日推出。而基于内核数量、工作...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...款最热门产品的产能和需求,但据外媒报道,今年内H100加速卡的产能至少同比增长了3倍,且仍有许多产能瓶颈无法解决。比如台积电5nm生产线产能,英伟达的GPU必须使用台积电的CoWoS封装技术,市面上完全找不到别的替代品。...……更多
AI芯片下半场:英伟达不再一家独大
...分向客户提供。另一个芯片大厂AMD也在不久前推出了最新加速卡Instinct MI300X。在发布会现场,PPT上专门打出一行字——大语言模型专用,这被业界视为直接向英伟达宣战。据悉,MI300X的高带宽内存(HBM)密度最高可达英伟达H100...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...狐科技作者 | 梁昌均在全球算力荒的情况下,AI芯片巨头英伟达加速算力竞赛。当地时间11月13日,英伟达宣布推出新一代人工智能芯片H200,称其是目前世界“最强”的AI芯片。H200此次升级主要体现在带宽更高、容量更大的内存...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...模型的性能需求,同时在成本上也是远低于那些高昂的AI加速卡。 英特尔表示,在使用2S 五代至强平台上运行GPT-J 6B模型(60亿参数),它可以实现在大约25毫秒下完成一个Token的处理。不过,对于运行更大的Llama 2 13B模型时,其...……更多
sk海力士hbm3e开始量产
3月19日消息,英伟达今日发布了地表最强的AI加速卡--BlackwellGB200,采用台积电4NP工艺制程,配备192HBM3E内存,共有2080亿个晶体管,推理大语言模型性能比H100提升30倍,成本和能耗降低96%。SK海力士今日发布新闻稿宣布其最新的超...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...希姆STCP920系列采用12nm工艺,是基于RISC-V的人工智能计算加速卡,具备较高的云端AI计算能效比和可编程性,混合支持FP16/INT8数据类型。希姆计算将其在传统AI场景里的方案针对大模型进行了专门的优化,姚金鑫坦言,这一一体机...……更多
上海杀出160亿超级独角兽:腾讯押注
...技创办于2018年,主要做云端的AI算力,产品与服务涵盖AI加速卡、系统集群和软硬件解决方案。创始人赵立东与张亚林都有长期的芯片行业从业经历。赵立东1990年本科毕业于清华大学电子工程系,后赴美国犹他州立大学留学,获...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...写带宽为437GB/s。这个数据,对于一些搭载GDDR显存的GPU或加速卡,可以说是毫不逊色。但仅靠硬件远远不够仅仅依靠硬件创新,是远远不够的,CPU很难进行大模型算法的大规模并行计算。正如开篇所述,大模型对通信带宽的要求...……更多
AMD公布全新AI加速卡路线图:CDNA 4架构明年见
如今AI大红大紫,英伟达也凭借着AI加速卡赚的是盆满钵满,这对于AMD来说实在是心痒痒,因此AMD也马不停蹄地公布了自家最新的AI加速卡路线图,未来的计算卡将会比英伟达B200更强,希望能够从英伟达口中夺得更多的市场份额...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...的芯片可有不同的组合方式,包括CPU+GPU、CPU+TPU、CPU+其他加速卡等。相比于通用服务器,AI服务器更适应AI训练和推理的大算力、高并发、大数据流转等需求,已经成为大模型时代的“香饽饽”。以热门AI服务器型号浪潮NF5688M6服...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达的7000倍,而价格仅为GPU的1/5,性价比提高了100倍。Cerebras Inference还提供多个服务层次,包括免费、开发者和企业级,满足...……更多
ChatGPT掀AI热潮 这些芯片厂商将“狂飙”
...芯片的需求将暴增,给低迷的半导体行业带来一股暖流,英伟达、三星电子、SK海力士等都将受益。但是英伟达服务器用AI芯片方案存在发热和功耗过大的问题,谷歌、亚马逊AWS、三星电子、SK海力士、百度等科技巨头厂商也在开...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...DU 展现出了独特优势,也被视为 GPU 的最有力竞争者 。与英伟达相比,Sambanova 最新 Llama 3.1 模型上生成 token 的性能快了 10 倍以上,并且通过 cloud.sambanova.ai 公开供开发人员使用。RDU 能够实现更快的推理速率,更利于大模型的部...……更多
英特尔至强6主板曝光:双路带来576小核与32条内存插槽
...协,比如说没有完整的PCIe16插槽,这或许让Gaudi3这样的AI加速卡难以发挥最大的作用。英特尔在之前的发布会上表示,至强6处理器的E核的每瓦性能是上代的2.4倍,机架密度也是上代的2.7倍。英特尔表示72个机架服务器就能完成过...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。▲Groq芯片不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速...……更多
英伟达推新一代芯片H200:内存、带宽大升级
11月14日消息,据外媒体报道称,英伟达今天发布了新一代芯片H200,其整体性能相比上一代有着大幅提升。官方公布的细节显示,新的H200芯片是当前用于训练最先进大语言模型H100芯片的升级产品(基于Hopper架构),集成了141GB...……更多
英伟达“骚操作”令人无语:为了抬价竟让显卡停产1个月?
...式AI恰恰需要基于海量的数据进行推理训练,高算力的GPU加速卡自然也成了市场的抢手货。根据FierceElectronics报道,ChatGPT目前需要用25000块英伟达A100GPU芯片来维持训练。大量公司同样需要基于英伟达的CUDA平台进行对AI的训练和推...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...位的可观测能力,对资源池、队列、节点、任务、实例、加速卡等多个维度实现了无死角的覆盖。 自动容错能力,百舸 Flash Checkpoint 故障恢复机制实现秒级 Checkpoint 和近乎无损的 Step 粒度容错。此外为 PyTorch 大模型训练场景开...……更多
...版和Edge10Max三款芯片,出货形态包括芯片、板卡、盒子、加速卡、推理服务器等,可广泛应用于AIoT边缘视频、移动机器人等场景。此外,依托Dee Edge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百...……更多
最强大模型训练芯片H200发布!
英伟达老黄,带着新一代GPU芯片H200再次炸场。官网毫不客气就直说了,“世界最强GPU,专为AI和超算打造”。听说所有AI公司都抱怨内存不够?这回直接141GB大内存,与H100的80GB相比直接提升76%。作为首款搭载HBM3e内存的GPU,内存...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...是 GPU 的 140 倍。大模型时代,全球都缺算力,买铲子的英伟达市值被炒上了天。现在,终于有一家公司带着自己的 AI 芯片来叫板了。今天凌晨,科技圈迎来了一个重要新闻。美国芯片创业公司 Etched 推出了自己的第一块 AI 芯片 ...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...排名和推荐系统而设计。分析指出,Meta的目标是降低对英伟达等芯片厂商的依赖。10日当天,Meta(Nasdaq:META)股价收于每股519.83美元,涨0.57%,总市值1.33万亿美元。Wind数据显示,自今年年初以来,Meta股价已涨超47%。从名字来...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计,Gaudi 3将于2024年第二...……更多
更多关于科技的资讯:
错过高速出口突然减速压实线变道 被撞后女司机还嘴硬:我没有!
快科技12月3日消息,自己犯了错不想承担后果直接甩锅,那肯定是不能如愿。据“公安部交通管理局”最新披露的案例显示,今年10月19日
2024-12-03 19:07:00
3档功率分流+两档减速器+59度大电池!车圈大V吴佩详解坦克Hi4-Z是何方神圣
快科技12月3日消息,今晚,长城坦克500Hi4-Z正式召开了预售发布会。随后,车圈大V吴佩发文对坦克Hi4-Z的技术进行了详细的解答
2024-12-03 19:07:00
11月新能源汽车销量146万辆创新高:比亚迪真断层式领先
快科技12月3日消息,乘联会综合预估,11月全国新能源乘用车厂商批发销量达146万辆,同比增长51%,环比增长6%。其中
2024-12-03 19:07:00
网友票选最可爱的粉发妹子:一个比一个强
在二次元动漫的世界里面,其实头发颜色可以很自由,金发黑发那种都还算普通,有些角色天生就是蓝发、紫发、红发甚至是可爱的粉红色发色都有
2024-12-03 19:07:00
锐龙7 8700G VS. i7-14700:AI大潮下 谁是更出色的商用台式机处理器!
一、前言:看起来完全不对等的对比测试相对于面对玩家的DIY市场而言,其实商用OEM的量级更大一些!大战商用机在DIY领域
2024-12-03 19:37:00
日本一黑熊闯入超市被捕将处死:不少市民求情“太可怜”
快科技12月3日消息,据日媒报道,近日在日本秋田县,一头体长约1米,体重约70公斤黑母熊闯入超市,一名现年47岁的男性店员在卖场熟食区附近遭袭
2024-12-03 19:37:00
携程客服春节居家办公两个月:可提前返乡
快科技12月3日消息,据媒体报道,携程集团正式开启客服申请提前返乡办公的政策,时间段为2025年1月1日至2025年2月28日
2024-12-03 19:37:00
四味小鱼仔40包13.9元:去头去尾去内脏 肉质紧实有嚼劲
抓鱼的猫四味小鱼仔280g(40包)原价18.9元,领券立减,到手价13.9元。购买链接:天猫(40包13.9元)工厂直发
2024-12-03 20:07:00
因瓦斯罐取暖使用不当 苏州一露营者在帐篷内身亡
12月3日消息,据媒体报道,有网友称苏州金鸡湖畔一位露营者疑似一氧化碳中毒身亡。对此,官方表示,系露营人员瓦斯罐取暖使用不当发生意外
2024-12-03 20:07:00
西伯利亚极寒之地:美的探索家空调真暖咖啡屋温暖雅库茨克的冬天
北极圈附近有许多闻名于世的“寒都”。如冰岛首都雷克雅未克、俄罗斯最大的军港摩尔曼斯克、挪威的“北极之门”特罗姆瑟、阿拉斯加的航空枢纽安克雷奇
2024-12-03 20:07:00
iPhone 16禁令延续!印尼认为一周内可获苹果10亿美元投资承诺
快科技12月3日消息,印尼投资部长今天表示,在因不符合当地内容规定而禁止销售iPhone 16后,印尼预计将在一周内获得苹果10亿美元的投资承诺
2024-12-03 20:07:00
微星新款Claw 8 AI+游戏掌机发布:顶配Ultra 7-258V
快科技12月3日消息,微星Claw 8 AI+游戏掌机目前已经在海外上市,起售价格为799美元(约5815元人民币)。据悉
2024-12-03 20:07:00
火蝠电商可靠吗?靠谱的代运营公司还有哪些?真心求告知
火蝠电商的名字相信不少人都听说过,各大搜索网站也都有它的信息,那么,火蝠电商到底可靠吗?首先,火蝠电商是一家专注于代运营行业的品牌服务商
2024-12-03 20:33:00
4499元起涨价也好卖!曝小米15系列激活量超130万:唯一破百万的新旗舰
快科技12月3日消息,今日,数码博主“数码闲聊站”透露,截止W27(2024年第47周11.18-11.24),小米15系列是第一波母系新旗舰中唯一激活量过百万的新机
2024-12-03 20:37:00
车速10码:男子租车过减速带气囊弹出赔了1000元 走保险更悲催
快科技12月3日消息,今日,广东深圳一男子开租的车过减速带安全气囊突然爆炸弹出,这也引发了网友的围观。随后,当事人肖先生接受采访时表示
2024-12-03 20:37:00