• 我的订阅
  • 头条热搜
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...B左右的内存,即使完全忽略内存消耗,也需要305张Groq LPU加速卡才够用。如果考虑到内存消耗,可能需要572张Groq LPU加速卡。官方数据显示,Groq LPU的平均功耗为185W,即使不计算外围设备的功耗,572张Groq LPU加速卡的总功耗也高...……更多
amd旗舰aigpu加速器mi300x对比英伟达h100
...00高出60%。性能:AMD公司在演讲过程中,对比英伟达的H100加速卡,分享了MI300X的性能参数情况,IT之家附上数值如下:内存容量是H100的2.4倍内存带宽是H100的1.6倍FP8TFLOPS精度是H100的1.3倍FP16TFLOPS精度是H100的1.3倍在1v1比较中,训练L……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...进行大幅提升。英伟达于2022年发布了基于Hopper架构的H100加速卡,而现在推出基于Blackwell的加速卡在性能上也得到了全面提升,更擅长处理AI相关任务。从外观来看,Blackwell GPU的体积明显大于H100,采用台积电的4纳米(4NP)工艺...……更多
英伟达尖端图像处理半导体h200开始供货
...运算处理装置)组合的新产品用于最新的LLM上。“最强AI加速卡”GB200包含了两个B200BlackwellGPU和一个基于Arm的GraceCPU ,推理大语言模型性能比H100提升30倍,成本和能耗降至25分之一。GB200采用新一代AI图形处理器架构Blackwell,黄仁...……更多
英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出|硅基世界
...售的两款“特供版”AI 芯片产品。具体包括两种硬件形态加速卡:一款型号为HL-328的OAM兼容夹层卡(Mezzanine Card),预计将于今年6月24日推出;另一款是型号为HL-388的PCle加速卡,预计将于今年9月24日推出。而基于内核数量、工作...……更多
微软紧随英伟达发布芯片,老黄还不慌吗?
...款最热门产品的产能和需求,但据外媒报道,今年内H100加速卡的产能至少同比增长了3倍,且仍有许多产能瓶颈无法解决。比如台积电5nm生产线产能,英伟达的GPU必须使用台积电的CoWoS封装技术,市面上完全找不到别的替代品。...……更多
AI芯片下半场:英伟达不再一家独大
...分向客户提供。另一个芯片大厂AMD也在不久前推出了最新加速卡Instinct MI300X。在发布会现场,PPT上专门打出一行字——大语言模型专用,这被业界视为直接向英伟达宣战。据悉,MI300X的高带宽内存(HBM)密度最高可达英伟达H100...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...狐科技作者 | 梁昌均在全球算力荒的情况下,AI芯片巨头英伟达加速算力竞赛。当地时间11月13日,英伟达宣布推出新一代人工智能芯片H200,称其是目前世界“最强”的AI芯片。H200此次升级主要体现在带宽更高、容量更大的内存...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...模型的性能需求,同时在成本上也是远低于那些高昂的AI加速卡。 英特尔表示,在使用2S 五代至强平台上运行GPT-J 6B模型(60亿参数),它可以实现在大约25毫秒下完成一个Token的处理。不过,对于运行更大的Llama 2 13B模型时,其...……更多
sk海力士hbm3e开始量产
3月19日消息,英伟达今日发布了地表最强的AI加速卡--BlackwellGB200,采用台积电4NP工艺制程,配备192HBM3E内存,共有2080亿个晶体管,推理大语言模型性能比H100提升30倍,成本和能耗降低96%。SK海力士今日发布新闻稿宣布其最新的超...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...希姆STCP920系列采用12nm工艺,是基于RISC-V的人工智能计算加速卡,具备较高的云端AI计算能效比和可编程性,混合支持FP16/INT8数据类型。希姆计算将其在传统AI场景里的方案针对大模型进行了专门的优化,姚金鑫坦言,这一一体机...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...的芯片可有不同的组合方式,包括CPU+GPU、CPU+TPU、CPU+其他加速卡等。相比于通用服务器,AI服务器更适应AI训练和推理的大算力、高并发、大数据流转等需求,已经成为大模型时代的“香饽饽”。以热门AI服务器型号浪潮NF5688M6服...……更多
英特尔至强6主板曝光:双路带来576小核与32条内存插槽
...协,比如说没有完整的PCIe16插槽,这或许让Gaudi3这样的AI加速卡难以发挥最大的作用。英特尔在之前的发布会上表示,至强6处理器的E核的每瓦性能是上代的2.4倍,机架密度也是上代的2.7倍。英特尔表示72个机架服务器就能完成过...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。▲Groq芯片不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速...……更多
英伟达推新一代芯片H200:内存、带宽大升级
11月14日消息,据外媒体报道称,英伟达今天发布了新一代芯片H200,其整体性能相比上一代有着大幅提升。官方公布的细节显示,新的H200芯片是当前用于训练最先进大语言模型H100芯片的升级产品(基于Hopper架构),集成了141GB...……更多
...版和Edge10Max三款芯片,出货形态包括芯片、板卡、盒子、加速卡、推理服务器等,可广泛应用于AIoT边缘视频、移动机器人等场景。此外,依托Dee Edge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百...……更多
最强大模型训练芯片H200发布!
英伟达老黄,带着新一代GPU芯片H200再次炸场。官网毫不客气就直说了,“世界最强GPU,专为AI和超算打造”。听说所有AI公司都抱怨内存不够?这回直接141GB大内存,与H100的80GB相比直接提升76%。作为首款搭载HBM3e内存的GPU,内存...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...排名和推荐系统而设计。分析指出,Meta的目标是降低对英伟达等芯片厂商的依赖。10日当天,Meta(Nasdaq:META)股价收于每股519.83美元,涨0.57%,总市值1.33万亿美元。Wind数据显示,自今年年初以来,Meta股价已涨超47%。从名字来...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计,Gaudi 3将于2024年第二...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
...集群。同时,摩尔线程CEO张建中在当天发布了大模型智算加速卡MTT S4000,以及专为千亿参数大模型训练和推理提供支持的摩尔线程KUAE平台。近年在AI热潮之下,国内的智算中心不断兴建。根据此前国家信息中心联合浪潮信息发布...……更多
AMD最强AI芯片发布:性能是英伟达H100的1.3倍!
...面向AI及HPC领域的GPU产品InstinctMI300A/MI300X加速器,直接与英伟达(NVIDIA)H100加速器竞争。同时AMD还发布了代号为HawkPoint的最新一代Ryzen8000系列APU,可面向AIPC产品。MI300A:HPC性能达到NVIDIAH100的4倍虽然在今……更多
四月AI芯片三连发,英伟达:无惧竞争!
...AMD的InstinctMI300。美银分析师VivekArya发表研究报告指出,英伟达2024年AI加速器的占有率将超过75%,定制化芯片(如GoogleTPU、亚马逊Trainium/Inferentia加速器、微软Maia)的占有率为10~15%,而剩余的10~15%才是AMD、英特尔及……更多
英伟达斥巨资拿下hbm3内存供应合同
...消息,韩国ChosunBiz报道称,除了大量预定台积电产能外,英伟达还斥巨资拿下了HBM3内存的供应合同。消息人士称,该公司从美光和SK海力士那里预购了700亿至1万亿韩元(IT之家备注:当前约3.84亿至54.9亿元人民币)的HBM3内存。虽...……更多
英伟达blackwell计算引擎制造商推出的ai模型
如果还有人想在AI处理领域跟英伟达正面抗衡,那最好再多做几手准备。除了最强大的技术储备之外,大家可能还需要雄厚的资金支持和上天的意外眷顾。换句话说,如今压制英伟达的唯一可能性恐怕只有天降神迹。日前在圣何...……更多
amd发布新一代面向ai/hpc加速器
...U+GPU的融合加速器。对于MI300X这款APU,AMD对比英伟达的H100加速卡,分享了MI300X的一些性能参数情况,具体数值如下:内存容量是H100的2.4倍;内存带宽是H100的1.6倍;FP8TFLOPS精度是H100的1.3倍;FP16TFLOPS精度是H100的1.3倍;在1v……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的速度快40%,在推理端比英伟达H100快50%。基辛格在现场表示,Gaudi 3的性能将与英伟达H200相当,在某些领域的性能甚至会更...……更多
英伟达GTC前瞻:最强AI芯片B100将问世,产品路线图有望公布
市场期待AI(人工智能)芯片龙头英伟达即将给出关于“史上最强AI芯片”B100的更多细节。万众瞩目的英伟达GPU技术大会(GTC)开幕在即。当地时间3月18日,黄仁勋将发表主题演讲《见证AI的变革时刻》。市场普遍预计,英伟达...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
在这个星球上,英伟达毫无疑问是如今的AI之王,其推出的H100已经被众多科技企业抢购,而英伟达的营收和利润也是节节攀升。但是在这个算力决定效率的今天,英伟达H100计算卡的算力还远远不够,尤其是像Sora这样的文生视频...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...夜,谷歌(Google)、AMD先后上新,终于要“打爆”OpenAI和英伟达了。钛媒体App 12月7日消息,北京时间今天凌晨,谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 宣布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)...……更多
【玖越机器人】视频网站为了降本纷纷砍画质,为何只有谷歌仍在坚持?
...所以谷歌采用了固件管理的队列来启用并发转码。编辑VCU加速卡/ 谷歌比如某个操作是“将这一帧的画面编码为VP9位流,”那么应用程序负责将指令写入队列中,固件则只负责队列调度和编解码器核心的激活。如此一来编程只发...……更多
更多关于科技的资讯:
生物反应器打破“卡脖子”,国产替代率已超50%
不久前,CDMO巨头药明生物宣布建成旗下首批5000L一次性生物反应器,这三组新落成的生物反应器共可为其生物药原液二十厂(MFG20)增加15000L的产能
2024-07-19 09:43:00
甘肃庆阳“算力”携手百度“大模型”共探AI时代创新生态
央广网兰州7月18日消息7月18日,百度智能云主旨讲演暨千帆大模型(庆阳)赋能创新中心揭牌仪式举行,地企携手共话大模型时代新机遇
2024-07-19 09:44:00
红米新机官宣:7月19日,全新发布
随着7月份的新机越来越丰富,红米、真我、iQOO、荣耀等品牌在7月份都发布了新机,部分品牌还是发布了多款新机,不仅仅只是智能手机
2024-07-19 09:44:00
钛动科技:游戏出海做好本地化,赢得全球玩家喜爱
在全球化和互联网技术日益发展的今天,中国企业出海的热潮逐渐兴起,游戏企业也不再满足于只服务国内玩家。据Newzoo的数据显示
2024-07-19 09:45:00
定点装车!巨湾技研氢燃料专用超充电池正式亮相
近日,巨湾技研获广汽日野汽车有限公司定点,为广汽日野18吨氢燃料电池厢式物流车(公告批次号385)提供动力电池并完成装车
2024-07-19 09:45:00
人工智能时代,教育变革走向何方?教育机制如何转变?
数字化、智能化时代,ChatGPT等前沿技术的出现正在加速教育模式转型。这样变革的时代,教育变革将走向何方?如何推动教育创新
2024-07-19 09:45:00
科沃斯机器人大模型算法行业首家通过国家备案
日前,科沃斯公司研发的科沃斯机器人大模型算法成功通过国家网信办深度合成服务算法备案,这也是国内家用机器人领域首个通过国家备案的大模型算法
2024-07-19 09:45:00
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出
2024-07-19 09:45:00
抓住万亿物联网市场机遇,移远通信实现扭亏为盈!
物联网和人工智能已经在改变千行百业。特别是生成式AI登上时代的舞台,企业纷纷顺势而为,并加速智能化升级。由此,各界对人工智能
2024-07-19 09:46:00
余承东吹的牛实现了!华为鸿蒙最后一块拼图,即将拼完
都说余承东吹牛是打草稿,并不是乱吹的。很多人统计了余承东吹的牛,或快或慢,但最后大多数还是实现了的,所以很多人称,余承东负责吹牛
2024-07-19 09:46:00
怎么制作自己的小程序商城
小程序商城的设计是至关重要的。一个好的设计能够吸引用户的眼球,提高用户体验。小程序的页面简洁、清晰,避免过度装饰和复杂的布局
2024-07-19 09:47:00
欧盟又出手,谷歌和三星因 AI 合作而遭反垄断调查
IT之家 7 月 18 日消息,三星电子上周在巴黎举办的 Galaxy Unpacked 活动上发布了最新的可折叠智能手机 Galaxy Z Fold 6 和 Flip 6
2024-07-19 09:47:00
AI智慧体验+6100mAh大电池,千元档全能手机麦芒30正式发布
7月18日,主打“超续航、巨抗造、真臻彩”的千元档最强全能手机麦芒30正式发布。据悉,该机在智慧体验、屏幕护眼、续航、耐摔
2024-07-19 09:47:00
这个光刻机做的风扇,我试了发现真有点东西
不开玩笑,我们可能是国内第一个用上“光刻风扇”的媒体。不知道差友们还有没有印象,去年我们专门写过一篇文章,介绍了一家叫 Frore Systems 的硅谷创业公司
2024-07-19 09:50:00
NVIDIA重磅官宣!全面开源GPU内核驱动:闭源显卡驱动将被弃用
快科技7月18日消息,NVIDIA宣布将全面转向开源GPU内核模块,并且表示最终开源内核模块会取代闭源的驱动程序。在2022年5月的时候
2024-07-19 09:51:00