• 我的订阅
  • 头条热搜
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...狐科技作者 | 梁昌均在全球算力荒的情况下,AI芯片巨头英伟达加速算力竞赛。当地时间11月13日,英伟达宣布推出新一代人工智能芯片H200,称其是目前世界“最强”的AI芯片。H200此次升级主要体现在带宽更高、容量更大的内存...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品存在直接竞争关系。当然,答案通常都偏向于英伟达,尤其是在 AI 算力方面,正如前些天李沐在上海...……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
IT之家 9 月 25 日消息,英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-5……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...得其对于大模型的推理速度提高了10倍以上,甚至超越了英伟达的GPU。推理速度是英伟达GPU的10倍,功耗仅1/10据介绍,Groq的大模型推理芯片是全球首个LPU(Language Processing Unit)方案,是一款基于全新的TSA 架构的Tensor Streaming Proce……更多
英伟达blackwell计算引擎制造商推出的ai模型
如果还有人想在AI处理领域跟英伟达正面抗衡,那最好再多做几手准备。除了最强大的技术储备之外,大家可能还需要雄厚的资金支持和上天的意外眷顾。换句话说,如今压制英伟达的唯一可能性恐怕只有天降神迹。日前在圣何...……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...AI PC处理器、EPYC处理器、GPU加速卡等多款重磅产品。作为英伟达为数不多的友商,AMD对这一波新品寄予厚望,发布会还特意邀请了OpenAI、微软等巨头的大佬来站台,然而市场对其产品却不看好,其股价也应声下跌。难道AMD挑战英...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带宽是英伟达的7000倍,而价格仅为GPU的1/5,性价比提高了100倍。Cerebras Inference还提供多个服务层次,包括免费、开发者和企业级,满足...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...DU 展现出了独特优势,也被视为 GPU 的最有力竞争者 。与英伟达相比,Sambanova 最新 Llama 3.1 模型上生成 token 的性能快了 10 倍以上,并且通过 cloud.sambanova.ai 公开供开发人员使用。RDU 能够实现更快的推理速率,更利于大模型的部...……更多
最强大模型训练芯片H200发布!
英伟达老黄,带着新一代GPU芯片H200再次炸场。官网毫不客气就直说了,“世界最强GPU,专为AI和超算打造”。听说所有AI公司都抱怨内存不够?这回直接141GB大内存,与H100的80GB相比直接提升76%。作为首款搭载HBM3e内存的GPU,内存...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...排名和推荐系统而设计。分析指出,Meta的目标是降低对英伟达等芯片厂商的依赖。10日当天,Meta(Nasdaq:META)股价收于每股519.83美元,涨0.57%,总市值1.33万亿美元。Wind数据显示,自今年年初以来,Meta股价已涨超47%。从名字来...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
... 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达 GPU 的 AI 推理解决方案的 20 倍。 除了令人难以置信的性能之外,这款新型推理解决方案的定价也比流行的 GPU 云低得多,起价仅为每百万个 token 10 美分,从而为 AI...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定大型语言模型的速度快40%,在推理端比英伟达H100快50%。基辛格在现场表示,Gaudi 3的性能将与英伟达H200相当,在某些领域的性能甚至会更...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
万众瞩目的英伟达GPU技术大会(GTC)如期举行,备受期待的最新AI芯片也被如期推出。当地时间3月18日,黄仁勋发表主题演讲《见证AI的变革时刻》。在两个小时的演讲中,黄仁勋围绕五大板块,介绍了英伟达的最新研发进展:...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...d又宣布了炸裂的新消息:已筹到1.2亿美元。 就在上周,英伟达的市值达到3.3万亿美元,超过微软成为全球第一。而Etched相信,自己的35人团队能够击败英伟达。他们的豪放预言,得到了硅谷真金白银的支持。投资名单中,是一...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...(涵盖系统、数据和 pipeline)是必不可少的。本文,来自英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校的研究者引入了 LongVILA,这是一种用于训练和部署长上下文视觉语言模型的全栈解决方案,包括系统设计、模型训练策略...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计,Gaudi 3将于2024年第二...……更多
英伟达尖端图像处理半导体h200开始供货
3月28日消息,据报道,英伟达的尖端图像处理半导体(GPU)H200现已开始供货。H20为面向AI领域的半导体,性能超过当前主打的H100。根据英伟达方面公布的性能评测结果,以Meta公司旗下大语言模型Llama2处理速度为例,H2000相比于H...……更多
英伟达发布GB200计算卡:2080亿个晶体管,AI性能提升5倍
在这个星球上,英伟达毫无疑问是如今的AI之王,其推出的H100已经被众多科技企业抢购,而英伟达的营收和利润也是节节攀升。但是在这个算力决定效率的今天,英伟达H100计算卡的算力还远远不够,尤其是像Sora这样的文生视频...……更多
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
算力芯片的火,从2023年一直燃烧到2024年。开年不久,英伟达CEO黄仁勋时隔四年到访中国大陆,还穿上了东北大花袄与国内员工共舞,气氛无比热络,似乎是在对自家芯片遇冷的传言进行某种回应。2023年,英伟达的AI芯片成了科...……更多
英伟达推新一代芯片H200:内存、带宽大升级
11月14日消息,据外媒体报道称,英伟达今天发布了新一代芯片H200,其整体性能相比上一代有着大幅提升。官方公布的细节显示,新的H200芯片是当前用于训练最先进大语言模型H100芯片的升级产品(基于Hopper架构),集成了141GB...……更多
AMD MI300绝杀英伟达H100?跑GPT-4性能超25%,AI芯片大决战一触即发
...芯片大决战,不少芯片初创公司跃跃欲试,希望一举打破英伟达的垄断地位。而AMD的MI300,在部署32K上下文窗口的GPT-4模型时,居然比H100效果更好?AI芯片大决战,即将来临!AI硬件开发商初创公司的未来会怎样?Tenstorrent CEO David...……更多
AMD发布最强AI芯片,对标英伟达Blackwell,2025年上市
...率先在其商用 PC 上采用 Ryzen AI Pro 300 系列处理器。 对标英伟达最强 AI 芯片:Instinct MI355X 加速卡最近,全球 AI 芯片供不应求,AMD 已成为 GPU 领域的重要玩家,今天该公司宣布了最新的 AI 加速器和用于 AI 基础设施的网络解决方...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...夜,谷歌(Google)、AMD先后上新,终于要“打爆”OpenAI和英伟达了。钛媒体App 12月7日消息,北京时间今天凌晨,谷歌CEO桑达尔·皮查伊 (Sundar Pichai) 宣布,谷歌公司正式发布迄今为止功能最强大、最通用的多模态人工智能(AI)...……更多
ChatGPT掀AI热潮 这些芯片厂商将“狂飙”
...芯片的需求将暴增,给低迷的半导体行业带来一股暖流,英伟达、三星电子、SK海力士等都将受益。但是英伟达服务器用AI芯片方案存在发热和功耗过大的问题,谷歌、亚马逊AWS、三星电子、SK海力士、百度等科技巨头厂商也在开...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...丨创业邦(ID:ichuangyebang)作者丨Juny编辑丨海腰图源丨英伟达官方好久没有一场大会让整个科技界都如此躁动。今天早间,在位于硅谷San Jose的麦克内里会议中心,英伟达2024 GTC大会标识已被高高挂起,并在下方悬挂着一行醒目...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。▲Groq芯片不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速...……更多
...,并推出了全新系列的NDH100v5虚拟机。这款虚拟机搭载了英伟达最新的H100TensorCore图形处理单元(GPU)和低延迟网络技术。该虚拟机在美国东部和美国中南部的Azure区域已经可供使用。它配备了八个英伟达H100TensorCoreGPU,比上一代...……更多
amd旗舰aigpu加速器mi300x对比英伟达h100
...ngAI”活动中,正式宣布了旗舰AIGPU加速器MI300X,其性能比英伟达的H100高出60%。性能:AMD公司在演讲过程中,对比英伟达的H100加速卡,分享了MI300X的性能参数情况,IT之家附上数值如下:内存容量是H100的2.4倍内存带宽是H100的1.6倍...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...40GB,内存带宽为20PB/s,结构带宽高达220PB/s。如果将其与英伟达的H100相比,WSE-3面积将是H100的57倍,内核数量是H100的52倍,片上内存是H100的880倍,内存带宽是H100的7000倍,结构带宽是H100的3715倍。( H200 的 HBM3e 仅拥有 4.……更多
更多关于科技的资讯:
近日,深圳市元征科技股份有限公司(元征科技)在知识产权局成功取得了一项名为“车辆配置字写入方法、装置、电子设备及存储介质”的专利
2025-01-10 16:39:00
在当今房地产市场的动态格局中,存量房领域正逐渐成为行业焦点。据数据推算,全国旧改规模约在 1.6 - 2.4 万亿元,2022 - 2025 年均投资约 2100 - 2700 亿元
2025-01-10 16:44:00
无惧严峻挑战,文远知行自动驾驶小巴成功落地瑞士苏黎世机场
2025 年 1 月 9 日,“全球Robotaxi第一股”文远知行重磅宣布,其与瑞士苏黎世机场达成深度合作,正式开启自动驾驶小巴于苏黎世机场的测试运营
2025-01-10 16:45:00
共享全球化发展经验,TCL荣获“年度卓越管理奖”
1月8日,第六届“卓越管理奖”公布。以TCL全球化发展为样本的案例《TCL:以本土化战略驱动全球化发展》荣获该奖项,并摘得“年度领航出海奖”
2025-01-10 16:45:00
1299元!特斯拉新年充电权益二选一:2.5折安家充桩或用三年低价超充桩
快科技1月10日消息,特斯拉官方今日公布了2025年特斯拉特享充电权益。Model 3/Y新车主,花费1299元可享受充电权益二选一的服务
2025-01-10 16:50:00
是语文出了轨 还是数学劈了腿 深圳小学数学试卷因阅读量大上热搜!
快科技1月10日消息,据媒体报道,近日,深圳南山因为一张小学数学试卷冲上了热搜。事情的起因是题目过难、阅读量很大,四年级数学考试延长了20分钟
2025-01-10 16:50:00
央视蛇年春晚第二次联排 沈腾、马丽现身 网友:春晚小品台柱子
快科技1月10日消息,据搜狐娱乐“狐厂大拷问”官微,今日,中央广播电视总台《2025年春节联欢晚会》举行第二次联排,众多明星现身
2025-01-10 16:50:00
Altera正式宣布从英特尔独立!已升起独立大旗
快科技1月10日消息,前身为英特尔PSG(可编程解决方案)事业部的 Altera,本周在加州圣何塞总部正式升起一面“Altera”旗帜
2025-01-10 16:50:00
什么牌子的nmn最好?2025年度NMN十大产品排名对比评测
衰老是生命过程中不可避免的一部分,但研究表明一些物质可能有助于延缓衰老过程,其中包括β-烟酰胺单核苷酸(NMN)。NMN是一种有望延缓衰老的物质
2025-01-10 16:52:00
本文转自:人民网-广西频道1月8日,桂林深科技有限公司仓库智能机器人井然有序,正在将出口阿联酋价值1325万元的出口锂电手机出库
2025-01-10 16:56:00
夸克登顶中国AI应用活跃用户总榜 一站式AI服务打造强大产品力
近日,易观分析发布的《2025年AI产业发展十大趋势》报告显示,夸克位居中国AI应用活跃用户榜单第一,同时成为唯一一款00后年轻用户数量占比超过50%的AI应用
2025-01-10 17:09:00
海尔智家:布局2024,开启2025
时光如梭,转眼已迈入2025年。回顾过去的一年,海尔智家做了一次系统的盘点。我们发现,这一年,海尔智家在品牌并购、全球供应链布局
2025-01-10 17:20:00
遇到地震怎么办:牢记四个动作
1月10日消息,遇到地震,我们该怎么办?据媒体报道,地震发生后,有四个动作我们需要牢记:就近躲避、扶稳抓牢、单手遮挡、小步快走
2025-01-10 17:21:00
何小鹏回应“撞脸”特斯拉新Model Y :好的设计总是心有灵犀
快科技1月10日消息,1月10日,小鹏汽车法国设计师Ferrag Rafik在Instagram上发布长文,阐述小鹏汽车设计语言的发展
2025-01-10 17:21:00
奔驰总裁:网传新款奔驰GLA采用吉利发动机不属实
快科技1月10日消息,据报道,梅赛德斯-奔驰(中国)投资有限公司高级执行副总裁、负责梅赛德斯-奔驰中国研发和采购的欧立甫今日表示
2025-01-10 17:21:00