• 我的订阅
  • 头条热搜
...NVIDIAHopper架构,配备具有先进内存的NVIDIAH200TensorCoreGPU,可处理生成式AI和高性能计算工作负载的大量数据。该公司预计服务器制造商和云服务提供商将于2024年第二季度开始出货搭载H200的系统。NVIDIAH200是首款提供HBM3e内存(速率...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...达Hopper架构,配备具有先进内存的NVIDIA H200 Tensor Core GPU,可处理生成式AI和高性能计算工作负载的大量数据。H200还是英伟达第一款使用HBM3e内存的芯片。HBM3E是最新一代的内存规格,可以满足用于AI存储必备的速度,也在发热控制...……更多
SK海力士HBM3E内存现已量产,月内将供货给英伟达使用
...速度和热量控制上是目前业界内最好的。最新款HBM3E每秒可处理1.18TB的数据,相当于在一秒内处理230多部全高清电影(每部5GB)。同时,SK海力士的HBM3E产品在采用AdvancedMR-MUF工艺后,与上一代产品相比,散热性能也提高了10%,减...……更多
本周(4.8-4.14)AI界发生了什么?
...企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一次“狙击”谷歌,紧接着发布非预览版的GPT-4 Turbo,将之前独立的 GPT-4 Vision直接集成到模型中,只需一次API调用,该模...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品存在直接竞争关系。当然,答案通常都偏向于英伟达,尤其是在 AI 算力方面,正如前些天李沐在上海...……更多
sk海力士hbm3e开始量产
...。据介绍,SK海力士是首家实现量产HBM3E供应商,HBM3E每秒可处理1.18TB数据,相当于在1秒内可处理230部全高清(FHD)级电影。由于AI对内存的运行速度要求极高,HBM3E相比前几代产品更注重散热方面的表现。SK海力士表示,其HBM3E采...……更多
高通骁龙xelite,性能表现出众
...,骁龙XElite集成的智能传感器内部也装有更新的微型NPU,可处理登录体验、安全和隐私等事务。QualcommAI引擎还支持WindowsStudioEffects以及其他AI加速应用程序。据介绍,搭载骁龙XElite的PC产品预计将于2024年年中由领先的OEM厂商推出...……更多
英伟达blackwell计算引擎制造商推出的ai模型
如果还有人想在AI处理领域跟英伟达正面抗衡,那最好再多做几手准备。除了最强大的技术储备之外,大家可能还需要雄厚的资金支持和上天的意外眷顾。换句话说,如今压制英伟达的唯一可能性恐怕只有天降神迹。日前在圣何...……更多
英伟达推新一代芯片H200:内存、带宽大升级
11月14日消息,据外媒体报道称,英伟达今天发布了新一代芯片H200,其整体性能相比上一代有着大幅提升。官方公布的细节显示,新的H200芯片是当前用于训练最先进大语言模型H100芯片的升级产品(基于Hopper架构),集成了141GB...……更多
infini-attention:谷歌大内存机制
...留最近一段的上下文信息。 对比几种不同Transformer模型可处理上下文的长度和内存占用情况。Infini-attention能在内存占用低的情况下,有效处理非常长的序列。Infini-attention在训练后,分化出了两种不同类型的注意力头,它们协同...……更多
骁龙8 Gen3正式发布:8K240手游成真!
...3.5倍。骁龙8Gen3支持包括MetaLlama2在内的多模型生成式AI,可处理的大模型参数超过100亿,每秒可执行最多20Token,支持个性化定制,也特别注意保护用户个人隐私。 精度方面支持INT4、INT8、INT16、FP16等各种整数和浮点格式,还支...……更多
轻薄本AI出图谁更强?锐龙7 7840S完胜i713700H
...LSTM(时间递归神经网络)等,还具备实时多任务能力,可处理最多4条并发空间流,峰值算力可以达到10TOPS(每秒10万亿次计算)。▲锐龙7040系列移动处理器内置的RyzenAI引擎可以实现本地AI加速,例如为摄像头添加背景虚化、面...……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...得其对于大模型的推理速度提高了10倍以上,甚至超越了英伟达的GPU。推理速度是英伟达GPU的10倍,功耗仅1/10据介绍,Groq的大模型推理芯片是全球首个LPU(Language Processing Unit)方案,是一款基于全新的TSA 架构的Tensor Streaming Proce……更多
索尼ps5pro系统内存曝光:比标准版提升28%
...比,PS5Pro提成了ACV运行频率,因此ACM库的性能提高了35%。可处理更多卷积混响(Convolutionreverb)可处理更多的FFT或IFFTGPU(此前已经爆料)渲染速度比PS5快45%2-3倍光线追踪性能(某些情况下达四倍)33.5TeraflopsPSSR超分辨率技术计划..……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...40GB,内存带宽为20PB/s,结构带宽高达220PB/s。如果将其与英伟达的H100相比,WSE-3面积将是H100的57倍,内核数量是H100的52倍,片上内存是H100的880倍,内存带宽是H100的7000倍,结构带宽是H100的3715倍。( H200 的 HBM3e 仅拥有 4.……更多
英伟达发布Llama-3.1-Nemotron-51B AI 模型
IT之家 9 月 25 日消息,英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-5……更多
AMD最强AI芯片发布:性能是英伟达H100的1.3倍!
...面向AI及HPC领域的GPU产品InstinctMI300A/MI300X加速器,直接与英伟达(NVIDIA)H100加速器竞争。同时AMD还发布了代号为HawkPoint的最新一代Ryzen8000系列APU,可面向AIPC产品。MI300A:HPC性能达到NVIDIAH100的4倍虽然在今……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...及 2 倍的网络带宽提升。同时,在AI模型算力中,相比于英伟达H100 GPU,Gaudi3 AI芯片的模型训练速度、推理速度分别提升40%和50%,平均性能提高 50%,能效平均提高40%,而成本仅为H100的一小部分。英特尔预计,Gaudi 3将于2024年第二...……更多
amd旗舰aigpu加速器mi300x对比英伟达h100
...ngAI”活动中,正式宣布了旗舰AIGPU加速器MI300X,其性能比英伟达的H100高出60%。性能:AMD公司在演讲过程中,对比英伟达的H100加速卡,分享了MI300X的性能参数情况,IT之家附上数值如下:内存容量是H100的2.4倍内存带宽是H100的1.6倍...……更多
英伟达尖端图像处理半导体h200开始供货
3月28日消息,据报道,英伟达的尖端图像处理半导体(GPU)H200现已开始供货。H20为面向AI领域的半导体,性能超过当前主打的H100。根据英伟达方面公布的性能评测结果,以Meta公司旗下大语言模型Llama2处理速度为例,H2000相比于H...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
【新智元导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多...……更多
...计算单元更少,只有228个。在发布会上,AMD几乎全程对标英伟达H100 芯片。从官方披露的数据来看,MI 300X的内存配置是英伟达H100的2.4 倍,峰值存储带宽也是英伟达的2.4 倍,另外, FP8、FP16、TF32算力是英伟达H00的 1.3 倍。软件是 ...……更多
sk海力士lpddr5t完成性能及兼容性验证
...量为16GB的套装产品,数据处理速度为77GB/s,相当于1秒内可处理15部全高清(Full-HD,FHD)级别的电影。LPDDR5T兼具了高速度和低功耗的特性,在JEDEC设定的1.01V至1.12V超低电压范围内运行,同样集成了HKMG工艺,并采用了1αnm工艺制造...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
...是 GPU 的 140 倍。大模型时代,全球都缺算力,买铲子的英伟达市值被炒上了天。现在,终于有一家公司带着自己的 AI 芯片来叫板了。今天凌晨,科技圈迎来了一个重要新闻。美国芯片创业公司 Etched 推出了自己的第一块 AI 芯片 ...……更多
响应速度碾压英伟达,AI芯片领域又出“王炸” 创始人豪言将把计算成本“降至零”
...初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。▲Groq芯片不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速...……更多
nvidia发布hgxh200加速器
...,只有更强。现在,NVIDIA又发布了全新的HGXH200加速器,可处理AIGC、HPC工作负载的海量数据。NVIDIAH200的一大特点就是首发新一代HBM3e高带宽内存(疑似来自SK海力士),单颗容量就多达141GB(原始容量144GB但为提高良率屏蔽了一点点),...……更多
华硕发布首款“Copilot + PC”笔记本
...核提升的版本。IT之家附上相关图片如下:两种S15配置均可处理高达32GB的板载内存和1TB的PCIe4.0SSD存储,并配有两个USB-A端口、两个USB4.0Type-C端口、一个HDMI2.1、一个音频/麦克风组合插孔和一个microSD读卡器,此外还支持Wi-Fi7和蓝牙...……更多
黄仁勋万字答问实录:AI的下一个浪潮是什么?
AI(人工智能)芯片龙头英伟达CEO黄仁勋在英伟达GPU技术大会(GTC)上打开了话匣子。当地时间3月19日,在座无虚席的英伟达GTC大会主题演讲结束后的第二天,黄仁勋参加全球媒体采访,回答了来自二十几家媒体的采访问题。这...……更多
双十一购物狂欢,这四款手机不容错过!
...还搭载了全新升级的XiaomiAI大模型计算摄影平台2.0,每秒可处理高达43亿像素的图像数据,带来出色的摄影体验。无论是风景、人像还是夜景,都能轻松拍出大片效果。 ……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
... 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达 GPU 的 AI 推理解决方案的 20 倍。 除了令人难以置信的性能之外,这款新型推理解决方案的定价也比流行的 GPU 云低得多,起价仅为每百万个 token 10 美分,从而为 AI...……更多
更多关于科技的资讯:
智慧家庭重磅文件,征求意见稿来了!事关千亿市场、8大应用场景
智东西11月22日消息,11月21日,中华人民共和国工业和信息化部官网发布《智慧家庭综合标准化体系建设指南(2024版)》(征求意见稿)
2024-11-23 09:40:00
拿下游戏界「人民选择奖」的《黑神话:悟空》,年底还有更多惊喜
拿下游戏界「人民选择奖」的《黑神话:悟空》,年底还有更多惊喜黎明前线Alan2024/11/23中国游戏,首次以金摇杆历史最高票数获奖
2024-11-23 09:40:00
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
智东西11月22日报道,今日,一年一度的2024 IDEA大会在深圳举行,这场由美国国家工程院外籍院士沈向洋发起的人工智能盛会
2024-11-23 09:42:00
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
在智慧城市和大数据时代背景下,人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务
2024-11-23 09:42:00
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月
2024-11-23 09:42:00
如今的智能体,已经像人一样「浏览」视频了,国内就有
当你正在观看一部紧张刺激的动作电影,忽然好奇:“那个角色到底是在哪一集说的那句话?”“这里的背景音乐是什么?”又或者在一场足球比赛中
2024-11-23 09:43:00
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换
2024-11-23 09:43:00
机器人训练数据不缺了!英伟达团队推出DexMG:数据增强200倍
【新智元导读】最近,Jim Fan参与的一项研究推出了自动化数据生成系统DexMimicGen。该系统可基于少量人类演示
2024-11-23 09:44:00
OpenAI 与全世界最新锐的团队,想要用 AI 完成对浏览器的「复兴」
AGI 时代如果我们还需要浏览器,那它会是什么「形状」?网景公司创始人 Marc Andreessen 曾过说:浏览器可以说是有史以来对人们生活影响最大的一个软件
2024-11-23 09:44:00
被迫剥离Chrome和安卓?谷歌或将迎来“至暗时刻”
谷歌的“至暗时刻”或许才刚刚开始。当地时间 11 月 20 日晚,美国司法部正式向美国联邦法院提交了一份最终判决建议书(以下简称“建议书”)
2024-11-23 09:48:00
第一批用AI的外贸人已经赢麻了|钛媒体「出海参考」
图片AI生成11月21日傍晚,阿里巴巴集团发布全员邮件宣布成立电商事业群,整合国内外电商业务,同时,邮件中表示,电商进入了新时代
2024-11-23 09:49:00
华为官宣新旗舰鸿蒙平板,重塑智慧办公新高度
11月21日,华为终端正式官宣新旗舰鸿蒙平板将在华为Mate品牌盛典首发亮相。同时,华为终端BG首席执行官何刚也发文表示
2024-11-23 09:50:00
华为手机激活量份额连创近三年新高!同比去年大涨
【CNMO科技消息】在经历快速发展后,华为手机已经重新回到舞台中央。据CNMO了解,华为近三周的手机激活量份额都创下了近三年的新高
2024-11-23 09:50:00
小米 REDMI“Turbo ”逐步承接“K”系列位置,后者继续往上突破
IT之家 11 月 21 日消息,小米 REDMI 全新品牌标识今日正式登场。新标识采用红色设计,代表敢红的心气和能红的底气
2024-11-23 09:50:00
世界首款内生安全 MCU 芯片“ESC0830”在江苏南京发布
IT之家 11 月 22 日消息,第四届网络空间内生安全学术大会今日(11 月 22 日)在江苏南京开幕。紫金山实验室正式发布世界首款内生安全 MCU 芯片“ESC0830”等系列重大科研成果
2024-11-23 09:52:00