• 我的订阅
  • 头条热搜
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽管Phi-2的参数数量较少,但它在复杂的基准测试中展示了出色的性能,甚至超越了参数数量是其25倍的模型。微...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
GTC 2024硬件一览:史上最强AI芯片GB200发布!
...可实现720petaflops的AI训练性能或1,440petaflops(1.4exaflops)的推理。图片源于网络与相同数量的72个H100相比,GB200NVL72的性能绝对是逆天的存在,大模型推理性能可以提升30倍,并且成本和能耗只有前者的1/25。当然,最炸裂的要数适...……更多
AIGC风潮席卷手机:但在PC面前 还是个弟弟
...全新的NPUAI独立引擎。它通过单独设置的神经计算引擎、推理流水线,彻底接手端侧的AI推理负载,其中MAC阵列可以高效执行矩阵算法和卷积运算,每周期效率多达2048。这样的性能更是手机端望尘莫及的,速度超快的同时功耗更...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...C9X00AI是AI-GPU/AI-PC,Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道,NPU的发展近年来大概有三个方向:首先是DEEP AI,在很多嵌入式设备里面,要把AI跟其它的处理IP做比较紧耦合的绑定,可以...……更多
无惧4K游戏、AI高产利器,RTX 4070 Ti SUPER GAMINGX SLIM显卡实测
...越快。Stable Diffusion支持TensorRT,这是NVIDIA推出的深度学习推理SDK,能优化推理性能、加速各种工作负载,并支持大型语言模型推理。 测试中,常规的Stable Diffusion绘图需要166.7秒,而经过TensorRT加速后仅需99.2秒,速度提升了68%,……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级,加速迈向年轻人工作、学习...……更多
万元内的高性价比专业卡——AMD Radeon Pro W7700显卡简评
...实验室的Procyon Windows AI性能测试项目将对Radeon Pro W7700的AI推理运算性能进行了测试。从测试成绩可以看到,相比Radeon Pro W7600,Radeon Pro 7700的整体性能领先在15%~80%,平均领先程度约为40%。从FP32和FP16的AI推……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...全采用高效的数据流架构,这从根本上限制了 GPU 推理的提速。当前的几家主流 AI 芯片 Startup,都选择了数据流架构。其中来自 SambaNova 的 RDU 展现出了独特优势,也被视为 GPU 的最有力竞争者 。与英伟达相比,Sambanova 最新 Llama 3...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...元导读】史上最快Transformer芯片诞生了!用Sohu跑Llama 70B,推理性能已超B200十倍,超H100二十倍!刚刚,几位00后小哥从哈佛辍学后成立的公司Etached,宣布再融资1.2亿美元。有史以来最快的Transformer芯片,刚刚诞生了?去年21岁哈佛...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
AMD公布全新AI加速卡路线图:CDNA 4架构明年见
...3E,根据AMD提供的PPT,与如今的RDNA3架构相比,RDNA4架构的推理性能提升幅度达到了35倍,而MI350与英伟达B200计算卡相比,内存容量提升了50%,而AI算力也高出了20%,至于到了2026年,AMD更是会推出“RDNNANext”架构,看起来也是一年...……更多
AI背后的算力哪里来?高性能GPU成为行业追捧的香饽饽
...Pro图形显卡非常适合计算机辅助设计和建模(CAD/CAM)、AI推理以及一些商业环境中的媒体处理工作负载,为工作站显卡领域提供了新选择。2023年10月,英特尔又带来了锐炫独立显卡产品中的中端新品锐炫A580,面向游戏玩家和创...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上「需求」。...……更多
AI PC,联想Ready for PC | 焦点分析
...AI PC的发展阶段定义为“AI Ready”:“现在我们主要利用显卡来加强计算能力,计算能力的其中一个指标叫做TOPS(每秒钟可进行一万亿次操作)。现在的PC只能做到10 TOPS,我们觉得理想情况是要做到40 TOPS,才能算是AI第一代。”...……更多
...今年正式投产。据了解,新的芯片将被应用于数据中心的推理任务,与英伟达等供应商的GPU一起协同工作。Meta发言人之前表示:我们相信,我们自主开发的加速器将与市面上的GPU相得益彰,为Meta的任务提供最佳的性能与效率平...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制程,芯片面积为46225平方毫米,拥有的晶体管数量达到了4万亿个,拥有90...……更多
AI浪潮中的美国科技七巨头
...布了两款人工智能专用芯片,分别是训练型芯片Trainium和推理型芯片Inferentia。亚马逊希望Trainium和Inferentia这两款芯片可以帮助人工智能初创公司降低AI训练和AI应用的费用,从而确立AWS在人工智能云服务领域的竞争优势。OpenAI首...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
... 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15...……更多
AIGC时代 人何去何从:注入灵魂 做好主人!
...的步伐,充分认识到AI在未来云计算领域所起的重要增效提速作用。上海开天工作室创始人于广来,从中国文化数字化和实体化发展的角度,展望了AI的未来。在他看来,在数智化主旋律时代,AI将会是我们最忠诚可靠的帮手,借...……更多
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
...三款芯片中性能最佳的一款,更适用于垂类模型的训练、推理。H20的内存高达96GB,整数精度(INT8)算力为296TOPS;L20则配有48 GB内存,整数精度(INT8)算力为239TFLOP;L2配置为24GB内存以及算力为193TFLOP。然而即便是三款芯片中最...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」
...后,模型会高亮显示具体不正确、不相关或虚构的文本。推理:在识别出无根据的段落后,模型会生成解释说明,说明为什么某些文本被标记。这种透明性非常重要,因为它可以让用户明确无根据的点,并评估其不接地的严重性...……更多
英特尔酷睿Ultra笔记本NPU能力体验
...了个AI性能和应用测试。 通过UL Procyon AI Inference Benchmark推理性能基准测试(涵盖MobileNetV3、InceptionV4、YOLOV3、DeepLabV3、Real-ESRGAN和ResNet50等多种神经网络模型)发现……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...点LatePost)昆仑万维方汉:AI“摩尔定律”已出现,端侧推理才是最终解决方案昆仑万维董事长、总经理方汉在会上表示,参考互联网时代发展历程,基于免费模式才能使得AI大模型最大程度普及,这需要通过技术迭代、端侧推理...……更多
算子开发到推理加速,一位00后开发者的“升级打怪”之旅
...过引入Parallel.For循环实现了算子开多核,可以进行多线程提速,让昇思MindSpore的NonZero算子有着不逊于Tensorflow和Pytorch的精度,目前代码已合入CANN主线。相较于最后的结果,郑辉认为自己从过程中获得了更大的价值:“算子开发...……更多
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...环境,可支持超千卡规模、千亿参数级别的大模型训练和推理任务,旨在突破算力瓶颈,加速AI算力的国产化进程。国产千卡智算集群采用软硬件一体化的架构设计,提供低延迟、高吞吐、高可用的IB组网环境,支持GDR技术,使...……更多
更多关于科技的资讯:
叮咚买菜三获“中国食品健康七星奖”,数字化赋能全链路食品安全管理
日前,第十三届“中国食品健康七星奖”(简称“七星奖”)颁奖典礼在上海举行,叮咚买菜凭借行业领先的食安体系及数字化管控能力
2024-11-26 14:57:00
高通收购英特尔兴趣减退:或考虑股权交易
快科技11月26日消息,据报道,有知情人士透露,高通对购英特尔的兴趣已降温,收购的复杂性使得这笔交易对高通的吸引力降低
2024-11-26 15:00:00
华为Mate 70系列正式亮相!余承东:Mate一直被模仿从未被超越
快科技11月26日消息,今天下午14:30,华为Mate品牌盛典在深圳拉开序幕,华为Mate 70系列首发亮相。发布会一开始
2024-11-26 15:00:00
国产家电新巨头!小米首座智能家电工厂正式动工
快科技11月26日消息,据卢伟冰介绍,小米首座智能家电工厂今天正式在武汉奠基动工。他表示,这是小米继“小米手机智能工厂”和“小米汽车工厂”后的又一座大型智能工厂
2024-11-26 15:00:00
榜内唯一周销过万!理想汽车连续31周蝉联新势力销量冠军
快科技11月26日消息,理想汽车在2024年第47周(11月18日至11月24日)的销量数据中表现出色。数据显示,理想汽车在最新一周的周销量达到1
2024-11-26 15:00:00
小米汽车端到端智驾实测:驾驶风格极其拟人 路边有狗也能识别提醒
快科技11月26日消息,小米汽车虽然从上市到交付还不到一年时间,但小米的端到端智驾发展异常迅速。小米将其端到端+VLM架构的智驾命名为HAD
2024-11-26 15:00:00
极氪高管谈特斯拉降价:极氪不会进行价格和权益调整
快科技11月26日消息,近日,特斯拉针对中国市场的Model Y车型的价格进行了调整,售价24.99万Model Y后轮驱动版以及29
2024-11-26 15:00:00
2024年11月26日环洋市场咨询机构出版了一份详细的、综合性的调研分析报告【全球牙科正畸用保持器行业总体规模、主要厂商及IPO上市调研报告
2024-11-26 15:15:00
本文转自:人民网人民网北京11月26日电 (焦磊)为落实科教兴国和创新驱动发展战略,不断塑造人工智能发展新动能、新优势
2024-11-26 15:25:00
史上最耐用Mate!华为Mate 70系列首发高亮钛玄武机身:整机耐摔能力20倍提升
快科技11月26日消息,在今天下午的华为Mate品牌盛典上,余承东宣布华为Mate 70 Pro+业界首发了高亮钛玄武机身
2024-11-26 15:30:00
余承东:靠抄袭是没有未来的
快科技11月26日消息,在今日的华为Mate品牌盛典上,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东发表演讲
2024-11-26 15:30:00
余承东:Mate 70的通信能力对得起那四个字
快科技11月26日消息,华为Mate 70系列今日正式发布,余承东强调“Mate一直被模仿从未被超越”。据介绍,华为Mate 70系列采用第二代灵犀通信
2024-11-26 15:30:00
华为Mate 70整机性能暴增40%:搭载全新硬件、预装原生鸿蒙系统!
快科技11月26日消息,今天下午举办的华为Mate盛典上,华为Mate 70系列正式发布。据了解,得益于原生鸿蒙操作系统与全新硬件配置
2024-11-26 15:30:00
华为Mate70首发AI电影质感引擎 视频能力跨越式升级
快科技11月26日消息,今天下午,华为Mate70正式发布,其视频拍摄能力实现了飞跃性的提升。据官方介绍,得益于全新的AI电影质感引擎
2024-11-26 15:30:00
大模型创业太累大牛逃回大厂:融资1亿美金捉襟见肘 还胖了30斤
大模型创业太累,又一大牛决定重回大厂。Yi Tay,曾是Reka AI联合创始人,也曾是谷歌大模型PaLM、UL2、Flan-2
2024-11-26 15:30:00