• 我的订阅
  • 头条热搜
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽管Phi-2的参数数量较少,但它在复杂的基准测试中展示了出色的性能,甚至超越了参数数量是其25倍的模型。微...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
GTC 2024硬件一览:史上最强AI芯片GB200发布!
...可实现720petaflops的AI训练性能或1,440petaflops(1.4exaflops)的推理。图片源于网络与相同数量的72个H100相比,GB200NVL72的性能绝对是逆天的存在,大模型推理性能可以提升30倍,并且成本和能耗只有前者的1/25。当然,最炸裂的要数适...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...The」。完整的回复,花了整整20个小时熟悉模型的训练和推理的朋友都知道,这些事情一点都不奇怪。集群搭建(GPU配置、网络设计、轨道优化等)、集群管理(实时监控、故障排除等)……个个都是「拦路虎」。对于缺乏相关...……更多
AIGC风潮席卷手机:但在PC面前 还是个弟弟
...全新的NPUAI独立引擎。它通过单独设置的神经计算引擎、推理流水线,彻底接手端侧的AI推理负载,其中MAC阵列可以高效执行矩阵算法和卷积运算,每周期效率多达2048。这样的性能更是手机端望尘莫及的,速度超快的同时功耗更...……更多
NPU全球出货超1亿颗!芯原如何迎战大模型时代的边缘计算变革?
...C9X00AI是AI-GPU/AI-PC,Tensor Core GPU IP CCTC-MP则面向大语言模型推理、训练。芯原NPU IP研发副总裁查凯南谈道,NPU的发展近年来大概有三个方向:首先是DEEP AI,在很多嵌入式设备里面,要把AI跟其它的处理IP做比较紧耦合的绑定,可以...……更多
无惧4K游戏、AI高产利器,RTX 4070 Ti SUPER GAMINGX SLIM显卡实测
...越快。Stable Diffusion支持TensorRT,这是NVIDIA推出的深度学习推理SDK,能优化推理性能、加速各种工作负载,并支持大型语言模型推理。 测试中,常规的Stable Diffusion绘图需要166.7秒,而经过TensorRT加速后仅需99.2秒,速度提升了68%,……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面升级,加速迈向年轻人工作、学习...……更多
万元内的高性价比专业卡——AMD Radeon Pro W7700显卡简评
...实验室的Procyon Windows AI性能测试项目将对Radeon Pro W7700的AI推理运算性能进行了测试。从测试成绩可以看到,相比Radeon Pro W7600,Radeon Pro 7700的整体性能领先在15%~80%,平均领先程度约为40%。从FP32和FP16的AI推……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...全采用高效的数据流架构,这从根本上限制了 GPU 推理的提速。当前的几家主流 AI 芯片 Startup,都选择了数据流架构。其中来自 SambaNova 的 RDU 展现出了独特优势,也被视为 GPU 的最有力竞争者 。与英伟达相比,Sambanova 最新 Llama 3...……更多
AMD公布全新AI加速卡路线图:CDNA 4架构明年见
...3E,根据AMD提供的PPT,与如今的RDNA3架构相比,RDNA4架构的推理性能提升幅度达到了35倍,而MI350与英伟达B200计算卡相比,内存容量提升了50%,而AI算力也高出了20%,至于到了2026年,AMD更是会推出“RDNNANext”架构,看起来也是一年...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...元导读】史上最快Transformer芯片诞生了!用Sohu跑Llama 70B,推理性能已超B200十倍,超H100二十倍!刚刚,几位00后小哥从哈佛辍学后成立的公司Etached,宣布再融资1.2亿美元。有史以来最快的Transformer芯片,刚刚诞生了?去年21岁哈佛...……更多
AI背后的算力哪里来?高性能GPU成为行业追捧的香饽饽
...Pro图形显卡非常适合计算机辅助设计和建模(CAD/CAM)、AI推理以及一些商业环境中的媒体处理工作负载,为工作站显卡领域提供了新选择。2023年10月,英特尔又带来了锐炫独立显卡产品中的中端新品锐炫A580,面向游戏玩家和创...……更多
AI PC,联想Ready for PC | 焦点分析
...AI PC的发展阶段定义为“AI Ready”:“现在我们主要利用显卡来加强计算能力,计算能力的其中一个指标叫做TOPS(每秒钟可进行一万亿次操作)。现在的PC只能做到10 TOPS,我们觉得理想情况是要做到40 TOPS,才能算是AI第一代。”...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...」图/ X(Twitter) 但算力依然受限,核心是大模型训练、推理都严重依赖于英伟达高端 GPU,而英伟达又受限于台积电先进芯片制造工艺、封装工艺以及韩国 HBM 内存的产能。说到底,还是算力不够用,「供给」赶不上「需求」。...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制程,芯片面积为46225平方毫米,拥有的晶体管数量达到了4万亿个,拥有90...……更多
AI浪潮中的美国科技七巨头
...布了两款人工智能专用芯片,分别是训练型芯片Trainium和推理型芯片Inferentia。亚马逊希望Trainium和Inferentia这两款芯片可以帮助人工智能初创公司降低AI训练和AI应用的费用,从而确立AWS在人工智能云服务领域的竞争优势。OpenAI首...……更多
...今年正式投产。据了解,新的芯片将被应用于数据中心的推理任务,与英伟达等供应商的GPU一起协同工作。Meta发言人之前表示:我们相信,我们自主开发的加速器将与市面上的GPU相得益彰,为Meta的任务提供最佳的性能与效率平...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...市场拱手让人。另一方面,随着大模型产业的快速发展,推理成本飞速下降,也成为终端降价的基础。据百度官方透露,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了1...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
... 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达……更多
AIGC时代 人何去何从:注入灵魂 做好主人!
...的步伐,充分认识到AI在未来云计算领域所起的重要增效提速作用。上海开天工作室创始人于广来,从中国文化数字化和实体化发展的角度,展望了AI的未来。在他看来,在数智化主旋律时代,AI将会是我们最忠诚可靠的帮手,借...……更多
微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」
...后,模型会高亮显示具体不正确、不相关或虚构的文本。推理:在识别出无根据的段落后,模型会生成解释说明,说明为什么某些文本被标记。这种透明性非常重要,因为它可以让用户明确无根据的点,并评估其不接地的严重性...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...结合了两个B200 GPU和一个独立的Grace CPU,将能够使大模型推理工作负载的性能提升30倍,同时提高效率。相比于H100,它可以“将成本和能源消耗降至1/25”。这就意味着,以前训练一个拥有1.8万亿参数的模型需要8000个Hopper GPU 和15...……更多
英伟达特供芯片卖不动了?黄仁勋穿上东北花袄“示好”,中国大厂难掩AI野心
...三款芯片中性能最佳的一款,更适用于垂类模型的训练、推理。H20的内存高达96GB,整数精度(INT8)算力为296TOPS;L20则配有48 GB内存,整数精度(INT8)算力为239TFLOP;L2配置为24GB内存以及算力为193TFLOP。然而即便是三款芯片中最...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
...最为关键的三大层面,即:算力层:用于基础模型训练和推理的基础设施 模型层:使用基础模型加速生成式AI应用构建 应用层:开箱即用的生成式AI应用至于能力如何,我们直接来看下最为直观的效果。在生成式AI应用方面,...……更多
英特尔酷睿Ultra笔记本NPU能力体验
...了个AI性能和应用测试。 通过UL Procyon AI Inference Benchmark推理性能基准测试(涵盖MobileNetV3、InceptionV4、YOLOV3、DeepLabV3、Real-ESRGAN和ResNet50等多种神经网络模型)发现……更多
\\\
...到双核x86 CPU的110倍。而到了GB200,与H100相比,可以将LLM推理工作的性能提高30倍,并将成本和能耗降低25倍。在这场全球AI大模型军备竞赛中,Meta、微软在内的科技巨头纷纷加码下注,根据FactSet的统计,今年一季度,亚马逊、谷...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...点LatePost)昆仑万维方汉:AI“摩尔定律”已出现,端侧推理才是最终解决方案昆仑万维董事长、总经理方汉在会上表示,参考互联网时代发展历程,基于免费模式才能使得AI大模型最大程度普及,这需要通过技术迭代、端侧推理...……更多
高通自研CPU架构要上手机!软硬全家桶亮相China Joy,对话高管:解密生成式AI杀手锏
...以直接通过语音跟AI队友进行交流。据了解,很多端侧的推理都放在了三代高通骁龙8的NPU上,这降低了推理的延迟,让玩家可以有更流畅的游戏体验,据称最长响应时长也在1秒以内。当然,这样的端侧AI推理也可以降低成本,让...……更多
更多关于科技的资讯:
香港维尔利健康科技集团健康管理设备通过中国检测上市,开启健康调理新格局
香港维尔利健康科技集团近日宣布,其最新研发的健康管理设备已顺利通过中国权威机构检测,并正式投入市场。此次检测涵盖负氧磁养生舱
2025-03-05 10:52:00
香港中农国际集团携手约翰迪尔,共推全球智能农业科技创新
香港中农国际集团(简称“香港中农国际”)与全球农业机械及智能农业领域的领导者——约翰迪尔(JohnDeere)正式达成战略合作
2025-03-05 10:53:00
中国网3月5日讯(记者李智)2025年全国两会正式拉开帷幕,众多跨国公司高度关注中国两会。松下控股株式会社全球副总裁、集团中国东北亚总代表本间哲朗在接受中国网记者专访时提到了近来热词——人工智能(AI)
2025-03-05 10:58:00
还是极氪车主会玩!直接给极氪 007GT上“新皮肤”了
这几天极氪全新猎装车极氪007GT的热度太高了!目前新车只是亮相,还没正式发布呢,一些会玩的极氪车主就给极氪007GT二创出这么多好看的“车衣”
2025-03-05 10:59:00
亿兰科与泰国Engiga合作升级,共谋国际化发展新布局
近日,Engiga于泰国曼谷盛大举办了开业典礼!作为亿兰科在泰国及整个东南亚区域的核心合作伙伴,Engiga将与我司共谋发展
2025-03-05 11:00:00
华网·两会科技聚焦|京东曹鹏:打破“机房睡大觉”困局,构建异构算力新生态
文|罗曾2025年全国两会期间,中华网财经了解到,全国政协委员、京东集团技术委员会主席曹鹏提交了《关于推进异构算力基础设施建设
2025-03-05 11:02:00
华网·两会科技聚焦|小米雷军:从智驾量产到车联互通、号牌升级,全面激活智能汽车产业
文|罗曾2025年全国两会期间,全国人大代表、小米集团创始人兼CEO雷军提交了五份提案,聚焦自动驾驶量产落地、智能网联新能源汽车生态构建
2025-03-05 11:05:00
本文转自:人民网-重庆频道代表委员说夏泳:加快推动“疆算入渝”打造西部算力枢纽人民网记者 胡虹“‘疆算入渝’的核心在于将新疆丰富的风光电资源与重庆的算力需求相结合
2025-03-05 11:14:00
POSITIVEHOTEL地中海咖啡,摩登时尚生活的一部分
引言近年来,国内咖啡市场持续繁荣增长,消费场景日益多元化,除传统线下咖啡门店外,办公室、家庭等也逐渐成为咖啡消费的重要阵地
2025-03-05 11:17:00
用户增长超预期的秘密:乐信分期乐会员体系深度解析
乐信分期乐通过精细化会员等级体系设计,实现用户留存率阶梯式跃升,黑金会员留存率高达97%,成为消费金融领域用户运营标杆
2025-03-05 11:19:00
造物数科PCB电路板打样必读:丝印环节关键注意事项及PCB共享设计应用探索
在PCB电路板的制造过程中,丝印(Silkscreen)是一个关键步骤,主要用于在电路板上印刷标识、元器件编号、极性标记
2025-03-05 11:32:00
全球首个人形机器人半马即将鸣枪
昨天,在北京市政府新闻办公室举行的发布会上,北京经济技术开发区(也称“北京亦庄”)介绍,全球首个人形机器人半程马拉松赛将于4月13日在北京亦庄半程马拉松赛期间举行
2025-03-05 11:32:00
周云杰代表:不断地寻尖、拔尖,才能真正成为顶尖
本文转自:人民网“走上通道的代表”系列策划——周云杰代表:不断地寻尖、拔尖,才能真正成为顶尖十四届全国人大三次会议首场“代表通道”上
2025-03-05 11:43:00
造物数科:以PCB创新之力,重塑智能家居未来
随着科技的飞速发展,智能家居正逐渐从概念走向现实,为人们的生活带来了前所未有的便捷与舒适。在这一变革中,印制电路板(PCB)作为电子设备的核心组件
2025-03-05 11:43:00
巴展手记:老钱带新贵,中国 AI 加速出海, 处处可见“六小龙”
出品|搜狐科技作者|杨锦“宇树的展台在哪里?这个产品支持 DeepSeek 吗?”作为全球通信行业最大盛会的“巴展”,今年终于被 AI 彻底 攻陷了
2025-03-05 11:43:00