• 我的订阅
  • 头条热搜
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
智东西8月28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带...……更多
星凡科技与国星宇航战略合作,解锁太空算力“天地同算”新篇章
...,以及吞吐量及并发量、功耗等性能优势,为客户以极高性价比搭建及极低成本运营智算中心提供保障。通过地面智算中心与太空AI卫星互联,实现天地数据实时互通、实施计算,服务于人工智能代理、具身智能两大场景,赋能...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
...万个 token 10 美分,从而为 AI 工作负载提供 100 倍更高的性价比。该方案将允许 AI 应用程序开发人员构建下一代 AI 应用程序,而不会影响速度或成本。该方案使用了 Cerebras CS-3 系统及其 Wafer Scale Engine 3(WSE-3)AI 处理器,其中 ……更多
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
...尔® 至强® 可扩展处理器用于AI加速工作负载的代际提升性价比高;另一方面,它可以覆盖从数据预处理、训练、推理的整个AI管线,实现端到端的AI加速。更重要的是,广泛且规模庞大的x86 CPU生态系统,为极速爆发的AI业务转型...……更多
节后娱乐消费重整旗鼓
...,让没有经验的玩家爱上剧本杀,再加上68元/盒的均价,性价比高,DM(剧本主持人)的开本质量高,形成了不错的口碑。“在这个特殊时期,有他们支持才能坚持下来。”为了接下来的春节假期,顾来燕做了很多准备,首先安...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...理算力需求占比,原来走 GPU训练路线的,这种芯片由于性价比较低,在推理时代可能无法维持其高毛利率。 不过据财联社援引路透社报道,有知情人士表示,由于对DeepSeek低成本人工智能模型的需求激增,中国企业正在增加英...……更多
...客户的需求,为客户量身设计方案并协助落地,可以提供性价比最优的一个算力中心,这是在算力中心建设方面的优势;其次我们更加专注于GPU的资源优化,还可以为用户提供定制化的模型服务,确保数据隐私安全,保障企业的...……更多
破解实时性与成本难题!白山云发布“大模型API”产品
...分布式算力下沉与智能调度,能够为高实时、高隐私、高性价比场景提供关键支撑,驱动AI从集中式智能迈向“云-边-端”全域协同智能。聚焦边缘推理场景,白山云基于全球1700 边缘节点构成的算力网络基座,于今年3月推出“...……更多
ai生命周期:ai训练和ai推理的完美结合
...这个阶段使用常规的CPU最合适,其性能、能效、兼容性、性价比完美符合AI推理需求。当然,这对CPU的综合素质也是有着很高的需求的,足够强大且平衡的性能、能效、成本才能带来足够高的效率、效益。一般来说,GPU训练,CPU...……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...的同时,其能耗成本仅有英伟达GPU的十分之一,这等于是性价比提高了100倍。 Groq公司在演示中展示了其芯片的强大性能,支持Mistral AI的Mixtral8x7B SMoE,以及Meta的Llama2的7B和70B等多种模型,支持使用4096字节的上下文长度,并可直...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...知识库;对象存储OSS推出 Vector Bucket,为向量数据提供高性价比的海量存储,相比自建开源向量数据库,成本骤降95%,结合OSS MetaQuery 语义检索和内容感知能力,可快速构建RAG等AI应用。在AI智算集群层面,智能计算灵骏集群通过...……更多
算力概念股,集体爆发
...证券认为,AI推理降本有望带动AI应用的爆发,ASIC作为高性价比的算力方案,有望充分受益推理算力需求增长。目前北美CSP已经积极布局ASIC,另外模型厂商如OpenAI也在积极布局ASIC。ASIC有望迎来高速增长。看好ASIC设计服务公司、...……更多
京东云发布八大领先智算产品,助力企业火速用上大模型
...云城市大会在深圳顺利举行。会上,京东云发布八大极致性价比的智算产品,五种全场景大模型部署模式,同时推出“开发训练+场景应用”双引擎一站式平台,助力企业实现DeepSeek等大模型开箱即用、智能体深度开发与应用,全...……更多
...,苦恼于多种款式和不同价格,拍下比较图问AI:“选出性价比最高的一款”;当你在健身对吃大餐有负担,拍下菜单发给AI:“挑出高蛋白、低脂肪的食物”……这意味着R1方法让模型真正“学会”了理解视觉内容,而非简单的...……更多
复旦大学漆远:DeepSeek将推理成本降至百万token仅1元人民币,加速AI普及
...的4%。将推理成本降至百万token仅需1元人民币,具备极高性价比。“正因使用成本的降低,让DeepSeek一举成为现象级应用,被大家广泛使用。吸引更多AI研究者和使用者入局的趋势,将持续上演。”漆远表示。漆远强调,“领域-...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。Yi 大模型 API 开放平台 (https://platform.lingyiwanwu.com/) 其中,千亿参数规模的 Yi-Large API 具备超强……更多
百度加码AI见效?一季度智能云营收增42%,文心4.5模型6月将开源
...宏认为,智能云业务表现强劲,是市场对百度提供的“高性价比全栈AI产品及解决方案”认可度与日俱增的体现。同时他提到,萝卜快跑全球拓展加速,进入迪拜和阿布扎比市场也为智能云业务增长带来帮助。“我们相信,AI-firs...……更多
字节猛踩油门
...对外支持。通过技术和资源复用,我们能为内外客户提供性价比更高的服务,像我们的MaaS和云服务,性价比优势就源于此,而且实现统一后,无需纠结资源分配偏向内部还是外部,因为技术需求基本一致,全球优秀的云服务提...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
...千帆发布智能体Pro及MCP服务企业部署大模型,不仅需要高性价比的模型服务,更需要全面的模型工具。在模型服务层面,目前千帆平台上有超过100多个模型,不仅包括文心4.5Turbo、文心X1Turbo等百度自研模型,还包括DeepSeek、Ilama...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...PU 的预期价格,似乎英伟达将与 AMD MI300X 加速器开始比拼性价比。另外,也许 AMD 会在今年晚些时候推出 MI325X GPU。 重点关注推理AMD 的数据直到上周才发布。业内有传言说 AMD 签了一些大订单,会把 MI300X 出售给超大规模计算公...……更多
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
...示,亚马逊的自研芯片相比英伟达同规格产品拥有更高的性价比。《财经》从亚马逊云科技相关人士处了解到,在实际使用环境中,Trainium 2与英伟达A100芯片对比,可以至少节省10%以上的成本。 ……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...的问题。所以,AMD在过去的半年时间里,即使发布了更具性价比的MI300X,也依然无法撼动英伟达的地位,甚至不需要去讨论生态等问题,仅仅一个算力规模和效率差距就已经让AMD难以招架。不过AMD的AI业务还是得到了不少的订单...……更多
中信证券:政务系统加速接入DeepSeek 2G信息化迎来新机遇
...使其加速改造升级;2)国资云/政务云:具有安全性高、性价比高的特点,支撑政务IT系统+DeepSeek高效推理。/阅读下一篇/返回网易首页下载网易新闻客户端 ……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...最新生成式AI实例Amazon EC2 Trn2,比当前基于GPU的EC2实例的性价比高出30%~40%。 苹果机器学习和人工智能高级总监Benoit Dupin来到现场,称苹果在iPad、Apple Music、Apple TV、新闻、App Store、Siri等产品和服务上广泛使用了亚……更多
CPU,正在被AI时代抛弃?
...述需求其实不在少数,基于CPU的推理方案无疑是一种更具性价比的选择。不仅能够满足其业务需求,还能有效控制成本、保证系统的稳定性和数据的安全性。但这也就愈发让我们好奇,作为通用服务器,CPU在AI时代可以发挥怎样...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...et反超GPT-4o,和o1打平。——不是o1玩不起,而是开挂更有性价比。怎样才能把Claude 3.5调教成比博士还要强的o1呢?在OpenAI o1的官网中有下面这样一个范例,从密文和明文的对应中找关系,然后解码一段新的密文。老实说,如果没...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...元化场景需要;支持私有化部署,无需服务器,实现超高性价比;支持云端模型更新和升级,实现大模型边缘应用的高易用性。 开普云大模型平台产品:驾驭智能,驱动未来 开普云未来科技研究院副院长倪金松介绍了两款大...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...日科技网】AI时代,亲民、易用的CPU如何能实现相比GPU更具性价比的加速方案?英特尔® 至强® 可扩展处理器给出答案:内置AI加速引擎,更好地承载人工智能应用工作负载。千呼万唤始出来,第五代英特尔®️ 至强®️ 可扩展处理器,...……更多
西南地区首个千卡GPU推理集群——云锦天府·立昂领算云平台揭牌
...牌。在该算力平台的加持下,园区可提供灵活、弹性、高性价比的GPU集群,支持大模型训练及应用推理,能够有效适配数字人场景下的渲染、建模、自然语言识别和语音合成等需求。同时,平台还满足云渲染、虚拟直播和三维建...……更多
提质降价,国产大模型加速奔跑
...力推进大模型的后训练及推理侧工程技术优化。未来,高性价比的大模型服务有望增加。”李论说。 前景更好“边干边学”是趋势多位业内人士表示,理想情况下,大模型产品应实现价格、私密安全性和大模型能力效果的平衡...……更多
更多关于科技的资讯:
葵花药业×淘宝闪购签署战略合作:共探“AI+超级入口”下的医药即时零售新范式
11月28日,在2025淘宝闪购“聚势共赢”医药即时电商峰会现场,葵花药业集团与淘宝闪购正式签署战略合作协议,成为淘宝闪购医药健康领域首批战略级合作伙伴之一
2025-12-03 10:11:00
解码三一重能:风电龙头的突围与出海
十月的北京,三一重能南口产业园区内,一座数十米高的风力发电机静静运转,园区内却是一派繁忙景象。作为三一集团在京重要产业集群
2025-12-03 10:11:00
摘要:本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析,探讨薪资分布的现状及其影响因素。研究发现,一线城市和二线城市在薪资水平上存在显著差异
2025-12-03 06:16:00
“张叔叔,这银行卡的密码可不能随便告诉别人,就连短信验证码也得藏好,那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水
2025-12-02 10:21:00
中国移动成功举办“AI赋能医院后勤管理新发展”论坛
2025年11月27至29日,由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛
2025-12-02 11:03:00
腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
“具身智能是AI赛道中的焦点,其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力,助力具身智能赛道与广大企业共同发展
2025-12-02 11:03:00
在大健康消费升级与抗衰需求爆发的今天,麦角硫因作为“线粒体级”超级抗氧化剂,已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示
2025-12-02 11:31:00
企业数字化转型不断深化,业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座
2025-12-02 11:42:00
11月21日,富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护 创造美好生活”为主题的健康险产品矩阵暨服务升级发布会
2025-12-02 12:11:00
GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书,成为兼具安全性
2025-12-02 14:27:00
从梅酒到书籍:梅见的文化升维之路
步入繁华的商业街区,不难发现一个耐人寻味的现象:店铺橱窗中的传统文化元素,正以近乎重复的方式不断上演。印着汉字 logo 的T恤
2025-12-02 14:35:00
丝玫瑰携手首玺丽格 科创驱动美力升级
2025年12月2日,由键凯科技旗下医美产品线品牌——丝玫瑰®(SILKROSE)与北京首玺丽格联合举办的“中国‘智’造
2025-12-02 15:35:00
白酒+体育IP重构行业营销新范式,五粮液世界杯联名款京东首发
鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日,五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市
2025-12-02 15:36:00
从“车间老师傅”到“门店销冠”:飞书AI正在重塑吉利汽车研究院、亚朵酒店的一线战场
当AI逐渐褪去神秘面纱,谁是这场技术变革真正的操盘手?答案是:一线业务人。 近日,首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官
2025-12-02 15:58:00
中新经纬12月2日电 题:即时零售不再打“补贴战”了作者 江瀚 盘古智库高级研究员随着资本耐心减弱,单纯依赖补贴拉动的增长已难以为继
2025-12-02 16:09:00