• 我的订阅
  • 头条热搜
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
智东西8月28日消息,AI芯片独角兽Cerebras Systems于8月27日宣布推出AI推理服务Cerebras Inference,号称“全球最快”。该服务已经在云端上线。据官网介绍,该推理服务在保证精度的同时,速度比英伟达的服务快20倍;其处理器内存带...……更多
星凡科技与国星宇航战略合作,解锁太空算力“天地同算”新篇章
...,以及吞吐量及并发量、功耗等性能优势,为客户以极高性价比搭建及极低成本运营智算中心提供保障。通过地面智算中心与太空AI卫星互联,实现天地数据实时互通、实施计算,服务于人工智能代理、具身智能两大场景,赋能...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
...万个 token 10 美分,从而为 AI 工作负载提供 100 倍更高的性价比。该方案将允许 AI 应用程序开发人员构建下一代 AI 应用程序,而不会影响速度或成本。该方案使用了 Cerebras CS-3 系统及其 Wafer Scale Engine 3(WSE-3)AI 处理器,其中 ……更多
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
...尔® 至强® 可扩展处理器用于AI加速工作负载的代际提升性价比高;另一方面,它可以覆盖从数据预处理、训练、推理的整个AI管线,实现端到端的AI加速。更重要的是,广泛且规模庞大的x86 CPU生态系统,为极速爆发的AI业务转型...……更多
节后娱乐消费重整旗鼓
...,让没有经验的玩家爱上剧本杀,再加上68元/盒的均价,性价比高,DM(剧本主持人)的开本质量高,形成了不错的口碑。“在这个特殊时期,有他们支持才能坚持下来。”为了接下来的春节假期,顾来燕做了很多准备,首先安...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...理算力需求占比,原来走 GPU训练路线的,这种芯片由于性价比较低,在推理时代可能无法维持其高毛利率。 不过据财联社援引路透社报道,有知情人士表示,由于对DeepSeek低成本人工智能模型的需求激增,中国企业正在增加英...……更多
...客户的需求,为客户量身设计方案并协助落地,可以提供性价比最优的一个算力中心,这是在算力中心建设方面的优势;其次我们更加专注于GPU的资源优化,还可以为用户提供定制化的模型服务,确保数据隐私安全,保障企业的...……更多
破解实时性与成本难题!白山云发布“大模型API”产品
...分布式算力下沉与智能调度,能够为高实时、高隐私、高性价比场景提供关键支撑,驱动AI从集中式智能迈向“云-边-端”全域协同智能。聚焦边缘推理场景,白山云基于全球1700 边缘节点构成的算力网络基座,于今年3月推出“...……更多
ai生命周期:ai训练和ai推理的完美结合
...这个阶段使用常规的CPU最合适,其性能、能效、兼容性、性价比完美符合AI推理需求。当然,这对CPU的综合素质也是有着很高的需求的,足够强大且平衡的性能、能效、成本才能带来足够高的效率、效益。一般来说,GPU训练,CPU...……更多
AI推理速度提升超10倍,Groq LPU能否取代英伟达GPU?
...的同时,其能耗成本仅有英伟达GPU的十分之一,这等于是性价比提高了100倍。 Groq公司在演示中展示了其芯片的强大性能,支持Mistral AI的Mixtral8x7B SMoE,以及Meta的Llama2的7B和70B等多种模型,支持使用4096字节的上下文长度,并可直...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...知识库;对象存储OSS推出 Vector Bucket,为向量数据提供高性价比的海量存储,相比自建开源向量数据库,成本骤降95%,结合OSS MetaQuery 语义检索和内容感知能力,可快速构建RAG等AI应用。在AI智算集群层面,智能计算灵骏集群通过...……更多
算力概念股,集体爆发
...证券认为,AI推理降本有望带动AI应用的爆发,ASIC作为高性价比的算力方案,有望充分受益推理算力需求增长。目前北美CSP已经积极布局ASIC,另外模型厂商如OpenAI也在积极布局ASIC。ASIC有望迎来高速增长。看好ASIC设计服务公司、...……更多
京东云发布八大领先智算产品,助力企业火速用上大模型
...云城市大会在深圳顺利举行。会上,京东云发布八大极致性价比的智算产品,五种全场景大模型部署模式,同时推出“开发训练+场景应用”双引擎一站式平台,助力企业实现DeepSeek等大模型开箱即用、智能体深度开发与应用,全...……更多
...,苦恼于多种款式和不同价格,拍下比较图问AI:“选出性价比最高的一款”;当你在健身对吃大餐有负担,拍下菜单发给AI:“挑出高蛋白、低脂肪的食物”……这意味着R1方法让模型真正“学会”了理解视觉内容,而非简单的...……更多
复旦大学漆远:DeepSeek将推理成本降至百万token仅1元人民币,加速AI普及
...的4%。将推理成本降至百万token仅需1元人民币,具备极高性价比。“正因使用成本的降低,让DeepSeek一举成为现象级应用,被大家广泛使用。吸引更多AI研究者和使用者入局的趋势,将持续上演。”漆远表示。漆远强调,“领域-...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...口,保证客户能够在不同场景下都能找到最佳性能、最具性价比的方案,Yi API Platform 英文站同步对全球开发者开放试用申请。Yi 大模型 API 开放平台 (https://platform.lingyiwanwu.com/) 其中,千亿参数规模的 Yi-Large API 具备超强……更多
百度加码AI见效?一季度智能云营收增42%,文心4.5模型6月将开源
...宏认为,智能云业务表现强劲,是市场对百度提供的“高性价比全栈AI产品及解决方案”认可度与日俱增的体现。同时他提到,萝卜快跑全球拓展加速,进入迪拜和阿布扎比市场也为智能云业务增长带来帮助。“我们相信,AI-firs...……更多
字节猛踩油门
...对外支持。通过技术和资源复用,我们能为内外客户提供性价比更高的服务,像我们的MaaS和云服务,性价比优势就源于此,而且实现统一后,无需纠结资源分配偏向内部还是外部,因为技术需求基本一致,全球优秀的云服务提...……更多
百度智能云两大基础设施再升级!打造AI时代最开放的智能基础设施
...千帆发布智能体Pro及MCP服务企业部署大模型,不仅需要高性价比的模型服务,更需要全面的模型工具。在模型服务层面,目前千帆平台上有超过100多个模型,不仅包括文心4.5Turbo、文心X1Turbo等百度自研模型,还包括DeepSeek、Ilama...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...PU 的预期价格,似乎英伟达将与 AMD MI300X 加速器开始比拼性价比。另外,也许 AMD 会在今年晚些时候推出 MI325X GPU。 重点关注推理AMD 的数据直到上周才发布。业内有传言说 AMD 签了一些大订单,会把 MI300X 出售给超大规模计算公...……更多
下一个OpenAI+微软?Anthropic将使用数十万枚亚马逊自研芯片
...示,亚马逊的自研芯片相比英伟达同规格产品拥有更高的性价比。《财经》从亚马逊云科技相关人士处了解到,在实际使用环境中,Trainium 2与英伟达A100芯片对比,可以至少节省10%以上的成本。 ……更多
发布一揽子新品,AMD再次挑战英伟达!但败局早已注定?
...的问题。所以,AMD在过去的半年时间里,即使发布了更具性价比的MI300X,也依然无法撼动英伟达的地位,甚至不需要去讨论生态等问题,仅仅一个算力规模和效率差距就已经让AMD难以招架。不过AMD的AI业务还是得到了不少的订单...……更多
中信证券:政务系统加速接入DeepSeek 2G信息化迎来新机遇
...使其加速改造升级;2)国资云/政务云:具有安全性高、性价比高的特点,支撑政务IT系统+DeepSeek高效推理。/阅读下一篇/返回网易首页下载网易新闻客户端 ……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...最新生成式AI实例Amazon EC2 Trn2,比当前基于GPU的EC2实例的性价比高出30%~40%。 苹果机器学习和人工智能高级总监Benoit Dupin来到现场,称苹果在iPad、Apple Music、Apple TV、新闻、App Store、Siri等产品和服务上广泛使用了亚……更多
CPU,正在被AI时代抛弃?
...述需求其实不在少数,基于CPU的推理方案无疑是一种更具性价比的选择。不仅能够满足其业务需求,还能有效控制成本、保证系统的稳定性和数据的安全性。但这也就愈发让我们好奇,作为通用服务器,CPU在AI时代可以发挥怎样...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...et反超GPT-4o,和o1打平。——不是o1玩不起,而是开挂更有性价比。怎样才能把Claude 3.5调教成比博士还要强的o1呢?在OpenAI o1的官网中有下面这样一个范例,从密文和明文的对应中找关系,然后解码一段新的密文。老实说,如果没...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...元化场景需要;支持私有化部署,无需服务器,实现超高性价比;支持云端模型更新和升级,实现大模型边缘应用的高易用性。 开普云大模型平台产品:驾驭智能,驱动未来 开普云未来科技研究院副院长倪金松介绍了两款大...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...日科技网】AI时代,亲民、易用的CPU如何能实现相比GPU更具性价比的加速方案?英特尔® 至强® 可扩展处理器给出答案:内置AI加速引擎,更好地承载人工智能应用工作负载。千呼万唤始出来,第五代英特尔®️ 至强®️ 可扩展处理器,...……更多
西南地区首个千卡GPU推理集群——云锦天府·立昂领算云平台揭牌
...牌。在该算力平台的加持下,园区可提供灵活、弹性、高性价比的GPU集群,支持大模型训练及应用推理,能够有效适配数字人场景下的渲染、建模、自然语言识别和语音合成等需求。同时,平台还满足云渲染、虚拟直播和三维建...……更多
提质降价,国产大模型加速奔跑
...力推进大模型的后训练及推理侧工程技术优化。未来,高性价比的大模型服务有望增加。”李论说。 前景更好“边干边学”是趋势多位业内人士表示,理想情况下,大模型产品应实现价格、私密安全性和大模型能力效果的平衡...……更多
更多关于科技的资讯:
储热赋能双碳 智慧引领供热 泰山集团高电压直入式电储能技术破解能源转型难题
鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下,电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈
2025-12-04 09:57:00
上海街头的数字生活指南,是城市数字品牌与公共艺术的对话
在上海,街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌,是“智云上海”这个城市信息化名片的立体呈现
2025-12-04 08:17:00
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00
近期,在“智绘星空胜算在天—太空数据中心建设工作推进会”上,北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统
2025-12-03 09:42:00
太极韵动武汉,一场独属于银发爱好者的健康之约
承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕
2025-12-03 13:40:00
杭州日报讯 产品还没走下生产线,就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前,工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”
2025-12-03 13:41:00
本报记者 陆春花 为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作,推动江苏制造高质量“走出去”、精准“引进来”
2025-12-03 13:41:00
曹操出行与越疆合作,人形机器人入驻行业首个“绿色智能通行岛”,推进具身智能在出行、物流领域的规模化应用
12月1日,曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi(自动驾驶出租车)运营场景,共同探索机器人技术在车辆清洁
2025-12-03 13:41:00
江苏“领航工厂”引领“智造”变革
从“智慧车间”到“工业大脑”,“江苏智造”通过数据驱动全流程变革,赋能产业链协同升级 近日,全国首批15家领航级智能工厂名单发布
2025-12-03 13:41:00
国内首款AI助盲眼镜发布,基于通义千问打造
12月3日,杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造,具有出行避障
2025-12-03 13:41:00
橙友“橙汁儿”向橙柿直通车反映:这几天收到了短信,是杭州市公共自行车公司发来的——“尊敬的用户,由于业务升级,您之前办理的绑卡租车功能即将在2025年12月底取消
2025-12-03 13:41:00