• 我的订阅
  • 头条热搜
Meta连甩AI加速大招 首推AI推理芯片 AI超算专供大模型训练
...急剧增长,Meta正执行一项宏伟计划——专为AI建设下一代基础设施。Meta公布了其为AI构建下一代基础设施的最新进展,包括首款用于运行AI模型的定制芯片、一个全新的AI优化数据中心设计、首款视频转码ASIC,以及集成16000块GPU...……更多
AI服务器缺货真相调查:两天涨价30万,连“味精大王”都入场了
...层的“盖章”。10月8日,工信部等六部门联合印发《算力基础设施高质量发展行动计划》,计划提出,到2025年我国算力规模超过300EFLOPS(300百亿亿次浮点运算/秒),智能算力占比达到35%。而对比中国信通院数据,截至今年6月底...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...术,提供部署便利性、性能和价值。RAG可使企业在标准云基础设施上运行的大量现存专有数据源得到开放大语言模型(LLM)功能的增强,加速生成式AI在企业中的应用。进入4月以来,英特尔股价累计跌幅超过13%。外媒指出,新的...……更多
Meta首次公布AI芯片细节 功耗低于英伟达
...亿个参数。Meta去年开启大规模裁员,并转而加大对AI技术基础设施的投资建设。不过,它没有就MTIA新型芯片的部署时间表发表评论。Meta承认,MTIA芯片在处理高复杂度AI模型时仍然面临挑战,但在处理中低复杂度模型时,比竞争...……更多
AI算力大战开启:英特尔AI芯片性能超越H100,谷歌云推出最强ARM芯片|钛媒体AGI
...t Gelsinger)实际上,随着ChatGPT爆火,AI 模型、数据、算力基础设施成为生成式 AI 技术发展的三大要素。据Gartner数据显示,2024年,企业在生成式 AI 方向上预期支出达400亿美元,到2027年这一数据增至1510亿美元。与此同时,到2026...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
...满足大模型的“暴力”计算需求,国内GPU企业正加码算力基础设施建设。12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍,这是国内首个以国产全功能GPU为底座的大规模算力集群。...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...物发现等领域提供行业标准API,使开发者能够利用在自己基础设施中的专有数据来快速构建AI应用,而不是在云服务器上运行。英伟达希望通过这些服务来吸引购买英伟达服务器的客户来注册英伟达企业版NVIDIA AI Enterprise 5.0,对...……更多
每月141元的ChatGPT Plus订阅重新开放,背后发生了什么?
...构 Semianalys 首席分析师 Dylan Patel 指出的,「对人工智能基础设施来说,系统能力比微架构更重要。」通俗来讲就是,芯片集群的算力比单块芯片的算力更重要。在大模型训练、推理的大规模计算之中,单块芯片计算完成后需要...……更多
本周(4.8-4.14)AI界发生了什么?
...员,讨论私营部门如何与各国合作,支持昂贵的大规模AI基础设施。“面壁智能”完成新一轮数亿元融资4月11日消息,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...开发人员能够专门访问构建和部署高级生成AI模型所需的基础设施和软件。英伟达表示,目前亚马逊、谷歌、微软和甲骨文等都已经成为了NVL72 机架的首批采购和服务提供商,其中亚马逊将构建一个包含20000个GB200芯片的服务器集...……更多
GPU受限,国内AI大模型能否交出自己的答卷?
...燧原科技宣布对公司品牌做战略升级,要打造AIGC时代的基础设施。摩尔线程则表示将推出基于公司全功能GPU的AIGC算力平台。 此外,行业从业者也都在做相关的探索和努力,如思考能否通过Chiplet(将芯片堆叠或者并列摆放)、...……更多
早期项目丨推出芯片级多方安全计算方案,「紫先科技」将为大模型数据安全提供基础设施
...、企业服务等刚需领域切入,目标是成为大模型数据安全基础设施服务提供商。「紫先科技」在2022年曾经获得奇绩创坛的天使轮融资,目前正启动新一轮的融资。团队方面,创始人周兴博士曾经在Google、Facebook AI研究院有近10年...……更多
Sora强化算力投资主题,领先厂商持续打开估值成长空间
...给仍然紧缺,令全球科技巨头纷纷加码以算力为核心的AI基础设施。在Sora发布前夕,OpenAI首席执行官SamAltman正寻求最高7万亿美元募资,以重塑全球AI芯片的基础设施。Sora发布后,软银集团创始人孙正义正在寻求多达1000亿美元的...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...需要410万张英伟达A100 GPU。OpenAI训练其模型所需的云计算基础设施规模是前所未有的,比业内任何人试图构建的GPU算力集群都要庞大目前,微软在六十多个Azure数据中心部署了几十万张GPU,为ChatGPT提供超强算力。作为OpenAI最大的...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生成、逻辑、记忆的独特能力会催生AI原生应用研发新范式,整个应用技术栈、数据流和业务流都将被...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...,公司在未来将坚定投资于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学...……更多
算力隐伤
... A100。在2023财年Q3财报会上微软也表示,将继续投资于云基础设施,特别是与AI相关的支出。02、六年发展,差距犹存5月4日,李彦宏在百度内部再次提起“与OpenAI差距”的问题,他称媒体报道的“大约是两个月”有点断章取义,...……更多
中国电信中部智算中心在中部地区属于最高等级
...的混合调度能力,资源利用率可以提升20%。基于高性能的基础设施和一系列的优化技术,在千卡模型下并行计算效率可以达到80%。 ……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...”。这背后是商汤长期的技术积累,包括投资百亿的算力基础设施SenseCore AI大装置,五年累计超过128亿元的投入,以及在计算机视觉、自然语言理解等大模型领域的多点开花。“AI大模型会带来新的生产范式,将为我们带来无限...……更多
云计算产业高枝上的果实,大模型能够到么?
...。其次,客户希望无缝与应用程序集成,且无需管理大量基础设施集群,也不会增加过高的成本。最后,客户希望能够轻松上手,基于基础模型,利用自己的数据(可多可少)构建差异化的应用程序。由于客户进行定制化的数据...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...期计划的重要组成部分”,旨在Meta的服务中使用AI来构建基础设施:“为了实现我们对定制芯片的雄心,这意味着不仅要投资于计算芯片,还要投资于内存带宽、网络和容量以及其他下一代硬件系统。”Meta新款MTIA芯片。来源:M...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...片供应将无法满足大规模部署的需求,OpenAI寻求获得算力基础设施的独立性,他的资金来源可能包括阿布扎比的G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克...……更多
微软:从“软件老大”到“AI帝国”
...纷呈。微软一口气公布了100多项以 AI 为中心,在云计算基础设施、 模型即服务 MaaS 、数据平台、Copilot 人工智能助手等方方面面的新产品和新功能,展示了一个端到端的AI全面愿景。但有一个细节应当被注意:在微软的传统上,...……更多
英伟达推出史上最强AI芯片H200:推理性能提升90%,无缘中国市场
...Lambda和Vultr外,亚马逊云、谷歌云、微软Azure和甲骨文云基础设施将成为首批部署H200的厂商。但显然,H200无法面向中国市场销售,这也将影响其未来销售规模的增长。目前,全球科技巨头都在囤算力,H100/A100成为抢手货,甚至有...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...的云平台提供包括云服务、算力、通用大模型工具支持等基础设施,各行业头部企业提供专业经验和数据训练的大模型生产机制已经基本成型。 志在必得的腾讯对于大模型的发展,腾讯高层显然很早之前就已经定下了调子,但...……更多
中国电信中部智算中心投用:首次全国产AI软硬件、全液冷
...北及周边省份智算业务发展需求,以及“大模型”对信息基础设施的需求。目前,中国电信已经在全国构建了多个智算中心,总算力高达5EFlops(每秒5百亿亿次计算)。 ……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
...每天40亿段视频。另外一款处理器则是该公司的Meta训练和推理加速器(MTIA)家族中的首款芯片,其目的是帮助Meta处理各种专门的人工智能任务。新的MTIA芯片专门处理“推理”,也就是利用已经训练好的人工智能模型做出预测或...……更多
中国银河证券:Sora将推动推理端算力占比将大幅提升
...应用端商业化落地、拉动产业规模,进而传导到上游算力基础设施,算力基础设施需求将再次迎来爆发。目前OpenAI已加入算力芯片军备竞赛中,根据OpenAI论文,推理阶段算力需求是模型参数数量与训练数据集规模乘积的2倍,Sora...……更多
英伟达深夜炸场,世界最强AI芯片H200震撼发布,性能飙升90%
...Vultr之外,亚马逊云科技、谷歌云、微软Azure和甲骨文云基础设施,都将成为首批部署基于H200实例的供应商。 此外,在新的H200加持之下,GH200超级芯片也将为全球各地的超级计算中心提供总计约200 Exaflops的AI算力,用以推动科学...……更多
更多关于科技的资讯:
让创想无界,生活才会有趣
珠宝配饰是人们生活中不可或缺的一部分,它们不仅可以提升人们的气质和美感,还可以表达人们的个性和情感。然而,很多人在选择珠宝配饰时
2024-04-20 14:53:00
华为发布无线智能体,为无线网络带来革命性变化
4月20日消息,2024华为分析师大会期间,华为发布无线网络智能体,为无线网络带来革命性变化。华为无线网络副总裁、首席营销官赵东表示
2024-04-20 14:57:00
filco推出“金属圣手”机械键盘,重量3.1千克
4月20日消息,Filco近日在海外推出了Majestouch3MetalSUSEdge“金属圣手”机械键盘,是现有2S金属圣手的改进版本
2024-04-20 14:56:00
小米su7车主账号转移功能即将上线
4月20日消息,小米汽车近日宣布,小米SU7车主账号的转移功能即将上线,预计在5月上旬开始实施。目前,小米SU7车主账号(即车控管理权)暂时无法进行转移
2024-04-20 15:02:00
向“新”向“智”一起向未来 广交会“超级流量”效应持续显现
本文转自:央视网央视网消息:第135届广交会第一期4月19日闭幕,截至19日,来自全球212个国家和地区的12.54万名境外采购商线下参会
2024-04-20 18:14:00
联想motox50ultra亮相上海国际赛车场
2024年4月19日,上海国际赛车场,引擎轰鸣,全球车迷的目光聚焦于此——2024FORMULA1®联想中国大奖赛在此拉开帷幕
2024-04-20 15:56:00
12部重磅好书独家首发,掌阅科技4·23世界读书日主题活动开
近日,数字阅读平台掌阅科技开启4·23世界读书日主题活动,官宣《中文桃李》《风雅:历史的细节与温情》《稳定感》等12部新书独家首发上线
2024-04-20 16:00:00
大皖新闻讯 4月20日,快手直播宣布与CF系列产品正式达成战略合作,成为穿越火线系列电竞官方指定短视频合作平台,以及2024年穿越火线手游赛事S级合作平台
2024-04-20 17:04:00
比电脑内存还要大,24GB+1TB+骁龙8Gen2,顶配旗舰降至2812元
手机内存这些年处于一个大爆发的状态,不过来到2024年可能会缓和一些,去年和前年提升比较明显,整个手机市场都在淘汰6GB和8GB内存
2024-04-20 17:14:00
本文转自:中国新闻网中新网香港4月20日电 香港科技大学(港科大)20日表示,在第四十九届日内瓦国际发明展上取得骄人成绩
2024-04-20 17:48:00
海信电视联动《黑神话:悟空》,游戏再度赋能大屏市场
近期,海信电视再次跨圈游戏领域,此次联动的是近两年国产游戏圈讨论度最高的《黑神话:悟空》。除了推出专属游戏模式、定制电视E8N系列新品
2024-04-20 17:13:00
官翻Steam Deck半价出售
Steam商店现以折扣价出售旧款Steam掌机官翻版,64GB基础型号仅售279美元,较首发价便宜120美元:256GB中配型号仅售319美元(减210美元)
2024-04-20 17:55:00
本文转自:中国新闻网中新社上海4月20日电 (记者 王笈)环球时报研究院与阅文集团20日联合发布的《Z世代数字阅读报告》(下称《报告》)指出
2024-04-20 17:48:00
moto Edge 50 Ultra海外发布
4月17日,摩托罗拉在海外发布了新机motoEdge50Ultra,搭载高通骁龙8sGen3处理器,起售价定为999欧元
2024-04-20 19:10:00
雷柏MT760/MT760 mini多模无线鼠标评测
今年,雷柏专为追求高效办公的用户们推出了两款多模无线鼠标,它们就是雷柏MT760以及雷柏MT760mini。这两款鼠标专为多设备办公场景而生
2024-04-20 19:11:00