• 我的订阅
  • 头条热搜
ai生命周期:ai训练和ai推理的完美结合
...命周期包括最重要的两个部分,一个是AI训练,一个是AI推理。其中,AI训练就是让模型识别数据模式,是数据和处理最密集的部分,需要大规模的算力。在这一阶段,往往优先使用大规模并行的GPU加速器或专用的AI加速器,有时...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.模型进步持续化,为保障技术的持续领先,开普云将不断完善...……更多
收入占比40%、电话会议点名16次,英伟达:推理端的需求被低估了
...让人印象深刻的是,英伟达在财报电话会议的一个观点:推理端的爆发,可能很多人还是低估了。据英伟达电话会议披露,公司全年数据中心里已经有40%的收入来自推理业务,超出了绝大部分人预期。而在这次财报电话会议里,...……更多
AI时代CPU不老!Intel五代至强五大革新:340亿参数小意思
...架的支持,特别是PyTorch、TensorFlow等等,在AI训练、实时推理、批量推理等方面,基于不同算法,性能提升最多可达40%,甚至可以处理340亿参数的大模型。根据Intel提供的数据,五代至强SPECInt整数计算性能提升21%,AI负载性能...……更多
...能设备或家庭服务器上,使用存储在本地的个人数据进行推理和学习的人工智能基础模型。它不仅可以像公共大模型那样通过对话提供答案、创作内容,而且更精准、贴切,甚至根据用户的思维模式预测任务,并自主寻找解决方...……更多
英特尔第五代至强可扩展处理器发布:AI推理性能提升42%!
...器,相比上代至强平均性能提升了21%,能效提升了36%,AI推理性能提升了42%,总拥有成本降低了77%!最高64核心,整体性能提升21%、AI推理性能提升42%、总拥有成本降低77%! 据介绍,第五代至强(Xeon)延续了上代的Intel 7制造工...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型一体机能支撑企业将基座模...……更多
英特尔推出酷睿Ultra和第五代至强可扩展处理器,让AI无处不在
...器更是能够微调参数量多达200亿的大语言模型9,并将其推理性能提高42%。现阶段,英特尔至强可扩展处理器也是唯一一款拥有MLPerf 训练和推理基准测试结果并持续提升性能的 CPU。得益于内置AI加速器,以及优化的软件和增强的...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多
中国电信中部智算中心投用:首次全国产AI软硬件、全液冷
...算中心支持部署万亿参数大模型,可提供千卡规模的训练推理能力,计算效率达80%,并支持主流框架、芯片,支持基于训练推理的混合调度能力,资源利用率提升20%。中国电信表示,中部智算中心将引进多家云计算、AI、生物...……更多
高通:人工智能只是一个红利
...们在人工智能革命上已经前进了几个季度,部分人工智能推理工作负载将在设备上处理似乎更加可信。高通的新产品发布看起来很有竞争力。Snapdragon 8 Gen 3 看起来很棒,基准测试也非常好(读者可以在高通Snapdragon Summit Keynote 202...……更多
英特尔发布全新软硬件平台,全速助力企业推进AI创新
...碎片化、数据可靠性和合规性等需求。推出用于AI训练和推理的Gaudi3英特尔Gaudi3AI加速器将为AI系统提供动力,该AI系统可通过以太网的通用标准连接多达数万个加速器。与上一代产品相比,英特尔Gaudi3将带来4倍的BF16AI计算能力提...……更多
手机市场深陷泥沼,厂商如何破冰?
...4位量化技术,实现精度不掉点效果下更优的性能,通过推理引擎的加速,以及芯片硬件加速的方式,更是成为行业首个端侧应用的70亿参数的模型。基于来自端侧的70亿大模型参数,FindX7能够实现比其他手机更快速的大模型响应...……更多
新一轮ai算力调度平台的重要性
...、多区多业务资源整合、算法开发支持、混合组网、容器推理服务平台、模型仓库(MaaS)、AI训练平台九大关键能力,青云AI算力调度平台提供多元算力统一调度的同时,具备分布式调度与管理能力,并能够统一纳管多种异构硬...……更多
CITE2024,昇腾硬核实力打造极致体验,宝德斩获创新大奖
...易管理等优点,广泛适用于深度学习的模型开发、训练和推理一体化等多种AI应用场景。此次会议,它凭借强大的计算处理能力和市场应用方面的优势,荣获“第十二届中国电子信息博览会创新奖。” 宝德自强®训推一体算力平...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...。AI2.0时代,需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地,其核心要素,如计算、存储、网络以及数据服务都要做精细化的设计和重构,而非简单的服务器或GPU实例堆砌。《白皮书》明确了新一代AI...……更多
金山办公:年初就备了较大的算力供应 推理和训练算力充足 【金山办公:年初就备了较大的算力供应 推理和训练算力充足】《科创板日报》18日讯,据一财网17日晚间报道,拜登政府10月17日更新了针对人工智能芯片的出口管制...……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
...三代至强® 可扩展处理器通过扩展出bfloat16加速功能,在推理加速能力之外又加强了训练能力;而第四代英特尔® 至强® 可扩展处理器又带来了全新的加速引擎——英特尔® AMX,进一步提升深度学习训练和推理性能,同时更适合...……更多
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
跨越算力鸿沟丨星凡科技2024AI算力集群产品发布会圆满成功
...单纯的计算资源提供者,他们需要向客户提供大模型训练推理等增值服务,以减少客户在模型开发过程中的成本负担,助力客户进行人工智能转型,从而实现双赢。”超新星分布式微算力中心——AICC建设运营高性价比选择本次...……更多
AI时代 CPU依然是中流砥柱!AMD EPYC树立新标杆
生成式AI的新时代下,无论AI训练还是AI推理,都对硬件算力提出了空前苛刻的极高需求,GPU加速器、FPGA/ASIC加速器等各种专用硬件变得异常火爆,在消费级端无论PC还是智能手机都纷纷加入了专用的NPU硬件引擎。这种情况下,CPU...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...一定启示。日前,相关论文以《大型语言模型评价中的元推理革命》(MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation)为题发在 arXiv,曾忠燊是第一作者,香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多
联想王传东:2027年AI PC将成为市场主流
...下也能使用;第三,更低的大模型使用成本,以本地免费推理为主、以云端公共推理为辅,一次性购买AIPC即可享受全生命周期的本地免费推理服务;第四,可信、安全的个人数据和隐私保障,个性化本地知识库、隐私数据的本...……更多
三星galaxys24系列全系搭载骁龙8移动平台
...的核心——高通HexagonNPU,增强的高通HexagonNPU让生成式AI推理速度更快,相比前代的推理速度快98%,且能效提升40%。最新的HexagonNPU还集成了微架构升级、增强的微切片推理、更低的内存带宽占用,以及可实现最优性能和能效的专...……更多
英特尔以全新软硬件助力千行百业释放AI潜能
...此外,据最新消息,GraniteRapids在运行80亿参数的Llama3模型推理时,延迟比第四代英特尔至强处理器表现出两倍的提升,并且能够以低于100毫秒的token延迟运行700亿参数的Llama3模型推理。 携手生态合作伙伴助力数智变革现如今,...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...算力是上一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升...……更多
更多关于科技的资讯:
把草图变成完整画作,三星One UI 6.1.1引入“手稿到图像”功能
IT之家 7 月 11 日消息,三星在昨晚的 Galaxy Unpacked 发布会上带来了 Galaxy Z Fold6 / Flip6 等手机新品
2024-07-12 09:30:00
像使用购物软件一样下单!国内首个算力互联公共服务平台发布
来源:央视新闻客户端由中国信息通信研究院开发的国内首个算力互联公共服务平台昨天(11日)正式上线。该平台将加速推动算力互联互通
2024-07-12 09:30:00
信越推出新型半导体后端设备,无需中介层实现 HBM 的 2.5D 集成
IT之家 7 月 11 日消息,日本信越化学 6 月 12 日宣布开发出新型半导体后端制造设备,可直接在封装基板上构建符合 2
2024-07-12 09:30:00
这一巨头被苹果反超!他们,押注AI、抢占这一市场
来源:央视财经当地时间周三,智能手机领域的两大竞争对手苹果和三星,纷纷在AI领域又有新动向。苹果和三星都押注AI热潮会给智能手机带来一轮新的购买潮
2024-07-12 09:33:00
颠覆天文共识,我国科学家测量银河系半径:翻倍至 1.9 万光年
IT之家 7 月 12 日消息,我国天文学家深入分析近红外恒星光谱巡天(APOGEE)数据,重构了银河系从内到外完整的恒星径向密度分布
2024-07-12 09:34:00
AI已读乱回、自作主张……多位博主“被坑”!有人忍不住关闭功能
7月2日,微博博主@戈蓝V关闭了同名、同头像的AI小助理。两天前,这个刚开通的机器人,在评论区擅自跟@戈蓝V的朋友约了会面
2024-07-12 09:43:00
西安电子科技大学攻克 1200V 以上增强型氮化镓电力电子芯片量产
IT之家 7 月 11 日消息,西安电子科技大学广州研究院第三代半导体创新中心研究团队在蓝宝石基增强型 e-GaN 电力电子芯片量产技术研发方面取得突破性进展
2024-07-12 09:44:00
实验室培养的大脑合乎道德吗?科学家认为,没有简单的答案
一项新研究正探索从人类胎儿脑组织中发展脑类器官的伦理和法律意义。大脑类器官,通常被称为“迷你大脑”,并不是真正的人类大脑
2024-07-12 09:46:00
国内模拟芯片并购潮来临,下一个模拟巨头即将诞生?
模拟芯片依旧是目前半导体市场的大热门之一。根据第三方调研机构的数据,全球模拟芯片市场规模从2017年的531亿美元增长到2022年的845亿美元
2024-07-12 09:46:00
研究人员创造了一种极其奇特的物质状态:可以弯曲时间的水晶
研究人员创造了一种极其奇特的物质状态。它的原子直径比平常大100倍。时间晶体最初是由诺贝尔奖获得者弗兰克·威尔切克在2012年提出的
2024-07-12 09:47:00
学习马斯克!中国也要搞自己的星链了,共发射1.4万颗卫星
众所周知,作为世界首富,马斯克有很多伟大的想法,也在为这些想法不断的努力去实现。比如他的SpaceX就是聚焦于太空的,他想要让人能够移民到火星去
2024-07-12 09:47:00
马斯克首次详解“脑机接口”:终极目标是“让人类与AI融合、避免被AI超越”
马斯克的脑机接口迎新进展,继首例人脑设备植入手术顺利完成后,Neuralink将迎来第二名人类植入者。马斯克透露称,公司希望今年将其设备植入到“高个位数”的患者体内
2024-07-12 09:48:00
南京智能健康科技展青岛智慧医疗峰会,共筑智慧健康新纪元
智能科技正在引领健康领域的革新浪潮。南京智能健康科技展和青岛智慧医疗峰会旨在共同打造智慧健康新纪元,为人们提供更加智慧和便利的医疗服务
2024-07-12 09:48:00
字节跳动“筋斗云人才计划”启动,面向全球高校招聘顶尖技术人才
近日,字节跳动“筋斗云人才计划”启动。该计划是字节跳动面向优秀校园技术人才推出的专项招聘,意图在全球范围内,吸引和招募有志于用技术创造突破性价值的顶尖学生
2024-07-12 09:49:00
抢占6G制高点,中国发布国际首个6G外场试验网突破性成果
IT之家 7 月 11 日消息,7 月 10 日,由中国通信学会主办,北京邮电大学承办的“信息论:经典与现代”学术研讨会在京举行
2024-07-12 09:50:00