• 我的订阅
  • 头条热搜
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...需求,火山引擎也全新发布了混合云veStack智算版,具有万卡集群组网,3.2T高性能无损网络的超大规模优势;端到端工程化所支撑的极致性能,能够实现97.78%训练加速比和分钟级故障发现和自愈;拥有多元异构能力,可适配十余...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
作者 | ZeR0编辑 | 漠影“AI主战场,万卡是最低标配!”在2024世界人工智能大会开幕前夕,摩尔线程创始人兼CEO张建中抛出一句掷地有声的断言。为什么必须是万卡?大模型行业变化很快,客户希望两周内结束战斗,最迟也得在1...……更多
当大模型Scaling Law继续,万卡集群算力释放在百舸找到一条通途
...近年来国内外科技厂商纷纷布局 AI 算力基础设施,死磕万卡甚至 10 万卡集群。此外,大规模算力集群也越来越凸显训推一体的重要性,寻求在同一个集群中无缝切换大模型的训练和推理,简化用户部署流程。虽然 GPU 集群可以...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...人工智能研究院(TeleAI)成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型(万卡万参),并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这...……更多
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
天翼云上海临港国产万卡算力池正式启用。3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,同时入驻首批用户。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异构混训,共五个方面的解决方案。过去互联网时代,服务器每台数万元...……更多
火山引擎发布大模型训练视频预处理方案 已应用于豆包
...0月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经...……更多
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...重要里程碑,可能会引领AI训练和推理的新趋势。 2国内万卡集群已蔚然成风金融投资报记者注意到,在国内,字节跳动、阿里巴巴、百度、科大讯飞等也都在积极推动万卡集群的建设。比如,字节跳动搭建了一个12288张卡的训...……更多
借助大模型能力,晓多科技智能客服的效率与服务双提升
...”,还携手火山引擎,依托豆包大模型,进一步提升“AI 训练场”与“全渠道智能知识库”的智能化,全面升级智能客服能力。成都晓多科技有限公司成立于 2014 年,是以智能对话为核心的认知智能 SaaS 产品和行业数智化解决方...……更多
独家|蚂蚁集团已建设超过万卡异构算力集群 【独家|蚂蚁集团已建设超过万卡异构算力集群】《科创板日报》9日讯,蚂蚁集团首席技术官何征宇表示,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品...……更多
火山引擎ai大模型赋能千行百业成趋势
...面难以抉择。同时模型使用的成本也难以控制,包括模型训练和精调的算力成本、海量数据采集、清洗和标注的数据成本,以及专业算法人才的人力成本等。 同时,模型落地难度大也是痛点,很多企业缺少模型训练、推理、评...……更多
全面透视豆包:功能、版本、价格、优势、应用
...型 3. 语音大模型向量模型:模型精调是按 tokens 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。四、企业应用豆包优势大使用量:打造更优的模型效果每日千亿级tokens大使用量字节跳动内部50+业务场景...……更多
张云泉:集中力量,促进国产AI大模型发展
...上升。目前,国内尚未有一家AI芯片公司的产品能够支持万卡并行大模型训练,更不用说未来的十万卡、百万卡甚至千万卡并行的挑战。其次,大模型落地所需要的配套软件、服务生态及市场缺乏投资、引导与建设,所需要的低...……更多
加速规模化应用,火山引擎升级金融大模型服务体系
...案服务体系。算力:全新发布混合云veStack智算版,具有万卡集群组网,3.2T高性能无损网络的超大规模优势;端到端工程化所支撑的极致性能,能够实现97.78%训练加速比和分钟级故障发现和自愈;拥有多元异构能力,可适配十余...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...活且高效的基础设施支持。摩尔线程近期宣布了从千卡至万卡的全功能GPU智算集群扩展方案,双方此番合作就将聚焦于万卡级超大规模GPU智算集群的开发与优化。清程极智是一家致力于构建高效人工智能系统软件,赋能国产算力...……更多
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...比如通过⾼效的 DiT 融合计算单元、全新设计的扩散模型训练⽅法和深度优化后的 Transformer 结构,让整个⽣成视频的动作更灵动、镜头更多样、细节更丰满。同时抖音、剪映对视频的理解也是优势。「剪映对视频的理解、对豆包...……更多
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。 经过剪映、即梦AI...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...,最终入库了千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后,想要更好地发挥出模型...……更多
Llama3.1训练平均3小时故障一次,H100万卡集群好脆弱
每3个小时1次、平均1天8次,Llama 3.1 405B预训练老出故障,H100是罪魁祸首?最近有人从Meta发布的92页超长Llama 3.1论文中发现了华点:Llama 3.1在为期54天的预训练期间,经历了共466次任务中断。其中只有47次是计划内的,419次纯属意...……更多
超万卡集群让算力迈上新台阶
...本文转自:人民日报海外版黑龙江筑牢数字新基建底座超万卡集群让算力迈上新台阶本报记者 崔 佳 方 圆《 人民日报海外版 》( 2024年10月18日 第 08 版)中国移动智算中心(哈尔滨)万卡智算集群俯瞰图。采访对象供图工作人...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...夸娥(KUAE)智算集群解决方案从当前的千卡级别扩展至万卡规模。摩尔线程夸娥万卡智算集群以全功能 GPU 为底座,打造能够承载万卡规模、具备万 P 级浮点运算能力的国产通用加速计算平台,号称专为万亿参数级别的复杂大模...……更多
字节跳动清华AIR成立联合研究中心 推动大模型产学研合作
...心 (SIA Lab) ” 在清华大学举行成立仪式。SIA Lab 聚焦预训练大语言模型技术,致力于发展更为通用与可扩展的智能系统,提升智能技术在互联网以及更多场景、更复杂任务中表现能力。清华AIR院长张亚勤院士,清华大学科研院...……更多
...号为“种子计划”(ProjectSeed)的基础大语言模型,包括训练和评估模型。参与“种子计划”的员工都深知这一行为的不良影响。根据字节跳动员工在内部通讯平台飞书海外版Lark的聊天记录,他们讨论了如何通过“数据脱敏”来...……更多
全国首个国产液冷万卡算力集群启动建设:总算力超4500P!
...到达15000卡,总算力超4500P。其中,单池新建国产算力达万卡,是国内首个超大规模国产算力液冷集群。该集群采用新一代国产AI算力,实现了全栈自主创新和技术突破,通过高速RDMA(远程直接数据存取)连接各物理机节点,提...……更多
全面AIGC时代,豆包模型家族准备好了
...术家们提供创作辅助。同时,在技术层面全新的扩散模型训练方法攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,可10秒讲述一个起承转合的故事。在一个prompt的多个镜头切换时,保持主...……更多
实时对话的耳机要来了?“摸着PICO过河”,字节借“豆包”重拾硬件梦
... Amodei)也在一档播客中透露,目前公司正在开发的AI模型训练成本高达10亿美元。他预计,AI模型的训练成本将在2027年之前提升到100亿美元,甚至是1000亿美元。原本就高昂的训练成本还在持续上涨,但从短期来看,变现效果不甚...……更多
将文档共享给字节跳动训练豆包AI?WPS:不实信息
...公软件WPS Office针对用户反映的“将文档共享给字节跳动训练豆包AI”问题作出回应。回应内容:近日有部分用户反馈WPS AI相关问题,我们第一时间进行了严格排查及用户沟通,相关问题完全失实。我们做出如下说明:第一,我们...……更多
Kimi、豆包发力AI搜索入口,打响轻量化之争
...。但另一方面,无论走哪个路径探索商业变现,都需要为训练大模型而付出高昂的算力成本。国盛证券曾估算,要打造对标ChatGPT的大模型,投入约10亿元才是入场券。此外,训练大模型还需要将数据集进行重复多轮计算处理,算...……更多
...总结了大模型实践过程中的十大难题:在训练上,面临着万卡/十万卡集群分布式训练及可靠性的挑战;在推理上,需解决面向LLM长文本生成的高效解码的挑战;在高效资源利用方面,面临着AI集群碎片资源利用及全局作业最优调...……更多
更多关于科技的资讯:
全球首次!C919首架交付机完成发动机更换:填补维修能力空白
快科技11月3日消息,据媒体报道,近日,C919首架交付机全球首次换发(更换发动机)工作成功完成,填补了国产大飞机在民航维修能力的一项空白
2024-11-03 13:36:00
全新凯迪拉克XT6开启盲订:全系六座布局 现款41.27万起
快科技11月3日消息,上汽通用凯迪拉克宣布新款凯迪拉克XT6开启盲订,预计在11月15日的广州车展上市。新车提供铂金行政黑标版
2024-11-03 13:36:00
18岁大专生高精度加工零件误差仅头发丝1/20 还没毕业十几家企业抢着要
快科技11月3日消息,据报道,在第三届职业技能大赛数控铣河南赛区中,来自河南新乡的18岁大专生杨贺淇,获得了金牌。他操控数控机床加工的高精密零件
2024-11-03 13:36:00
苹果收购图片编辑软件开发商Pixelmator:强化创意工具和软件生态
快科技11月3日消息,近日,图片编辑软件开发商Pixelmator在官方博客上宣布,其团队已正式加入苹果公司。据了解,Pixelmator总部位于立陶宛维尔纽斯
2024-11-03 14:06:00
香港维尔利健康科技集团推出AI驱动心血管健康管理平台
香港维尔利健康科技集团近日宣布,推出一款基于人工智能驱动的心血管健康管理平台,为心血管疾病患者及其医疗团队提供全方位的实时监测
2024-11-03 14:14:00
双十一不知怎么选护眼台灯?别着急!先来看看行业前十!
双十一期间,很多消费者为选购护眼提灯发愁。面对着鱼龙混杂的市场、五花八门的宣传,普通消费者不知道该如何下手。基于此,本文特意向大家介绍护眼台灯行业内前十的产品
2024-11-03 14:16:00
护眼台灯是不是智商税?普通人该怎么选?
关于“护眼台灯是否智商税”的讨论由来已久。实际上这种讨论触及了产品的实用价值与市场定位问题。首先,明确的是,“智商税”常被用来形容那些高价但实际效用有限的商品
2024-11-03 14:17:00
霍韦尼尔护眼台灯怎么样?普通人该选择什么样的护眼台灯?
霍韦尼尔X5护眼台灯是当前护眼台灯市场中一款主打高端的产品。但因为其比较高昂的售价,导致很多消费者心存疑虑,不敢放心购买
2024-11-03 14:18:00
德国柏曼台灯怎么样?消费者该怎么选择护眼台灯?
柏曼(PaulmannP)是护眼台灯领域内的龙头企业,其推出了一系列护眼台灯也是众多消费者所信赖的产品。本文就围绕“柏曼R1AI”详细介绍柏曼护眼台灯
2024-11-03 14:23:00
优童M5护眼台灯怎么样?消费者还有其他选择吗?
一、优童M5亮点分析优童M5护眼台灯是一款专为儿童学习设计的台灯,它凭借出色的性能,赢得了众多家长的青睐。在全光谱LED光源
2024-11-03 14:24:00
家长该如何给孩子挑选合适的护眼台灯?一文讲清选择标准
在当今社会,长时间对着电子屏幕已经成为许多青少年儿童日常生活的一部分,这也使得儿童护眼台灯的需求日益增长。然而,面对市场上琳琅满目的产品
2024-11-03 14:24:00
小心陷阱!护眼台灯的选择门道多多!
随着护眼台灯市场规模的扩大,产品质量鱼龙混杂,商家宣传“天花乱坠”,消费者一不小心就会踏入“陷阱”。本文就详细介绍护眼台灯选择中那些常见陷阱
2024-11-03 14:25:00
双十一哪五款护眼台灯可以买?一文说清护眼台灯的选购诀窍!
双十一活动正如火如荼,各电商平台不断加大优惠力度,引得平常很多“文静”的消费者变得“蠢蠢欲动”。护眼台灯是很多消费者首选的小家电
2024-11-03 14:29:00
三星2025年产品线曝光 多款新机即将面世 有三折叠
【CNMO科技消息】据外媒最新报道,三星计划在明年年初率先推出三款Galaxy S25系列手机。随后,在夏季,我们或将迎来Galaxy Z Fold 7和Flip 7的发布
2024-11-03 16:14:00
AI将爆发哪些超级应用?
文:任泽平团队2023年ChatGPT横空出世,人工智能上半场开启近两年,海量企业加入AI赛道,却鲜有成功的、实现盈利的商业模式
2024-11-03 16:20:00