• 我的订阅
  • 头条热搜
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...需求,火山引擎也全新发布了混合云veStack智算版,具有万卡集群组网,3.2T高性能无损网络的超大规模优势;端到端工程化所支撑的极致性能,能够实现97.78%训练加速比和分钟级故障发现和自愈;拥有多元异构能力,可适配十余...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
作者 | ZeR0编辑 | 漠影“AI主战场,万卡是最低标配!”在2024世界人工智能大会开幕前夕,摩尔线程创始人兼CEO张建中抛出一句掷地有声的断言。为什么必须是万卡?大模型行业变化很快,客户希望两周内结束战斗,最迟也得在1...……更多
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
天翼云上海临港国产万卡算力池正式启用。3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,同时入驻首批用户。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异构混训,共五个方面的解决方案。过去互联网时代,服务器每台数万元...……更多
马斯克宣布训练“世界上最强大的人工智能” !万卡集群背后的算力竞赛迅猛升级
...重要里程碑,可能会引领AI训练和推理的新趋势。 2国内万卡集群已蔚然成风金融投资报记者注意到,在国内,字节跳动、阿里巴巴、百度、科大讯飞等也都在积极推动万卡集群的建设。比如,字节跳动搭建了一个12288张卡的训...……更多
借助大模型能力,晓多科技智能客服的效率与服务双提升
...”,还携手火山引擎,依托豆包大模型,进一步提升“AI 训练场”与“全渠道智能知识库”的智能化,全面升级智能客服能力。成都晓多科技有限公司成立于 2014 年,是以智能对话为核心的认知智能 SaaS 产品和行业数智化解决方...……更多
独家|蚂蚁集团已建设超过万卡异构算力集群 【独家|蚂蚁集团已建设超过万卡异构算力集群】《科创板日报》9日讯,蚂蚁集团首席技术官何征宇表示,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品...……更多
火山引擎ai大模型赋能千行百业成趋势
...面难以抉择。同时模型使用的成本也难以控制,包括模型训练和精调的算力成本、海量数据采集、清洗和标注的数据成本,以及专业算法人才的人力成本等。 同时,模型落地难度大也是痛点,很多企业缺少模型训练、推理、评...……更多
全面透视豆包:功能、版本、价格、优势、应用
...型 3. 语音大模型向量模型:模型精调是按 tokens 使用量(训练文本*训练迭代次数)计费,训练完成后出账,按量后付费。四、企业应用豆包优势大使用量:打造更优的模型效果每日千亿级tokens大使用量字节跳动内部50+业务场景...……更多
张云泉:集中力量,促进国产AI大模型发展
...上升。目前,国内尚未有一家AI芯片公司的产品能够支持万卡并行大模型训练,更不用说未来的十万卡、百万卡甚至千万卡并行的挑战。其次,大模型落地所需要的配套软件、服务生态及市场缺乏投资、引导与建设,所需要的低...……更多
加速规模化应用,火山引擎升级金融大模型服务体系
...案服务体系。算力:全新发布混合云veStack智算版,具有万卡集群组网,3.2T高性能无损网络的超大规模优势;端到端工程化所支撑的极致性能,能够实现97.78%训练加速比和分钟级故障发现和自愈;拥有多元异构能力,可适配十余...……更多
摩尔线程万卡GPU集群新进展!性能可提升20倍
...活且高效的基础设施支持。摩尔线程近期宣布了从千卡至万卡的全功能GPU智算集群扩展方案,双方此番合作就将聚焦于万卡级超大规模GPU智算集群的开发与优化。清程极智是一家致力于构建高效人工智能系统软件,赋能国产算力...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...,最终入库了千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后,想要更好地发挥出模型...……更多
Llama3.1训练平均3小时故障一次,H100万卡集群好脆弱
每3个小时1次、平均1天8次,Llama 3.1 405B预训练老出故障,H100是罪魁祸首?最近有人从Meta发布的92页超长Llama 3.1论文中发现了华点:Llama 3.1在为期54天的预训练期间,经历了共466次任务中断。其中只有47次是计划内的,419次纯属意...……更多
摩尔线程与360达成战略合作,将共同打造“360智脑大模型一体机”
...夸娥(KUAE)智算集群解决方案从当前的千卡级别扩展至万卡规模。摩尔线程夸娥万卡智算集群以全功能 GPU 为底座,打造能够承载万卡规模、具备万 P 级浮点运算能力的国产通用加速计算平台,号称专为万亿参数级别的复杂大模...……更多
...号为“种子计划”(ProjectSeed)的基础大语言模型,包括训练和评估模型。参与“种子计划”的员工都深知这一行为的不良影响。根据字节跳动员工在内部通讯平台飞书海外版Lark的聊天记录,他们讨论了如何通过“数据脱敏”来...……更多
全国首个国产液冷万卡算力集群启动建设:总算力超4500P!
...到达15000卡,总算力超4500P。其中,单池新建国产算力达万卡,是国内首个超大规模国产算力液冷集群。该集群采用新一代国产AI算力,实现了全栈自主创新和技术突破,通过高速RDMA(远程直接数据存取)连接各物理机节点,提...……更多
实时对话的耳机要来了?“摸着PICO过河”,字节借“豆包”重拾硬件梦
... Amodei)也在一档播客中透露,目前公司正在开发的AI模型训练成本高达10亿美元。他预计,AI模型的训练成本将在2027年之前提升到100亿美元,甚至是1000亿美元。原本就高昂的训练成本还在持续上涨,但从短期来看,变现效果不甚...……更多
将文档共享给字节跳动训练豆包AI?WPS:不实信息
...公软件WPS Office针对用户反映的“将文档共享给字节跳动训练豆包AI”问题作出回应。回应内容:近日有部分用户反馈WPS AI相关问题,我们第一时间进行了严格排查及用户沟通,相关问题完全失实。我们做出如下说明:第一,我们...……更多
Kimi、豆包发力AI搜索入口,打响轻量化之争
...。但另一方面,无论走哪个路径探索商业变现,都需要为训练大模型而付出高昂的算力成本。国盛证券曾估算,要打造对标ChatGPT的大模型,投入约10亿元才是入场券。此外,训练大模型还需要将数据集进行重复多轮计算处理,算...……更多
...总结了大模型实践过程中的十大难题:在训练上,面临着万卡/十万卡集群分布式训练及可靠性的挑战;在推理上,需解决面向LLM长文本生成的高效解码的挑战;在高效资源利用方面,面临着AI集群碎片资源利用及全局作业最优调...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
... 展望未来:开放、合作、创新 基于MatrixOS和世纪互联AIDC万卡集群能力的AI原生云平台neolink.AI也即将发布,这是MatrixOS在行业内的首次大规模落地。 MatrixOS的发布,不仅是矩阵起源对AI未来的一次大胆预测和积极布局,更是对整...……更多
...签约。此外,“智算集群赋能港大自主算法平台”“国产万卡液冷集群赋能星辰大模型”“Sensecore智算体系赋能日日新5.0大模型”等一批大模型训练集群启动。临港新片区2023年发布《临港新片区加快构建算力产业生态行动方案...……更多
...布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。火山引擎总裁谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行...……更多
AI潮起 共筑数智之基
...在中国移动人工智能生态大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中...……更多
...场景示范方面,已落地了一批如全国规模最大的国产单池万卡液冷算力集群等重要项目。同时重点布局面向国际数据业务的国际数据中心,目前已完成国际算力、国际通信、国际互联网交换等业务测试,形成网络安全防护、数据...……更多
中国移动董事长:打造一批万卡级智算集群,加快超算等多种类型社会算力并网
...全国性智算中心与X个边缘智算节点建设布局,打造一批万卡级智算集群,加快超算、量算等多种类型社会算力并网。在构建“丰富易用”的新服务,支撑“人工智能+”发展方面,面向AI大模型研发、部署、应用全流程,加速国...……更多
...优化,技术上有很多手段。首先是模型本身,模型结构、训练方法都可以持续改进,包括业界很关注的MoE(混合专家模型),就是优化推理成本很好的解决方案。其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也...……更多
AI大模型开启“免费午餐”?字节直降99%,阿里一折甩卖,百度高喊免费!
...。时代周报记者查看官网注意到,两款主力大模型均支持训练优化和部署调用,是百度智能云千帆大模型平台下的大模型,而百度智能云千帆大模型平台是文心大模型企业级服务的唯一入口。 图源:百度智能云官网截图换句话...……更多
更多关于科技的资讯:
Meta Quest 3S 头显被曝 10 月 16 日发售,起价 611.22 澳元
IT之家 9 月 21 日消息,Meta 公司的 Quest 3S 头显已在亚马逊澳大利亚偷跑,显示头显将于 10 月 16 日发售
2024-09-23 09:48:00
仅2天,三折叠的泡沫就破了,原价出售出现,黄牛损失惨重
国产三折叠手机大肆炒作,在上市之前曾有黄牛将它炒作到8万元以上,乃至30万都有所传闻,然而随着三折叠手机的上市,这一切都成为过眼云烟
2024-09-23 09:49:00
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
【新智元导读】多个LLM联合,可以迈向更强大系统!最新研究发现,GPT-4能够提升同伴的性能,能够让数学能力暴涨11.6%
2024-09-23 09:50:00
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
【新智元导读】o1诞生,对于OpenAI团队来说,是最具革命性的时刻。在22分钟完整版采访视频中,他们分享了自己对新模型的思考
2024-09-23 09:50:00
国庆换新机,优选千元性价比“卷王”——红米Note13Pro
红米Note13Pro是一款备受消费者喜爱的千元机,销量完全可以用“爆棚”形容,尽管它的价格才一千出头,却有诸多旗舰的体验
2024-09-23 09:51:00
5999元iPhone 16丐版开箱开箱,性价比极低,被上一代Pro秒杀!
首发官网购买了iPhone 16乞丐版,5999元只有128GB的内存,想要256GB直接需要加价1000元,苹果真的是金子内存
2024-09-23 09:52:00
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
国内行业大模型的“江湖风云”,如今已悄然从纯算法网络PK转向了“实战派”较量。这不再是单一的技术炫技场,而是看谁能在现实世界中大展拳脚
2024-09-23 09:53:00
刘作虎“打脸”库克?OPPO新机边框太秀了
最近,黑厂刘作虎又搞事情了!这次直接放出了一张对比图,把OPPO Find X8和iPhone 16摆在一起,明晃晃地告诉大家
2024-09-23 09:53:00
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
两个AI现场攻防,翻车了人类就在旁边“蛐蛐”。现在的AI比赛真是越来越因吹斯汀了。这不,一个拿着“花开富贵”大姨人设的Agent直接甩了个链接
2024-09-23 09:53:00
高通被曝求购英特尔,手机芯片王者并购PC芯片王者!需要中国同意
大消息,同时轰动硅谷和华尔街的大消息!高通正在寻求并购英特尔。一个是智能手机时代当仁不让的芯片霸主,另一个则始终占据着PC的核心地位
2024-09-23 09:53:00
王腾花式测试Redmi Note 14 Pro,雷军的点评大亮
9月19日Redmi x BSR 蓝天救援 达成官方合作,即将发布的Redmi Note 14 Pro系列成为“蓝天救援队”官方合作用机
2024-09-23 09:53:00
华为多款新机官宣:9月24日,正式发布
2024年作为华为最重要的一年,在系统和产品上取得到重大突破,先是6月份发布了全新的HarmonyOS NEXT系统,而9月份又发布了全新的三折叠屏手机
2024-09-23 09:55:00
有线无线双组合 西圣BP无线充电宝测评主打便宜又实用
对于手机来说,目前最头疼的问题是什么?我认为不是性能也不是流畅度也不是重量,现在最大的问题依旧是续航,即便是这几年手机的电池和充电速度都在持续提升
2024-09-23 09:55:00
比华为苹果务实多了!学生党也能轻易买的续航性能王新机来了
最近这段时间手机圈基本上被华为和苹果两家给占满了,抛开产品层面各种花边新闻都来凑热闹了。但小智说实话,无论是苹果iPhone16系列
2024-09-23 09:56:00
英特尔Lunar Lake测试成绩出炉:能效表现尤为出众!
9月22日消息,近日越南科技评论媒体ThinkView在YouTube上曝光了英特尔最新的Lunar Lake平台的中端产品Core Ultra 7 268V与AMD的Ryzen AI系列旗舰芯片进行了基准测试成绩对比
2024-09-23 09:56:00