• 我的订阅
  • 科技

高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡

类别:科技 发布时间:2024-06-05 13:00:00 来源:搜狐科技

高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡

出品 | 搜狐科技

编辑 | 梁昌均

6月5日消息,在今日举办的2024全球数字经济大会数字安全高层论坛暨北京网络安全大会战略峰会上,中国工程院院士、鹏城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。

他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”

他介绍到,鹏城实验室在2020年就搭建了这样一个平台——鹏城云脑2,拥有4000块卡,具备有1000P的算力,专门面向大规模人工智能模型训练的底座。目前还在推进云脑3的建设,预计今年年底前应完成,其将拥有两万多块卡。

“这些平台为鹏城实验室做大规模的人工智能模型的训练提供了基础。”高文表示,“我们有了机器,整理收集购买了非常多的数据,可以通过不停的迭代训练,使得模型的效率越来越高,性能越来越好。”

不过,高文表示,目前国内已经有两三百各种各样不同的模型,鹏城实验室并不是要参与这些大模型的竞争,模型训练完后也不是说放在仓库里,而是希望把它交给社会来使用。

目前,鹏城实验室已经训练了三个大模型,包括70亿参数、330亿参数和2000亿参数等不同规模的模型,其中2000亿参数模型花费资源最多,训练阶段用四千多块卡跑了七个月,非常费卡费时。

高文还表示,从这些模型训练也得到很多经验,通过摸索印证了规模定律(Scaling Law)。“要想做一个好的模型,一定规模要大,机器的规模要大,数据的规模要大,只有规模到了才能做出好模型。”

他还提到,现在要想训练出一个好的模型,非常费钱,要训练一个千亿参数的模型,基本就是千万美元的花费。要想训练一个万亿级的模型,大概需要1亿美元。

“我们2000亿的模型大概花了5亿人民币,也就是几千万美元的成本,要是万亿模型,那肯定接近10亿人民币或者更多,才能训练好。”高文表示,任何说花很少一点钱就能训练出来,那肯定是做了很多简化,简化以后才能训练出来,但是性能可能要打折扣。

除了模型,高文表示,鹏城实验室还研发了一个33B的长窗口模型。

为什么要做长窗口模型?他解释到,因为现在一般模型,输入的向量窗口大概是4K到8K,但一本书是几十万字,要想训练,就得每次按照8K把一本书要分成很多段,然后送去训练。

由于大模型训练主要是注意力机制,即注意力参数的训练,只要两个东西相关,就可以发生一个关联。“这是在没有截断的前提下,如果把数据截成8K,第二个8k进来了以后,和第一个8K就没有直接关系,这种关联度或注意力参数就不对。”

高文提到,现在也有很多办法去解决这个问题,但比较理想的还是一次性把一本书全都送进去,这就要求窗口特别长。

“这也会带来另外一个问题,要求内存特别大等,所以训练长窗口是大家都很关注的问题,现在做长窗口的创业公司估值很高。”高文称。

他透露,鹏城实验室33B的长窗口模型是和百川智能联合研发,总体来说性能比一般的窗口效果也会更好。

高文最后表示,鹏城实验室目前正在通过开源的方式,通过开源联合体推进合作,实验室资源现在已经可以在网站去自由获取,包括和不同的智能计算中心联合,推动算力的开放协调,并通过设立基金的形式去鼓励自由探索。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-05 15:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...样方便地使用算力。”新年伊始,中国工程院院士、鹏城实验室高文忙着推进各项工作,继续加大“中国算力网”特别是粤港澳大湾区算力调度中心建设力度。鹏城实验室,坐落在深圳西丽,5座办
2024-01-29 03:46:00
...循环,取得了一系列新进展、新突破。在科技端,与鹏城实验室开展合作,协同推进工业智能关键技术攻关,不断提炼和沉淀行业级大模型通用能力。在产业端,积极运用自然语言处理、知识图谱等
2023-07-06 19:32:00
...出席活动并发表了对开源的见解。中国工程院院士、鹏城实验室主任高文表示,当下AI 正引领我们进入全新的算力时代,为构建充满活力的算力生态,我们需拥抱开源开放。中国计算机学会开源
2024-12-26 17:10:00
中国首位!高文院士获得 IEEE 社会基础设施创新奖
...,高文是中国工程院院士、北京大学博雅讲席教授、鹏城实验室主任、数字音视频编解码技术标准(AVS)工作组组长。他带领鹏城实验室团队,专注于研究大规模人工智能应用,设计、研制了低
2024-12-27 09:36:00
粤港澳大湾区建设行稳致远
...来源:广东省大湾区办图①:鹏城云脑大科学装置。鹏城实验室供图 图②:晨曦中的港珠澳大桥。新华社记者 刘大伟摄2019年2月18日,《粤港澳大湾区发展规划纲要》正式公开发布。在
2024-02-21 06:10:00
中国智能科学技术最高奖在苏州揭晓,70个项目获表彰
...园区隆重举行,70个获奖项目及个人受到表彰奖励。鹏城实验室主任、北京大学讲席教授、中国工程院院士高文荣获“吴文俊人工智能最高成就奖”,并颁授荣誉奖牌和奖金。湖南大学党委常委、
2024-04-15 13:15:00
...atGPT与人脑并不类似近期,ChatGPT相关话题热度不减。鹏城实验室副主任石光明说:“在ChatGPT出现之前
2023-04-21 06:21:00
院士班主任+1!哈工大新设人工智能院士特色班
...向2023级本科生新设人工智能班由中国工程院院士、鹏城实验室主任高文领衔并担任班主任近日在位于深圳的鹏城实验室选拔进入首届人工智能班的20名新生与班主任高文院士见面并互动交流
2023-10-12 22:17:00
首届中国大模型大会在北京举行
...人民网党委书记、董事长、总裁、传播内容认知全国重点实验室主任叶蓁蓁,清华大学教授唐杰,复旦大学教授邱锡鹏分别以“应用者视角的AI发展与合作”“ChatGLM:从大模型看AGI
2024-06-20 17:17:00
更多关于科技的资讯:
南报网讯(通讯员胡晓靓记者夏思宇)走进南京绿叶制药有限公司制冷站,冷水机组、冷冻水泵、冷却水泵、冷却塔等设备稳定运转,维持药品生产GMP车间的恒温恒湿环境
2025-10-17 08:13:00
聚焦2025中国国际数字经济博览会•现场|打卡数字展馆 体验未来生活
10月16日,2025中国国际数字经济博览会展区工作人员在调试机器人。 河北日报记者 史晟全摄借助VR设备沉浸在古城往事中
2025-10-17 08:23:00
我从事科技研发工作,出生在一个三代从商的家庭。我的祖父是一名民营企业家,在枣强县这片土地上开启了玻璃钢产业创业之路;我的父亲骑着一辆摩托车闯荡天津
2025-10-17 09:11:00
博物馆“抢票”成第一关,中轴线打卡、汉服妆造让历史游玩出沉浸新花样……音乐节、演唱会与国际顶级体育赛事一票难求,“为一场演出赴一座城”成为常态
2025-10-17 09:15:00
新闻纵深·县域特色产业新力量|借力京津,机器人产业双链融合
阅读提示唐山市高新技术产业开发区在机器人新赛道上频频发力,已形成以工业机器人为引领、特种机器人为亮点、服务机器人为特色
2025-10-17 09:19:00
旭客民宿出租车广告上线,金华房东的“生意牌面”正在刷新
旭客民宿出租车广告上线,金华房东的“生意牌面”正在刷新最近在金华街头,不少人注意到一组频繁穿梭的出租车广告:“住旭客民宿
2025-10-17 09:25:00
AI EMPOWERS ALL丨神州泰岳亮相中国移动全球合作伙伴大会
碳硅共生,合创AI+时代——第13届中国移动全球合作伙伴大会于今日在广州保利世贸博览馆盛大启幕。神州泰岳作为中国移动长期重要合作伙伴
2025-10-17 09:25:00
内容觉醒·生态共创 | 2025瑞派短视频大赛职人组培训圆满落幕
金秋时节,硕果盈枝。由瑞派股份市场营销中心倾力打造的“2025年度瑞派短视频大赛职人专属赛道培训”在热烈氛围中圆满收官
2025-10-17 09:55:00
市场销售疲软,高档卷烟销售增速放缓,中低档卷烟却因消费需求旺盛出现供应紧张的问题,这是当前卷烟销售工作面临的瓶颈。受计划经济体制影响
2025-10-17 10:02:00
浪潮科技三款平台产品或升级认可
近日,山东省工业和信息化厅公布了拟入选第九批山东省首版次高端软件产品公示名单。浪潮科技研发的“焱宇行业大模型服务平台 V1
2025-10-17 10:03:00
旅服会媒体开放日:全产业链盛会引关注
16日,由中国旅行社协会、中国旅游集团主办的2025首届国际旅行服务大会暨交易展(以下简称“旅服会”)迎来媒体开放日。来自30余家主流媒体
2025-10-17 10:04:00
把听劝搬到线下!海尔智家双11邀500+达人发起智慧科技众测
今年双11,海尔智家把“听劝”从线上搬到了线下,在黄岛东方影都打造了一场规模空前的“智慧科技众测”现场,让“用户声音”与“产品研发”真正零距离对话
2025-10-17 10:07:00
微光照公信:32 名贵州师生北京研学,解码体彩阳光密码
多彩贵州网讯 10月13日,为期三天的“2025微光行动·希望工程”体彩旭日研学实践活动正式拉开帷幕。来自贵州民族大学
2025-10-17 10:15:00
“绽放杯”区域赛获佳绩,5G融合应用助力产业智变升级
10月15日,第八届“绽放杯”5G应用征集大赛山东区域赛决赛及颁奖典礼在济宁落下帷幕。本次大赛以“5G扬帆再启航,智绘齐鲁新篇章”为主题
2025-10-17 10:34:00
小米SU7事故后雷军首度发声!呼吁共同抵制网络水军、黑公关
据澎湃新闻消息,雷军在小米汽车成都事故后首次公开露面演讲。10月16日,世界智能网联汽车大会,小米CEO雷军在演讲中表示
2025-10-17 10:34:00