我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

首个“开源chatgpt”来了：基于谷歌5400亿参数大模型

类别：科技发布时间：2022-12-30 20:18:00 来源：浅语科技

就说程序员的手速有多快吧，首个开源ChatGPT项目已经出现了！

基于谷歌语言大模型PaLM架构，以及使用从人类反馈中强化学习的方法（RLHF），华人小哥 PhillipWang 复刻了一个ChatGPT出来。

项目GitHub星已经超过1.7k了，而且还在一路飙升ing。

不过一反常态的是，网友们看到“开源ChatGPT”却没有火速开冲，反倒齐刷刷在发问：

这……有人能run？

开源了但没完全开？

项目的核心内容，是在PaLM架构上实现基于人类反馈的强化学习。

其中，PaLM（PathwaysLanguageModel）是谷歌在今年4月发布的 5400亿参数全能大模型，基于Pathways系统训练，BERT之父JacobDevlin为主要贡献者之一。

PaLM可以完成写代码、聊天、语言理解等任务，并且在大多数任务上实现了SOTA少样本学习性能。

另一个核心点是RLHF“从人类反馈中强化学习”。

OpenAI提出InstructGPT时就用到了这一方法，它能让AI的回答更加符合情景要求，降低“有害性”。

具体分三步：

第一步，找一些人写下示范答案，来微调GPT-3模型，训练监督模型baseline。

第二步，收集某个问题的几组不同输出数据，由人类对几组答案进行排序，在此数据集上训练奖励模型。

第三步，使用RM作为奖励函数，近端策略优化（PPO）算法微调GPT-3策略，以强化学习方法最大化奖励。

ChatGPT 使用的GPT-3.5，其中text-davinci-002就是在code-davinci-002的基础上，采用了InstructGPT训练方法改进得到。

正是基于如上两方面核心内容，作者实现了ChatGPT的复刻。

大致步骤有3步：

首先来训练一下PaLM，就和其他自回归Transformer一样。

第二……

等等，训练PaLM？？？这确定不是在开玩笑？

现在明白为啥大家都觉得这个开源项目完全不能run了……

打个不恰当的比方，这就像如果想吃熊肉，那先自己去打头熊来。

项目中只有PaLM架构和代码，没有预先训练好的权重。

所以完成第一步，大概效果就是……

话虽如此，但还是继续接着往下看看……

第二步，就要训练基于RLHF的奖励模型了。作者使用的是一种轻量级训练大语言模型方法LoRA，这种方法是开源的。

然后，再把之前训练好的模型和奖励模型用强化学习进行微调。

经过这三步后，就能得到一个开源版的ChatGPT了。

这中间面临的问题包括巨大的计算量、超大模型和难收集的文本……所以有人也不免发问：

有没有一种可能，它也没啥用？

不过有网友觉得这本质上还是一件好事啦。

AI的一个关键区别就是，每有一个重大突破，很快就会出现一个开源版本。

实际上，开源项目作者小哥PhilipWang一直都热衷于复刻各种明星项目，过去还尝试过Dall・E2、AlphaFold2等。

以及LAION也发起了一个类似项目 OpenAssistant，他们将通过“众筹脑力”的方式，共同开发一个开源的聊天AI。

StableDiffusion用的开放数据集，就是这一组织做的。

感兴趣的童鞋不妨去试试看~

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2022-12-30 22:45:08

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,参数,模型,训练,项目,上实的资讯：

中国移动助力中国石油发布3000亿参数昆仑大模型

...晓莉）日前，中国移动助力中国石油的3000亿参数昆仑大模型建设成果发布。中国移动总经理何飚表示，中国移动作为中国石油昆仑大模型项目的总集成方，组建了14个专项工作组，全力保障

2025-05-29 18:35:00

杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座

2025-05-28 14:17:00

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员

2024-06-21 09:52:00

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...转自：中国新闻网6月3日，昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来

2024-06-03 20:59:00

Mamba作者新作：将Llama3蒸馏成混合线性 RNN

...功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分，实现了更好的上下文理解

2024-09-03 09:59:00

优刻得首个「国产千卡智算集群」落地，支持智源千亿大模型训练

...算集群规模，才能一路突破围追堵截，进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商，优刻得持续发力人工智能智算领域，与国内主流AI芯片厂商深度合作，共同搭建的

2024-06-27 19:01:00

百川智能发布baichuan3稳定语言模型

1月29日，百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中

2024-01-29 19:57:00

谷歌发布 MediaPipe Diffusion 插件

谷歌发布低成本可控文生图插件模型MediaPipeDiffusion，移动端提速20+倍，在v100上运行提速高达100倍

2023-07-13 05:54:00

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

继旗下xAI公司宣布正式开源大模型Grok-1后，特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚

2024-08-13 09:50:00

更多关于科技的资讯：

创新南京，何以攀过一峰又一峰？

□南京日报/紫金山新闻记者张安琪9月23日，2025南京金秋经贸洽谈会开幕式上，一批全球首个、国内首批、性能全球最高的科技成果密集亮相

2025-10-06 09:49:00

“四位一体”综合补能护航高速绿色出行

国庆中秋长假期间，新能源汽车已成为众多家庭出游的重要选择。为进一步破解高速服务区“充电难、排队久”的现实困境，山西交控集团坚持“科技创新+服务升级”双轮驱动

2025-10-06 18:01:00

邮储信用卡气球雨惊喜派对即将空降青岛李沧万达，国庆中秋邀您共

鲁网9月30日讯2025年国庆、中秋双节同庆之际，为回馈广大市民与持卡人长期以来的支持，邮储银行青岛分行将于10月1日-8日

2025-10-06 14:11:00

这群年轻人带货“赢麻”了

□南京日报/紫金山新闻记者于洁尘通讯员陈天骄“干我们这行的，哪有节假日？越是假期越要忙。”10月5日一大早，28岁的陈潇离开南京

2025-10-06 09:48:00

节日我在岗丨十堰高周波：抓创新赶订单全力冲刺年度目标

十堰广电讯（全媒体记者陈林）在国庆中秋假期，位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单，全力冲刺年度目标

2025-10-05 20:21:00

节日我在岗丨艾斯卓智能科技：节日不休赶制订单

十堰广电讯（全媒体记者耿吉国）放假不放松，生产不停工。国庆中秋长假，我市各生产企业铆足干劲抓生产、赶订单，奋力冲刺年度目标任务

2025-10-05 20:21:00

“铁疙瘩”怎样变成“金娃娃”（十）｜一块宽厚板的靶向发力

普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”（十）从矿山到港口

2025-10-05 07:47:00

人气旺厦门多个商场假日客流爆棚、销售额亮眼

集美大悦城商圈内，小朋友和机器人亲密互动。（本组图/厦门日报记者黄晓珍摄）国庆中秋假期，厦门SM购物中心潮玩店内人气火爆

2025-10-04 09:20:00

河北省数据和政务服务局发布公告公开征集一批河北省高质量数据

省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯（记者解楚楚）9月26日，河北省数据和政务服务局发布公告

2025-10-04 08:03:00

央媒看太原｜双节市场备货足美食特产受青睐

央媒看太原9月30日，央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题，报道了假期到来，太原市各大综合市场提前备货

2025-10-04 07:17:00

鼓浪屿世遗文创作品征集活动启动

厦门网讯（厦门日报记者朱道衡）近日，2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国（含港澳台地区）高校、企业

2025-10-03 08:37:00

医生支招：“充电宝”式休息法助您假期恢复活力

厦门网讯（厦门日报记者楚燕通讯员石青青）长假期间，许多人从忙碌的工作中解脱出来，趁机好好休息。可是，如果休息方式不得当

2025-10-03 08:37:00

清华天津电子院校地协同育“创新雨林” 10载“津”耕从0到

渤海之潮涌动着澎湃的脉搏，海河之畔镌刻着科技的印记。10年前，一颗带有“清华”基因的种子在天津这片沃土扎根；10年后，它长成一棵枝繁叶茂的参天大树

2025-10-03 09:25:00

太燃了！无人机空中展旗！高新区国庆“氛围组”已上线！

2025-10-03 23:48:00

抖音生活服务联合北京卫视发起“老板驾到”直播活动，吸引用户下

9月29日，抖音生活服务联合北京卫视发起“老板驾到”直播活动，助力北京国庆中秋消费。抖音用户在@北京卫视直播间下单超1万次

2025-10-03 18:36:00

头条订阅服务

首个“开源chatgpt”来了：基于谷歌5400亿参数大模型