• 我的订阅
  • 科技

国内首个类chatgpt模型:复旦大学moss今日正式开源

类别:科技 发布时间:2023-04-21 22:51:00 来源:浅语科技

复旦大学自然语言处理实验室开发的新版MOSS模型今日正式上线,成为国内首个插件增强的开源对话语言模型。

国内首个类chatgpt模型:复旦大学moss今日正式开源

目前,MOSS模型已上线开源,相关代码、数据、模型参数已在Github和HuggingFace等平台开放,供科研人员下载。

国内首个类chatgpt模型:复旦大学moss今日正式开源

据介绍,MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

MOSS来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的AI同名,已发布至公开平台(https://moss.fastnlp.top/),邀请公众参与内测。

IT之家查看MOSS的GitHub页面发现,该项目所含代码采用Apache2.0协议,数据采用CCBY-NC4.0协议,模型权重采用GNUAGPL3.0协议。如需将该项目所含模型用于商业用途或公开部署,需要签署文件并发送至robot@fudan.edu.cn取得授权,商用情况仅用于记录,不会收取任何费用。MOSS用例:

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲解方程

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲生成图片

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲无害性测试模型

moss-moon-003-base:MOSS-003基座模型,在高质量中英文语料上自监督预训练得到,预训练语料包含约700B单词,计算量约6.67x1022次浮点数运算。

moss-moon-003-sft:基座模型在约 110万多轮对话数据上微调得到,具有指令遵循能力、多轮对话能力、规避有害请求能力。

moss-moon-003-sft-plugin:基座模型在约110万多轮对话数据和约30万插件增强的多轮对话数据上微调得到,在moss-moon-003-sft基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。

moss-moon-003-pm:在基于moss-moon-003-sft收集到的偏好反馈数据上训练得到的偏好模型,将在近期开源。

moss-moon-003:在moss-moon-003-sft基础上经过偏好模型moss-moon-003-pm训练得到的最终模型,具备更好的事实性和安全性以及更稳定的回复质量,将在近期开源。

moss-moon-003-plugin:在moss-moon-003-sft-plugin基础上经过偏好模型moss-moon-003-pm训练得到的最终模型,具备更强的意图理解能力和插件使用能力,将在近期开源。数据

moss-002-sft-data:MOSS-002所使用的多轮对话数据,覆盖有用性、忠实性、无害性三个层面,包含由text-davinci-003生成的约57万条英文对话和59万条中文对话。

moss-003-sft-data: moss-moon-003-sft所使用的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入数据和gpt-3.5-turbo构造而成,相比moss-002-sft-data,moss-003-sft-data更加符合真实用户意图分布,包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数,约含110万条对话数据。目前仅开源少量示例数据,完整数据将在近期开源。

moss-003-sft-plugin-data: moss-moon-003-sft-plugin所使用的插件增强的多轮对话数据,包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约30万条多轮对话数据。目前仅开源少量示例数据,完整数据将在近期开源。

moss-003-pm-data: moss-moon-003-pm所使用的偏好数据,包含在约18万额外对话上下文数据及使用moss-moon-003-sft所产生的回复数据上构造得到的偏好对比数据,将在近期开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-22 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“保险智能专家”在复旦诞生
...青年报记者孙琪保险大模型可实现多场景的个性化服务据复旦大学风险管理与保险学系系主任许闲教授介绍,“保险智酷”是为保险场景下的各类用户提供专业、智能、全面的数字化服务的保险领域
2023-12-08 07:23:00
...转自:解放日报本报讯(记者 俞陶然)记者昨天获悉,复旦大学自然语言处理实验室开发的新版MOSS模型已上线,成为国内首个插件增强的开源对话语言模型,支持搜索引擎、图像生成、计算
2023-04-22 05:44:00
大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究
...狐科技《思想大爆炸——对话科学家》栏目第31期,对话复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏。嘉宾简介:邱锡鹏,复旦大学计算机科学技术学院教授,中国计算机学
2023-09-28 12:01:00
...研智算平台CFFF(Computing for the Future at Fudan)近日在上海复旦大学正式上线
2023-07-27 01:36:00
国内高校最大规模异构智算平台正式上线
...的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线
2023-07-04 08:38:00
复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”揭牌 进一步深化“车路云一体化”模式
...”市级科技重大专项2023年度总结会议成功举办。会上,复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”正式揭牌,是车路云一体化研究中心。这一举措标志着我国在推动智能交通
2023-12-22 18:37:00
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题,是
2023-04-23 16:48:00
复旦马剑鹏团队研发新型智能算法,助力提升新药研发成功率
...次迎来突破,生物大分子结构预测技术得到升级。近日,复旦大学复杂体系多尺度研究院院长马剑鹏教授领衔的科研团队开发出了新型智能计算方法OPUS-DSD,该算法不但能够成功地解析在
2023-10-10 16:11:00
复旦团队开发新型AI算法“看清”蛋白质精细结构,可与AlphaFold预测互补
...际知名学术期刊《自然-方法》(影响因子47.99)刊发了由复旦大学马剑鹏教授领衔的科研团队开发的新型计算方法OPUS-DSD
2023-10-10 17:39:00
更多关于科技的资讯: