• 我的订阅
  • 科技

国内首个类chatgpt模型:复旦大学moss今日正式开源

类别:科技 发布时间:2023-04-21 22:51:00 来源:浅语科技

复旦大学自然语言处理实验室开发的新版MOSS模型今日正式上线,成为国内首个插件增强的开源对话语言模型。

国内首个类chatgpt模型:复旦大学moss今日正式开源

目前,MOSS模型已上线开源,相关代码、数据、模型参数已在Github和HuggingFace等平台开放,供科研人员下载。

国内首个类chatgpt模型:复旦大学moss今日正式开源

据介绍,MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

MOSS来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的AI同名,已发布至公开平台(https://moss.fastnlp.top/),邀请公众参与内测。

IT之家查看MOSS的GitHub页面发现,该项目所含代码采用Apache2.0协议,数据采用CCBY-NC4.0协议,模型权重采用GNUAGPL3.0协议。如需将该项目所含模型用于商业用途或公开部署,需要签署文件并发送至robot@fudan.edu.cn取得授权,商用情况仅用于记录,不会收取任何费用。MOSS用例:

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲解方程

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲生成图片

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲无害性测试模型

moss-moon-003-base:MOSS-003基座模型,在高质量中英文语料上自监督预训练得到,预训练语料包含约700B单词,计算量约6.67x1022次浮点数运算。

moss-moon-003-sft:基座模型在约 110万多轮对话数据上微调得到,具有指令遵循能力、多轮对话能力、规避有害请求能力。

moss-moon-003-sft-plugin:基座模型在约110万多轮对话数据和约30万插件增强的多轮对话数据上微调得到,在moss-moon-003-sft基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。

moss-moon-003-pm:在基于moss-moon-003-sft收集到的偏好反馈数据上训练得到的偏好模型,将在近期开源。

moss-moon-003:在moss-moon-003-sft基础上经过偏好模型moss-moon-003-pm训练得到的最终模型,具备更好的事实性和安全性以及更稳定的回复质量,将在近期开源。

moss-moon-003-plugin:在moss-moon-003-sft-plugin基础上经过偏好模型moss-moon-003-pm训练得到的最终模型,具备更强的意图理解能力和插件使用能力,将在近期开源。数据

moss-002-sft-data:MOSS-002所使用的多轮对话数据,覆盖有用性、忠实性、无害性三个层面,包含由text-davinci-003生成的约57万条英文对话和59万条中文对话。

moss-003-sft-data: moss-moon-003-sft所使用的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入数据和gpt-3.5-turbo构造而成,相比moss-002-sft-data,moss-003-sft-data更加符合真实用户意图分布,包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数,约含110万条对话数据。目前仅开源少量示例数据,完整数据将在近期开源。

moss-003-sft-plugin-data: moss-moon-003-sft-plugin所使用的插件增强的多轮对话数据,包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约30万条多轮对话数据。目前仅开源少量示例数据,完整数据将在近期开源。

moss-003-pm-data: moss-moon-003-pm所使用的偏好数据,包含在约18万额外对话上下文数据及使用moss-moon-003-sft所产生的回复数据上构造得到的偏好对比数据,将在近期开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-22 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“保险智能专家”在复旦诞生
...青年报记者孙琪保险大模型可实现多场景的个性化服务据复旦大学风险管理与保险学系系主任许闲教授介绍,“保险智酷”是为保险场景下的各类用户提供专业、智能、全面的数字化服务的保险领域
2023-12-08 07:23:00
...转自:解放日报本报讯(记者 俞陶然)记者昨天获悉,复旦大学自然语言处理实验室开发的新版MOSS模型已上线,成为国内首个插件增强的开源对话语言模型,支持搜索引擎、图像生成、计算
2023-04-22 05:44:00
大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究
...狐科技《思想大爆炸——对话科学家》栏目第31期,对话复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏。嘉宾简介:邱锡鹏,复旦大学计算机科学技术学院教授,中国计算机学
2023-09-28 12:01:00
...研智算平台CFFF(Computing for the Future at Fudan)近日在上海复旦大学正式上线
2023-07-27 01:36:00
复旦大学发布CFFF智能计算平台2.0 人工智能基础设施覆盖“教-学-研”全链条
中新网上海5月27日电 (陈静汪蒙琪)记者27日获悉,复旦大学正式发布CFFF智能计算平台2.0(简称:CFFF2.0平台)
2025-05-27 11:05:00
国内高校最大规模异构智算平台正式上线
...的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线
2023-07-04 08:38:00
复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”揭牌 进一步深化“车路云一体化”模式
...”市级科技重大专项2023年度总结会议成功举办。会上,复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”正式揭牌,是车路云一体化研究中心。这一举措标志着我国在推动智能交通
2023-12-22 18:37:00
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题,是
2023-04-23 16:48:00
复旦马剑鹏团队研发新型智能算法,助力提升新药研发成功率
...次迎来突破,生物大分子结构预测技术得到升级。近日,复旦大学复杂体系多尺度研究院院长马剑鹏教授领衔的科研团队开发出了新型智能计算方法OPUS-DSD,该算法不但能够成功地解析在
2023-10-10 16:11:00
更多关于科技的资讯:
1元租机器人,线下开首店:人形机器人打响大众化“发令枪”
大皖新闻讯 2025年的最后两天,中国的人形机器人产业以两件标志性事件,为即将到来的2026年按下了商业化加速键。一边是擎天租以“1元闪租”的体验价格将可以“打太极”的人形机器人推向大众市场
2025-12-30 21:48:00
从\
鲁网12月30日讯12月30日,在济南召开的"永生之手叩响仿生机器人元年之门"主题峰会上,山东未来机器人技术有限公司首次提出将人类生命划分为"碳基阶段"与"硅基阶段"的颠覆性理论框架
2025-12-30 22:13:00
贵州艺森源集团:从手工敲打到智能轰鸣 书写酒包装产业升级答卷
多彩贵州网讯 近日,贵州艺森源集团有限公司生产车间内,智能设备高效运转,自动化生产线有序作业,一派繁忙景象。历经十年深耕
2025-12-30 22:38:00
浪潮智慧文旅“智享商旅 聚力同行”2025浪潮商旅服务日成功举办
鲁网12月30日讯12月25日,由山东浪潮智慧文旅产业发展有限公司主办、山东浪潮智慧空间技术服务有限公司承办的“智享商旅·聚力同行——2025浪潮商旅服务日”在浪潮科技园圆满落幕
2025-12-30 17:23:00
潮新闻讯 浙商,是商业期刊的常客。2025年,他们的名字却接连登上《细胞》(Cell)《自然》(Nature)《科学》(Science)等学术期刊的作者栏
2025-12-30 17:52:00
扎根毕节十年,年产能超7500万只,出口覆盖欧非亚——贵州贵航新能源科技有限公司,已成为推动区域新能源产业链发展的“关键一环”
2025-12-30 18:35:00
肯悦咖啡苹果冰雕点亮冰城 代言人白敬亭助阵亮灯迎新春
2025年12月29日,肯悦咖啡在哈尔滨中央大街举办了一场别开生面的“红苹果心愿季”冰雕点灯仪式。肯悦咖啡的巨型红色咖啡杯造型冰雕搭配“水晶”苹果
2025-12-30 18:50:00
博士创新站典型案例|保定市鑫诺电科软件开发有限公司博士创新站:校企协同创新赋民生
当前供水行业智能化转型加速推进,保定市鑫诺电科软件开发有限公司作为本地企业,在技术层面面临自主开发的智能客服系统缺乏适配技术
2025-12-30 19:36:00
京东京喜自营2025年成交额增长10倍 5大产业带订单量破亿
2025年即将结束,回看这一年,外贸逆袭、市场反内卷、AI全面爆发,用户消费需求回归理性,带动品质消费。今日,京东旗下特价购物品牌京喜自营披露了这一年的成绩单——2025年实现成交额10倍增长
2025-12-30 19:48:00
事关以旧换新!河南公开征集
大河网讯 为深入推进2026年消费品以旧换新政策实施,河南省商务厅日前正式发布《河南省2026年消费品以旧换新家电及数码智能产品参与品牌厂家征集公告》
2025-12-30 19:55:00
博士创新站典型案例|英利能源发展有限公司博士创新站:携手高校突破技术瓶颈
在全球“双碳”目标推动下,光伏产业成为新能源领域核心赛道。晶体硅太阳电池占据光伏市场主要份额,但高效光伏电池需切割分片制成组件
2025-12-30 18:04:00
博士创新站典型案例|石家庄数英仪器有限公司博士创新站:攻克高次谐波源国产化难题
随着新能源发电并网比例不断提高,光伏逆变引入的谐波频率日益升高,对电网谐波测量提出了新的技术要求。当前,国内市场主流谐波标准源的谐波次数普遍低于100次
2025-12-30 18:16:00
还在用App来回倒腾文件?鸿蒙6一碰即传,感受分享的魔法
傻瓜相机的发明,将人们从复杂的调焦、测光操作中解放出来,把摄影门槛拉低到有手就行。而在这个随身电子设备越来越多的时代,人们需要在跨设备文件
2025-12-30 13:04:00
把数字安全感还给用户:HarmonyOS 6的三道主动防御防线
在万物互联的数字时代,个人隐私的边界正变得日益模糊。我们或许都曾经历过这样的时刻:经常接到诈骗骚扰电话,或是家人手机里充斥着乱七八糟
2025-12-30 13:05:00
中国消费者报杭州讯(记者施本允)近日,浙江省台州市消费者权益保护委员会发布2025年电动自行车安全头盔比较试验报告。在随机购买的25款样品中
2025-12-30 14:20:00