• 我的订阅
  • 科技

国内首个类chatgpt模型:复旦大学moss今日正式开源

类别:科技 发布时间:2023-04-21 22:51:00 来源:浅语科技

复旦大学自然语言处理实验室开发的新版MOSS模型今日正式上线,成为国内首个插件增强的开源对话语言模型。

国内首个类chatgpt模型:复旦大学moss今日正式开源

目前,MOSS模型已上线开源,相关代码、数据、模型参数已在Github和HuggingFace等平台开放,供科研人员下载。

国内首个类chatgpt模型:复旦大学moss今日正式开源

据介绍,MOSS是一个支持中英双语和多种插件的开源对话语言模型,moss-moon系列模型具有160亿参数,在FP16精度下可在单张A100/A800或两张3090显卡运行,在INT4/8精度下可在单张3090显卡运行。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。

MOSS来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名字与《流浪地球》电影中的AI同名,已发布至公开平台(https://moss.fastnlp.top/),邀请公众参与内测。

IT之家查看MOSS的GitHub页面发现,该项目所含代码采用Apache2.0协议,数据采用CCBY-NC4.0协议,模型权重采用GNUAGPL3.0协议。如需将该项目所含模型用于商业用途或公开部署,需要签署文件并发送至robot@fudan.edu.cn取得授权,商用情况仅用于记录,不会收取任何费用。MOSS用例:

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲解方程

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲生成图片

国内首个类chatgpt模型:复旦大学moss今日正式开源

▲无害性测试模型

moss-moon-003-base:MOSS-003基座模型,在高质量中英文语料上自监督预训练得到,预训练语料包含约700B单词,计算量约6.67x1022次浮点数运算。

moss-moon-003-sft:基座模型在约 110万多轮对话数据上微调得到,具有指令遵循能力、多轮对话能力、规避有害请求能力。

moss-moon-003-sft-plugin:基座模型在约110万多轮对话数据和约30万插件增强的多轮对话数据上微调得到,在moss-moon-003-sft基础上还具备使用搜索引擎、文生图、计算器、解方程等四种插件的能力。

moss-moon-003-pm:在基于moss-moon-003-sft收集到的偏好反馈数据上训练得到的偏好模型,将在近期开源。

moss-moon-003:在moss-moon-003-sft基础上经过偏好模型moss-moon-003-pm训练得到的最终模型,具备更好的事实性和安全性以及更稳定的回复质量,将在近期开源。

moss-moon-003-plugin:在moss-moon-003-sft-plugin基础上经过偏好模型moss-moon-003-pm训练得到的最终模型,具备更强的意图理解能力和插件使用能力,将在近期开源。数据

moss-002-sft-data:MOSS-002所使用的多轮对话数据,覆盖有用性、忠实性、无害性三个层面,包含由text-davinci-003生成的约57万条英文对话和59万条中文对话。

moss-003-sft-data: moss-moon-003-sft所使用的多轮对话数据,基于MOSS-002内测阶段采集的约10万用户输入数据和gpt-3.5-turbo构造而成,相比moss-002-sft-data,moss-003-sft-data更加符合真实用户意图分布,包含更细粒度的有用性类别标记、更广泛的无害性数据和更长对话轮数,约含110万条对话数据。目前仅开源少量示例数据,完整数据将在近期开源。

moss-003-sft-plugin-data: moss-moon-003-sft-plugin所使用的插件增强的多轮对话数据,包含支持搜索引擎、文生图、计算器、解方程等四个插件在内的约30万条多轮对话数据。目前仅开源少量示例数据,完整数据将在近期开源。

moss-003-pm-data: moss-moon-003-pm所使用的偏好数据,包含在约18万额外对话上下文数据及使用moss-moon-003-sft所产生的回复数据上构造得到的偏好对比数据,将在近期开源。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-22 05:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“保险智能专家”在复旦诞生
...青年报记者孙琪保险大模型可实现多场景的个性化服务据复旦大学风险管理与保险学系系主任许闲教授介绍,“保险智酷”是为保险场景下的各类用户提供专业、智能、全面的数字化服务的保险领域
2023-12-08 07:23:00
...转自:解放日报本报讯(记者 俞陶然)记者昨天获悉,复旦大学自然语言处理实验室开发的新版MOSS模型已上线,成为国内首个插件增强的开源对话语言模型,支持搜索引擎、图像生成、计算
2023-04-22 05:44:00
大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究
...狐科技《思想大爆炸——对话科学家》栏目第31期,对话复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏。嘉宾简介:邱锡鹏,复旦大学计算机科学技术学院教授,中国计算机学
2023-09-28 12:01:00
...研智算平台CFFF(Computing for the Future at Fudan)近日在上海复旦大学正式上线
2023-07-27 01:36:00
复旦大学发布CFFF智能计算平台2.0 人工智能基础设施覆盖“教-学-研”全链条
中新网上海5月27日电 (陈静汪蒙琪)记者27日获悉,复旦大学正式发布CFFF智能计算平台2.0(简称:CFFF2.0平台)
2025-05-27 11:05:00
国内高校最大规模异构智算平台正式上线
...的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线
2023-07-04 08:38:00
复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”揭牌 进一步深化“车路云一体化”模式
...”市级科技重大专项2023年度总结会议成功举办。会上,复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”正式揭牌,是车路云一体化研究中心。这一举措标志着我国在推动智能交通
2023-12-22 18:37:00
复旦MOSS大模型开源了!Github和Hugging Face同时上线
...还是蜂拥而上,把服务器都给挤爆了。而发布没过一周,复旦大学教授邱锡鹏就在演讲中提出,如果优化顺利,计划在三月底开源MOSS。因为在他看来:人们之所以很容易有“卡脖子”问题,是
2023-04-23 16:48:00
复旦马剑鹏团队研发新型智能算法,助力提升新药研发成功率
...次迎来突破,生物大分子结构预测技术得到升级。近日,复旦大学复杂体系多尺度研究院院长马剑鹏教授领衔的科研团队开发出了新型智能计算方法OPUS-DSD,该算法不但能够成功地解析在
2023-10-10 16:11:00
更多关于科技的资讯:
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00
中交一航局二公司检测中心研发一款基于若依结构的档案管理系统
鲁网2月10日讯近日,中交一航局二公司检测中心研发一款基于若依结构的档案管理系统,该系统依托若依架构精准破解行业痛点,集成RBAC权限管控
2026-02-10 15:09:00
量子技术赋能电网 安徽筑牢民生用电安全线
大皖新闻讯 今年1月,国内首个量子智慧台区在马鞍山市当涂县乌溪镇七房村正式投运。这是我国首次将量子技术与柔性互联技术规模化应用于乡村电网
2026-02-10 11:19:00
荣事达空气炸锅:温度旋钮仅为装饰 官网竟跳赌博网站
鲁网2月9日讯近日,鲁网记者收到网友关于荣事达空气炸锅的投诉。记者在抖音等社交平台看到,有关“荣事达空气炸锅调节温度的旋钮是假的”的消息在网上引发热议
2026-02-10 08:11:00
河北新闻网讯(吴萌、王冠喜)近日,在开滦集团钱家营矿业公司(简称“开滦钱矿公司”)1351工作面,一线工作20多年的老班长刘金华谈起新采用的单元支架时感触颇深
2026-02-10 09:41:00
在东阳横店,一套月租1200元的三室一厅里,藏着中国动画行业一股不可忽视的新生力量。这里没有庞大的制作团队,只有4位核心成员
2026-02-10 09:29:00
画里有话|别让专利造假侵蚀创新生态
图/沈海涛 文/王 琦如今,一条成熟的专利造假产业链正在暗中滋生蔓延:部分专利代理机构以几百元起的低价,提供从无到有的专利全程编造服务
2026-02-10 08:07:00
走市场 看消费|直播与即时零售发力,电商销售火热
借力互联网 线上赶年集直播与即时零售发力,电商销售火热2月3日,在大名县“一品一播”产业园直播间,主播齐美冉正在直播带货
2026-02-10 08:08:00
奋进的河北·数读新变化|政策加力,以旧换新激发市场潜能
政策加力,以旧换新激发市场潜能——2025年全省社会消费品零售总额增速缘何位居全国第二(一)制图/褚林一份亮眼的消费“成绩单”
2026-02-10 08:09:00
人形机器人将再次登上春晚、四足机器人穿梭写字楼送咖啡、养老机器人上门为老人送餐送药……具身智能产业加速奔跑,近日,杭州具身智能应用中试基地产业委员会筹备会举行
2026-02-10 06:56:00