• 我的订阅
  • 科技

昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2

类别:科技 发布时间:2023-10-30 15:35:00 来源:中国经济网

10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。

昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。

除模型开源外,Skywork-13B系列大模型还将开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文数据集之一。

同时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。

130亿参数、两大模型、最大中文数据集之一、全面开放商用。昆仑万维「天工」Skywork-13B系列大模型堪称业内开源最彻底的百亿高质量商用模型。

Skywork-13B系列大模型的开源将为大模型的场景应用和开源社区发展提供最佳技术支持,降低大模型商业门槛,推动人工智能技术落地千行百业,为人工智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。

两大模型 领先行业

昆仑万维「天工」Skywork-13B系列包括两大模型及150B高质量中文数据集。

Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。

Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等数据集上取得了同等规模模型的最佳效果。

Skypile/Chinese-Web-Text-150B数据集。该数据集是根据昆仑万维经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB,总token数量约为(1500亿),是目前最大得开源中文数据集之一。

除此之外,Skywork-13B系列还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动人工智能通用智能(AGI)的实现。

五大特点 全面超越

昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。

Skywork-13B系列模型的五大特点:

1.最强参数表现:全面超越同等规模大模型

本次开源的Skywork-13B系列模型在CEVAL, CMMLU, MMLU, GSM8K等几大权威评估基准中全面超越LLaMA2-13B等开源大模型,在同等规模大模型间取得最佳效果。(截止至10月25日数据)

昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2

2.最多训练数据:3.2T高质量的多语言训练数据

Skywork-13B系列大模型拥有130亿参数、3.2万亿高质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。

3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型

Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创能力。在中文文本创作领域的评测中,Skywork-13B系列大模型展现出了卓越的能力,尤其在科技、金融、政务、企业服务、文创、游戏等领域均表现高于业内其他开源模型。

昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2

上图为不同领域数据下评估模型的困惑度,越低代表模型在该领域建模能力越强。结果显示天工13B在技术文章,电影,政务报告,游戏,金融,通用领域均表现出色

4.最大中文开源数据集之一:150B Tokens高质量中文语料

Skywork-13B系列将配套开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文数据集之一。开发者可以最大程度地借鉴技术报告中大模型预训练的过程和经验,深度定制模型参数,有针对性的进行训练与优化。

5.最有诚意的开源商用:无需申请,即可实现商用

目前开源社区中的中文大模型多数并非是完全可商用,一般开源社区用户通常需要进行复杂的商用授权申请流程,在某些情况,甚至有对公司规模、所在行业、用户数等维度有明确规定不给予商业授权。

昆仑万维对Skywork-13B系列开源的开放性和可商用性高度重视,将授权流程做到极简,取消对行业、公司规模、用户等方面的限制,目的是帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。

此次Skywork-13B系列大模型将全面开放商用许可,用户在下载模型并同意并遵守《Skywork模型社区许可协议》后,无需再次申请授权即可将大模型进行商业用途。希望用户能够更便捷地探索Skywork-13B系列大模型技术能力,探索在不同场景下的商业化应用。

推动开源生态繁荣,让更多开发者们参与到AIGC的技术发展中,在共创和共享中推动技术的提升。

面向AI的时代,蓬勃发展的开源生态建设是构建AI和应用融合的重要一环。降低模型的研发门槛,使用成本,最大化的共享技术能力和经验,让更多的企业和开发者们参与到此次AI引领的科技变革中去。昆仑万维董事长兼CEO方汉是最早参与到开源生态建设的开源老兵,也是中文Linux开源最早的推动者之一,开源的精神和AIGC技术的发展将会在昆仑万维战略中完美融合。

All in AGI与AIGC

All in AGI与AIGC是昆仑万维的战略。

4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。

5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成员名单》。昆仑万维凭借在AIGC领域的前沿探索和投资布局,成为第一批模型伙伴和投资伙伴。

8月23日,昆仑万维发布国内第一款AI搜索产品——天工AI搜索。

9月1日,计算机视觉和机器学习领域的国际顶级专家颜水成教授正式加盟昆仑万维,与昆仑万维创始人周亚辉一起出任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长,负责前沿技术的研究。

9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。

9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。

今天,天工Skywork-13B系列大模型的开源标志着昆仑万维持续投资AGI生态的决心。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-30 21:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

昆仑万维2023半年报:营收24.3亿 经营性现金流同比增长30%
8月24日晚间,昆仑万维公布了2023半年报。2023年上半年,公司实现营业总收入24.3亿元,同比增长8%。整体毛利率达80%
2023-08-24 21:34:00
AIGC按下昆仑万维的全球化加速度
...海外互联平台找到了一个更好的切合点。12月15日,昆仑万维在北京举行AIGC技术发布会,会上昆仑万维CEO方汉正式发布了昆仑天工AIGC全系列算法与模型
2022-12-19 09:02:00
昆仑万维上半年收入25亿,AI应用加速落地,商业化成果显著
...的创新平台WorldEngine,让创作者“一键成剧”,轻松制作高质量AI视频。Melodio产品展示 Mureka商业化展示AI社交产品Linky功能展示 商业化侧
2024-08-23 21:16:00
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...」在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。这也是“天工”让用户感受到其足够“聪明”、“通人性”的关键原因之一。开源社区科学家助力 打造更懂中文的对话式AI
2023-04-17 15:42:00
昆仑万维2024年前三季度营收38.3亿,以大模型技术驱动多款AI应用创新
10月29日,昆仑万维发布了2024年第三季度报告。截至本报告期末,公司实现营业收入38.3亿元,同比增长4%。同时,为保持竞争优势
2024-10-29 22:14:00
昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE
本文转自:中国新闻网6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来
2024-06-03 20:59:00
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
本文转自:中国新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日
2024-04-01 19:56:00
...相关工程经验积累,能够快速、有力的推动先进技术实现高质量落地。本次交易决策审慎合理,有利于提升公司经营质量,不存在迎合热点炒作股价的情形。昆仑万维表示,王立伟自2020年7月
2023-06-21 20:49:00
昆仑万维重磅发布天工AI高级搜索功能,做最懂金融投资、科研学术的AI搜索
...和总结,天工AI能够为用户提供更加全面、深入且权威的高质量回答。在强推理能力的加持下,显著提高了用户在处理复杂问题时的信息获取效率,同时提升了结果的深度与可靠性。在经过问题拆
2024-11-05 14:56:00
更多关于科技的资讯:
江西热敏灸机器人获批上市 赋能百亿产业链提速
本报讯(全媒体记者李芳)10月9日,省药监局正式批准热敏灸机器人第二类医疗器械上市。这标志着江西热敏灸产业进入数智化时代
2025-10-17 07:10:00
厦门网讯 (厦门日报记者 薛尧)无人机、运动相机迎来降价潮!近日有市民发现相关热门产品价格跳水,记者走访了解到,我市多家大疆授权体验店中
2025-10-16 08:38:00
助力视弱群体畅行 公交视弱辅助系统“喊”您上车
视弱人士庄先生在公交视弱辅助系统的帮助下乘车。厦门网讯(文/图 厦门日报记者 林钦圣 通讯员 江安娜) “我们先找到并打开公交App
2025-10-16 08:38:00
10月15日晚,福州金融街商务区“亮灯”,迎接2025世界航海装备大会。
2025-10-16 08:59:00
近日,中石化石油工程设计有限公司自主研发的“管道环焊缝射线检测缺陷智能辅助评判系统”,顺利完成准确率测试。本次测试中,该系统总计检查了210张油气长输管道环焊缝射线检测底片
2025-10-16 09:03:00
当“遇到问题先到社交媒体上搜索”成为一代青少年的本能反应,当班级群、兴趣圈与直播平台深度嵌入他们的日常生活,社交网络正构成这代“数字原住民”成长的基本环境
2025-10-16 09:16:00
在人工智能技术飞速发展的今天,大模型以其强大的信息处理与泛化能力,正深刻改变医学领域的科研与临床实践。与此同时,以聚类分析
2025-10-16 09:57:00
人去世了朋友圈会消失吗?微信:对长时间不使用账号已不再回收
10月15日,“微信派”微信公众号发布最新一期播客,聊到了“真的很多人不发朋友圈了吗?”“人去世后,朋友圈会被回收吗?”等话题
2025-10-16 10:13:00
日日佳携手企知道,共同推动智能显示技术科技创新
近日,深圳日日佳显示技术有限公司(以下简称“日日佳”或“公司”)正式签约入驻企知道科创空间。作为专注于TFT-LCD模组制造的细分领域的国家高新技术企业和深圳市专精特新中小企业
2025-10-16 10:18:00
汽车测评 全球协同 | 解码C-NCAP——护航公众出行安全
当汽车从单纯的“交通工具”升级为承载多元需求的“出行载体”,是什么力量在守护这场变革的安全底线?2025世界NCAP大会即将在中国上海启幕
2025-10-16 10:50:00
花田玑密入选“2025山东省优秀兴农电商企业案例”
2025年10月16日,由山东省商务厅主办的“数商兴农庆丰收暨九九网购节”电商促消费活动在青岛莱西市人民广场隆重启动。花田玑密品牌创始人
2025-10-16 10:53:00
香港金管局公布生成式AI沙盒名单,蚂蚁数科入选技术合作伙伴
10月15日,香港金融管理局(HKMA)与香港数码港管理有限公司联合公布第二期生成式AI沙盒参与者名单。蚂蚁银行、中银香港
2025-10-16 11:24:00
卢伟冰官宣REDMI K90系列明天见!不排斥和小米直接竞争
10月16日,小米集团合伙人、总裁卢伟冰微博正式官宣,REDMI K90系列明天见。他发文透露,本次发布会是小米手机业务在旗舰新品发布季的第二篇章
2025-10-16 12:00:00
从2019年首届举办至今,VR/AR产业博览会已成为虚拟现实行业“不可或缺的重要盛事”,不仅是展示最新产品与技术的窗口
2025-10-16 12:07:00
在全球人工智能技术迅猛发展并向各领域深度渗透的背景下,高校思想政治教育作为培养时代新人的关键环节,正面临数字化转型的机遇与挑战
2025-10-16 13:40:00