• 我的订阅
  • 科技

全面开源 浪潮信息发布千亿参数基础大模型“源2.0”

类别:科技 发布时间:2023-11-28 07:46:00 来源:每日看点快看

本文转自:新华社

11月27日,浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。

基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“源2.0”提出了新的改进方法并获得了能力的提升。

全面开源 浪潮信息发布千亿参数基础大模型“源2.0”

“源2.0”能力测评数据(浪潮信息供图)

如在算法方面,“源2.0”提出并采用了一种新型的注意力算法结构“局部注意力过滤增强机制”,让大模型在使用更少的训练算力、更小的模型参数的情况下,同样可以获得更高的模型精度和涌现能力;数据方面,降低了互联网语料内容占比,通过使用中英文书籍、百科、论文等资料,结合高效的数据清洗流程,为大模型训练提供了高质量的学科专业数据集和逻辑推理数据集。

作为千亿级基础大模型,“源2.0”在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,“源2.0”在多项模型评测中展示出了较为先进的能力表现。

“源2.0”采用全面开源策略,全系列模型参数和代码均可免费下载使用。“大模型的开源开放可以使不同模型之间共享底层数据、算法和代码,有利于打破大模型孤岛,促进模型之间协作和更新迭代;同时,有利于以更丰富的高质量行业数据反哺模型,打造更强的技术产品,加速商业化进程。目前,业内仍没有完全开源可商用的千亿大模型,我们希望‘源2.0’能够为国内外开发者、研究机构、科技企业提供坚实的底座和成长的土壤。”浪潮信息高级副总裁刘军说。

浪潮信息长期致力于人工智能算力基础设施产品的研发,2021年在业界率先推出了中文AI巨量模型“源1.0”,参数规模达2457亿,落地南京智算中心。此次发布的“源2.0”较前一版本实现了能力的全面提升。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-28 08:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...对于缺乏相关经验和资金的公司来说,该怎么办?最近,浪潮信息的研发工程师,仅靠4颗CPU,就让千亿参数的「源2.0」在通用服务器上跑起来了!面对用Java编写程序的代码任务,「
2024-08-02 09:47:00
零代码基础也能复刻!大模型化身AI售前助手,百页万字标书秒解读
...式上岗,化身AI售前助手,已经开始拯救IT售前人了!在浪潮信息内部,一款名为“元小智”的AI助手,已经成为了员工们的得力助手。不仅能几秒钟读完上百页的招标文件,产品资料问答、
2024-09-25 09:51:00
生成式AI时代:AI服务器前景广阔,浪潮信息营收大增8成
...支撑,为高效AI服务器提供了更广阔的发展空间。其中,浪潮信息作为全球服务器市场重要玩家,受益算力需求,营收也恢复了增长
2024-06-20 09:33:00
浪潮信息推出as13000g7-n系列
人工智能时代下,浪潮信息紧跟时代步伐,于近日推出分布式全闪存储AS13000G7-N系列,专为大模型优化而设,为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统,搭
2024-06-16 10:27:00
GPU缺口45万片?中国大模型产业链有新动向
...应用场景。“其实,今天我们只是在生成式AI的起点。”浪潮信息高级副总裁刘军告诉数智前线,“我认为还没有到定义中国大模型格局的阶段。”浪潮信息高级副总裁刘军他的理由是,生成式A
2023-08-31 09:57:00
“AIGC智算之道”圆桌对话: 浪潮信息+百川+快手+金山办公
...mp;CEO杨静主持“共话AIGC时代,智算发展之道”圆桌论坛,与浪潮信息高级副总裁刘军、百川智能技术联合创始人陈炜鹏、快手异构计算负责人刘凌志、金山办公技术总监熊龙飞围绕大
2023-09-13 18:00:00
4月17日,浪潮信息与英特尔(Intel)联合发布AI通用服务器NF8260G7,在业界首次实现服务器基于通用处理器支持千亿参数大模型的运行,灵活满足基于大模型的AI应用及云计算
2024-04-22 10:33:00
...。这也是为何众多大模型厂商如OpenAI、谷歌、Mistral AI、浪潮信息等陆续基于MoE架构升级自家大模型产品的原因
2024-06-03 14:07:00
...操秀英近日,浪潮电子信息产业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依
2023-12-04 03:07:00
更多关于科技的资讯: