• 我的订阅
  • 科技

130亿参数大模型免费商用

类别:科技 发布时间:2023-07-12 16:58:00 来源:瘦子财经

7月11日,百川智能发布了其最新的大模型Baichuan-13B,这是一款拥有130亿参数的开源可商用大规模语言模型。据官方介绍,Baichuan-13B在中英文基准测试中取得了同尺寸模型中最好的效果。此次发布的模型包含预训练(Baichuan-13B-Base)和对齐(Baichuan-13B-Chat)两个版本。百川智能表示,Baichuan-13B具有以下特点:首先,它在Baichuan-7B的基础上进一步扩大了参数量到130亿,并在高质量的语料上训练了1.4万亿tokens,超过了LLaMA-13B的40%,成为当前开源13B尺寸下训练数据量最多的模型。其次,它支持中英双语,使用ALiBi位置编码,上下文窗口长度为4096。此外,项目中同时开源了预训练和对齐模型,预训练模型是适用开发者的“基座”,而对齐模型(Baichuan-13B-Chat)具有很强的对话能力,开箱即用,几行代码即可简单地部署。为了支持更广大用户的使用,项目中同时开源了int8和int4的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如英伟达RTX3090这样的消费级显卡上。最后,Baichuan-13B不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。目前,该模型已经在多个平台公布,感兴趣的人可以前往了解。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-12 21:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

王小川新公司「百川智能」发布首个开源中英文大模型,开源免费可商用 | 最前线
...神,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用
2023-06-15 16:53:00
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...个大模型涌现,Meta“从善如流”,7月发布了LLama2开源可商用版本。国内,北京智源人工智能研究院于6月发布开源可商用的悟道3.0大模型,随后,百川智能、阿里云等进入开源
2023-10-14 00:21:00
百川智能发布中英文大模型:采用开源模式 可免费商用 【百川智能发布中英文大模型:采用开源模式 可免费商用】《科创板日报》15日讯,搜狗创始人王小川创立的百川智能公司,宣布推出了7
2023-06-15 14:51:00
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距
2025-01-23 13:32:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
...述Baichuan模型代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。目前
2023-08-09 15:00:00
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中
2024-01-29 19:57:00
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
...系列配套政策的。”俞凯表示,这次国产万卡算力池正式商用是一个很好的开始,在模型训练过程中一些适配以及针对性调整,总体上属于先进水平的算力中心。
2024-03-23 09:09:00
百川智能完成3亿美元A1轮融资,阿里、腾讯、小米等巨头参投
...能便接连发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B
2023-10-17 16:54:00
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技
2023-12-21 15:32:00
更多关于科技的资讯:
上市“后备军”,钟楼+2!
近日,江苏省科技厅公布2025年度省科技企业上市培育计划拟入库企业名单,常州市共5家企业入选,其中钟楼区有2家,分别是
2025-11-06 09:09:00
□南京日报/紫金山新闻记者何洁实习生杨久久“人工智能+”专项赛中荣获特等奖!11月3日,在第十九届“挑战杯”中国移动全国大学生课外学术科技作品竞赛中
2025-11-06 07:46:00
记者走基层|巧搭“数字积木” 智绘梦想花园
10月29日,承德图布斯科技集团有限公司技术人员正在调试设计图。 河北日报记者 陈宝云摄10月29日,在承德图布斯科技集团有限公司(以下简称“图布斯公司”)的研发中心
2025-11-05 08:12:00
□曹清华党的二十届四中全会提出,实施新时代立德树人工程,促进思政课堂和社会课堂有效融合,加强体育、美育、劳动教育,完善教育评价体系
2025-11-05 08:16:00
2025年沪江网校课程质量高于预期:退费无忧+承诺与践行一致!
一、沪江网校简介为沪江教育旗下品牌,沪江网校自 2009 年成立以来,始终聚焦外语学习者需求,提供网校一对一,凭借专业教学服务与多元课程体系
2025-11-05 14:45:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》显示,2024年我国生成式引擎优化(GEO)市场规模已达47亿元
2025-11-05 14:47:00
在智能体产业快步迈入规模化的当下,南京正以软件产业的深厚积淀、政策生态的精准培育、应用场景的丰富储备,抢占AI科技革命新高点前几天
2025-11-05 15:06:00
Openloong开源社区亮相ROSCon China 2025大会,为智能开源注入新活力
10月31日至11月1日,ROSCon China 2025在上海虹桥新华联索菲特大酒店成功举办。这一汇聚了全球ROS领域顶尖专家与开发者的年度盛会
2025-11-05 15:29:00
职场“反内卷”调研报告 干货多多
近日,智联招聘《职场“反内卷”调研报告》,探究职场人对于“反内卷”的真实态度与选择,了解企业的相应举措。今年“多家知名企业实施强制下班”的新闻冲上热搜
2025-11-05 15:32:00
鲁网11月5日讯“真没想到,资金难题这么快就解决了!东平农商银行的‘同心乐商贷’真是及时雨,我的蛋糕房终于要开起来了。”近日
2025-11-05 15:55:00
中国联通(青岛)智算中心DC1获评“2025年度国家绿色数据中心”
鲁网11月5日讯10月27日,工业和信息化部节能与综合利用司发布《2025年度国家绿色数据中心名单公示》,中国联通(青岛)智算中心DC1荣获“2025年度国家绿色数据中心”称号
2025-11-05 15:57:00
10月19日至20日,2025世界VR产业大会在南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势
2025-11-05 17:44:00
语言、技能与数字化:培生亮相CACIE 2025,共筑未来教育新生态
2025年10月29日至11月1日,第26届中国国际教育年会(CACIE)在北京国家会议中心举行。全球终身学习公司培生(FTS: PSON
2025-11-05 18:00:00
找对 “充电站”,心理从业者进阶不迷路!灵动生活集团幸福心理商学苑全维护航
“考下资格证却接不到个案,能做咨询却不懂怎么运营工作室”—— 这是国内超 70% 心理从业者入行后都会遇到的 “成长困境”
2025-11-05 18:01:00
第二十届福州市青少年机器人竞赛圆满落幕 近3500名青少年点燃科创热情
福州新闻网11月5日讯(记者 徐昕昀 文/图)11月2日,随着最后一场机器人竞技挑战赛的终场指令在福州高新区青少年活动中心响起
2025-11-05 18:05:00