• 我的订阅
  • 科技

130亿参数大模型免费商用

类别:科技 发布时间:2023-07-12 16:58:00 来源:瘦子财经

7月11日,百川智能发布了其最新的大模型Baichuan-13B,这是一款拥有130亿参数的开源可商用大规模语言模型。据官方介绍,Baichuan-13B在中英文基准测试中取得了同尺寸模型中最好的效果。此次发布的模型包含预训练(Baichuan-13B-Base)和对齐(Baichuan-13B-Chat)两个版本。百川智能表示,Baichuan-13B具有以下特点:首先,它在Baichuan-7B的基础上进一步扩大了参数量到130亿,并在高质量的语料上训练了1.4万亿tokens,超过了LLaMA-13B的40%,成为当前开源13B尺寸下训练数据量最多的模型。其次,它支持中英双语,使用ALiBi位置编码,上下文窗口长度为4096。此外,项目中同时开源了预训练和对齐模型,预训练模型是适用开发者的“基座”,而对齐模型(Baichuan-13B-Chat)具有很强的对话能力,开箱即用,几行代码即可简单地部署。为了支持更广大用户的使用,项目中同时开源了int8和int4的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如英伟达RTX3090这样的消费级显卡上。最后,Baichuan-13B不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。目前,该模型已经在多个平台公布,感兴趣的人可以前往了解。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-12 21:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

王小川新公司「百川智能」发布首个开源中英文大模型,开源免费可商用 | 最前线
...神,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用
2023-06-15 16:53:00
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...个大模型涌现,Meta“从善如流”,7月发布了LLama2开源可商用版本。国内,北京智源人工智能研究院于6月发布开源可商用的悟道3.0大模型,随后,百川智能、阿里云等进入开源
2023-10-14 00:21:00
百川智能发布中英文大模型:采用开源模式 可免费商用 【百川智能发布中英文大模型:采用开源模式 可免费商用】《科创板日报》15日讯,搜狗创始人王小川创立的百川智能公司,宣布推出了7
2023-06-15 14:51:00
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距
2025-01-23 13:32:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
...述Baichuan模型代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。目前
2023-08-09 15:00:00
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中
2024-01-29 19:57:00
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
...系列配套政策的。”俞凯表示,这次国产万卡算力池正式商用是一个很好的开始,在模型训练过程中一些适配以及针对性调整,总体上属于先进水平的算力中心。
2024-03-23 09:09:00
百川智能完成3亿美元A1轮融资,阿里、腾讯、小米等巨头参投
...能便接连发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B
2023-10-17 16:54:00
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技
2023-12-21 15:32:00
更多关于科技的资讯:
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00