• 我的订阅
  • 科技

130亿参数大模型免费商用

类别:科技 发布时间:2023-07-12 16:58:00 来源:瘦子财经

7月11日,百川智能发布了其最新的大模型Baichuan-13B,这是一款拥有130亿参数的开源可商用大规模语言模型。据官方介绍,Baichuan-13B在中英文基准测试中取得了同尺寸模型中最好的效果。此次发布的模型包含预训练(Baichuan-13B-Base)和对齐(Baichuan-13B-Chat)两个版本。百川智能表示,Baichuan-13B具有以下特点:首先,它在Baichuan-7B的基础上进一步扩大了参数量到130亿,并在高质量的语料上训练了1.4万亿tokens,超过了LLaMA-13B的40%,成为当前开源13B尺寸下训练数据量最多的模型。其次,它支持中英双语,使用ALiBi位置编码,上下文窗口长度为4096。此外,项目中同时开源了预训练和对齐模型,预训练模型是适用开发者的“基座”,而对齐模型(Baichuan-13B-Chat)具有很强的对话能力,开箱即用,几行代码即可简单地部署。为了支持更广大用户的使用,项目中同时开源了int8和int4的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的机器资源门槛,可以部署在如英伟达RTX3090这样的消费级显卡上。最后,Baichuan-13B不仅对学术研究完全开放,开发者也仅需邮件申请并获得官方商用许可后,即可以免费商用。目前,该模型已经在多个平台公布,感兴趣的人可以前往了解。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-12 21:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

王小川新公司「百川智能」发布首个开源中英文大模型,开源免费可商用 | 最前线
...神,baichuan-7B代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用
2023-06-15 16:53:00
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
...个大模型涌现,Meta“从善如流”,7月发布了LLama2开源可商用版本。国内,北京智源人工智能研究院于6月发布开源可商用的悟道3.0大模型,随后,百川智能、阿里云等进入开源
2023-10-14 00:21:00
百川智能发布中英文大模型:采用开源模式 可免费商用 【百川智能发布中英文大模型:采用开源模式 可免费商用】《科创板日报》15日讯,搜狗创始人王小川创立的百川智能公司,宣布推出了7
2023-06-15 14:51:00
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...天翼云、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距
2025-01-23 13:32:00
王小川公布最新530亿百川大模型,阿里腾讯等超150家企业已使用
...述Baichuan模型代码采用Apache-2.0协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。目前
2023-08-09 15:00:00
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中
2024-01-29 19:57:00
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
...系列配套政策的。”俞凯表示,这次国产万卡算力池正式商用是一个很好的开始,在模型训练过程中一些适配以及针对性调整,总体上属于先进水平的算力中心。
2024-03-23 09:09:00
百川智能完成3亿美元A1轮融资,阿里、腾讯、小米等巨头参投
...能便接连发布Baichuan-7B/13B,Baichuan2-7B/13B四款开源可免费商用大模型及Baichuan-53B
2023-10-17 16:54:00
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技
2023-12-21 15:32:00
更多关于科技的资讯:
AI时代,“养小龙虾”就能创业成功?
有人研究怎么把企业做大,有人研究怎么把企业做快,这个人却一头扎进历史堆里,研究一件事:为什么有些企业能活很久,有些却中途消失
2026-03-10 20:17:00
当前AI技术正在深入影响内容创作行业,对于AI编曲现象,全国政协委员王黎光表示,AI虽然能代替创作过程但不能代替人工。AI编曲是以大模型的储备量和收集量为基础的
2026-03-10 20:39:00
在银行业竞争日趋激烈、利差收窄的宏观环境下,镇江农商银行坚持以精细化管理为抓手,通过实施“熵减工程”“蜂巢工程”和结构调优三大举措
2026-03-10 22:41:00
中新经纬3月10日电 小红书“薯管家”官方账号发布公告称,近期,平台发现部分用户采用AI托管模式运营账号,通过技术手段自动生成内容
2026-03-10 21:19:00
中国网3月10日讯 据“国家互联网应急中心CNCERT”微信公众号消息,近期,OpenClaw(“小龙虾”,曾用名Clawdbot
2026-03-10 20:05:00
春风送千岗,AI助求职:2026年综合专场招聘会暨春风行动就业援助活动圆满结束
3月7日上午,“AI聘·才汇来”相城区2026年综合类专场招聘会暨春风行动就业援助活动在相城区人力资源市场成功举办。作为“春风行动”系列活动之一
2026-03-10 17:45:00
国科光锐研发生产基地项目落户黄桥
江南时报讯 3月4日,国科光锐研发生产基地项目签约仪式顺利举行,抢抓高端装备制造产业发展机遇,完善先进制造业发展支撑体系
2026-03-10 17:48:00
“养龙虾”,多地砸钱支持
中新经纬3月10日电 “养龙虾”,这是近日的AI热词,即部署和使用名为OpenClaw‌的开源AI智能体框架,因其图标为一只红色龙虾
2026-03-10 19:10:00
鲁网3月10日讯(记者 张佳伟)3月9日,由中国生物发酵产业协会主办、安琪酵母股份有限公司承办的“2026第十一届发酵培养基应用与发展技术论坛”在济南黄河国际会展中心举行
2026-03-10 17:24:00
两会,就这Young!丨万亿存量市场怎么激活?全国人大代表郭兴田用“两天”作答
编者按:今年全国两会,大河网两位00后记者首次踏上两会征程,以“萌新”视角记录两会,为网友带来全新体验:不背稿、不装样
2026-03-10 14:21:00
让家陪伴成长——金隅天坛家居Mall 3月7日启幕,定义“家生活”新方式
在快速更迭的时代,人们对家的期待已超越功能满足,转而追求情感承载与成长陪伴。正是基于这一洞察,金隅天坛家居Mall提出“我家的长期主义”核心主张——让家能够伴随家庭成长
2026-03-10 14:26:00
在教育选择中,高途网课是否靠谱、教育机构是否可靠、办学是否正规,是学习者和家长最为关注的核心问题。高途 2025 财年第四季度及全年财报
2026-03-10 14:27:00
文化认同融入创新表达,“欢笑中国年”如何抓住大众情绪的小切口?
2026 年春节,红包大战再度迎来内卷与爆发,随着AI平台扎堆涌入,用户在春节期间的注意力被分散、现金激励的边际效应减弱
2026-03-10 16:50:00
灵寿县:灵活就业AI分析让求职成功率提升25%
“把这次春风行动搜集到的信息尽快录入系统,用AI分析一下,精准做好匹配。”3月8日,灵寿县零工市场有关负责人张杉认真梳理了上一场“春风行动”收集到的用工求职信息
2026-03-10 11:30:00
杭州的人形机器人太超前 德国留学生专程为它来学习
近日,浙江科技大学机器人现代产业学院实验室里,来自德国德累斯顿技术经济大学的硕士研究生马克西米利安·穆勒正在开展关于宇树人形机器人的毕业论文研究
2026-03-10 11:36:00