• 我的订阅
  • 科技

b站开源轻量级index-1.9b系列模型,包含多个版本

类别:科技 发布时间:2024-06-20 10:12:00 来源:浅语科技

6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。

附官方简介:

Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。

Index-1.9Bpure:基座模型的对照组,与base具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有指令相关的数据,以此来验证指令对benchmark的影响。

Index-1.9Bchat:基于index-1.9Bbase通过SFT和DPO对齐后的对话模型,由于预训练中引入了较多互联网社区语料,聊天的趣味性明显更强。

Index-1.9Bcharacter:在SFT和DPO的基础上引入了RAG来实现fewshots角色扮演定制。

b站开源轻量级index-1.9b系列模型,包含多个版本

b站开源轻量级index-1.9b系列模型,包含多个版本

据介绍,该模型在预训练阶段使用了2.8T规模的数据,中英比例为4:5,代码占比6%。目前,角色扮演模型内置了角色“三三”,用户也可以按需创建自己的角色。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-20 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此
2024-09-27 13:42:00
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用
2024-09-27 13:39:00
20亿参数!谷歌发布轻量级开源人工智能模型Gemma
...它团队共同开发的,旨在为开发人员和研究者提供一个“轻量级、最先进的开源模型系列”,采用了与创建Gemini模型相同的研究和技术
2024-02-22 20:42:00
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
智东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行
2024-08-22 09:49:00
苹果Vision Pro上市刷屏后,CES 2024中国AR厂商秀肌肉
...e。据 VR陀螺了解,雷鸟X2 Lite 是去年已发布的雷鸟X2 的“轻量级”版本,从产品外观设计、核心光学、性能配置到应用场景
2024-01-10 15:56:00
腾讯混元一口气开源5个3D生成模型:最快30秒生成!
...息,能够更好地捕捉细节并生成符合用户预期的3D资产。轻量级mini系列模型:通过模型架构优化与运行效率提升,可进一步降低算力成本,其几何模型可以部署在4080显卡甚至苹果M1
2025-03-19 00:26:00
杭州亚运会上的AI数字人火了;亚马逊开发AI搜索引擎;大模型将如何重塑教育科技丨AI新零售早报
...司Kneron耐能共计9700万美元的B轮融资,特别关注汽车领域轻量级GPT的解决方案。问题:当前大多数GPT模型在云端数据中心运行,从而导致高延迟、高传输数据成本以及用户隐
2023-10-08 11:36:00
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...实力,通过开源其最新的AI模型Gemma,向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的
2024-02-23 09:18:00
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...访问性,并有了一系列新成果。此次,Gemma 2 不仅有了更轻量级「Gemma 2 2B」版本,还构建一个安全内容分类器模型「ShieldGemma」和一个模型可解释性工具「Gemma Scope」
2024-08-02 09:43:00
更多关于科技的资讯: