• 我的订阅
  • 科技

stabilityai推stablelm3b语言模型

类别:科技 发布时间:2023-10-04 03:55:00 来源:浅语科技

10月3日消息,StabilityAI昨日发布公告,介绍了旗下一款名为StableLM3B的语言模型,号称适用于移动平台设备,“可为相关设备带来可持续、高性能的体验”。

stabilityai推stablelm3b语言模型

▲图源StabilityAI

IT之家从公告中得知,这款StableLM3B模型包含30亿个参数,主打文本生成,拥有基于变换器解码器架构的自回归体系,并使用了多个开源大规模数据集进行训练。

stabilityai推stablelm3b语言模型

▲图源StabilityAI

官方表示,该模型使用了30亿个参数,使用了256个NVIDIAA10040GBGPU训练而成,虽然参数相比同类大模型较少,但性能依然可圈可点,且由于该模型的体积较小、功耗更低,因此更适合移动平台使用。

此外,该模型拥有多平台兼容性,并允许根据特定需求进行微调,目前模型已经在HuggingFace平台上开源,方便开发者使用和改进

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-04 09:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较
2023-10-17 16:31:00
一键解锁ChatGPT原理与应用
...ive Pre-trained Transformer”的缩写,中文意为“生成式预训练变换器”。1. 大模型和传统AI的区别是什么
2023-05-10 03:00:00
英伟达携手达慕思大学开发“生成式人工智能教学工具包”
...基础知识。该课程还将使用英伟达云平台对生成式预训练变换器(GPT)模型进行云驱动培训,然后再扩展到涵盖图像和视频生成的扩散模型、多模型LLM架构及其优化和LLM协调等模块,该
2024-09-08 02:40:00
stability邀请用户测试文本到图像生成模型
...同用户需求和硬件能力。StabilityDiffusion3还结合了扩散型变换器(diffusiontransformer)架构,这种架构结合了深度学习和扩散模型的优势,能够
2024-02-23 16:10:00
AI大战高考作文:瞎编、凑字数、万能套路
...2017年谷歌首次提出基于自我注意力机制(self-attention)的变换器(Transformer)模型,现在类似ChatGPT之类的语言大模型
2023-06-08 10:14:00
上海市教委副主任倪闽景:面对ChatGPT,传统教育已被逼入墙角?
...他们基于可以进行并行数据计算和训练的自我注意力机制变换器模型(transformer),推出了生成式预训练变换器GPT(Generative Pre-trained Transformer)
2023-02-10 13:51:00
掰开揉碎告诉你,ChatGPT凭啥是人工智能“流量王”
...)应用到Seq2Seq中,形成一种新的算法框架“Transformer”(变换器),不再将整个输入序列编码为固定长度的中间向量C
2023-05-29 11:00:00
深度学习在AI教育中的应用及其关键技术探究
...习模型,如卷积神经网络(CNN)、循环神经网络(RNN)和变换器(Transformer)等。模型的设计需要考虑输入数据的特点和任务的复杂性。例如,在图像分类任务中,可以选择
2023-09-12 11:30:00
速度惊人,手机跑stablediffusion,12秒出图
...图调用中完成执行。(公式②)稳定扩散中的文本/图像变换器有助于对条件分布P(z|τθ(y))进行建模,这对文本到图像的生成任务至关重要。然而,自我/交叉注意力机制在处理长序列
2023-04-28 17:14:00
更多关于科技的资讯:
【2025数博会】记者探数博|机器人“咖啡师”上岗
在2025中国国际大数据产业博览会现场,一台智能咖啡机器人成为许多观众科技之旅的起点。只需简单几步,这位“咖啡师”就能制作出一杯手工现磨咖啡
2025-08-30 05:29:00
近日,在省通信管理局精心筹划下,国家超算太原中心、中国移动山西公司智算中心携手接入北京市算力互联互通平台,标志着山西在落实国家“东数西算”战略
2025-08-30 06:46:00
胶东金秋家装节大牌联动920启动仪式在青岛成功举办
青岛,2025年8月29日——今日下午,“胶东金秋家装节 大牌联动920启动仪式”在青岛市市北区居然之家店负一层中庭隆重举行
2025-08-30 07:23:00
【红色导师·思想汇报60】以青春之我,奔赴人工智能浪潮下的时代之约
思想汇报:“人工智能是引领新一轮科技革命和产业变革的战略性技术。”今年暑假,我作为华中农业大学经济管理学院“数智商途”暑期社会实践团队的队长
2025-08-29 14:52:00
临沂首届“何为精工”高端私宅精工论坛启幕,精工专委会同步成立
8月27日至28日,临沂首届“何为精工”高端私宅精工论坛在居然之家北城店盛大启幕。论坛由临沂室内设计师协会主办,汇聚建筑
2025-08-29 14:52:00
从“一瓶酒”到“一头牛”:海普数智为传统产业装上“数据引擎”
在氤氲的酱酒香里,一粒粒红缨子高粱正被赋予数字身份,经历着从农田到餐桌的全程溯源;在繁忙的灌装生产线上,一个个智能瓶盖不再只是容器
2025-08-29 14:55:00
央牧乳业:构建全域渠道生态,引领羊乳产业升级新纪元
央牧乳业以“真羊乳,选央牧”为品牌核心,打造中国羊乳产业渠道建设标杆。目前已完成全国5000+龙头商超系统战略布局(含大润发
2025-08-29 14:59:00
鲁网8月29日讯2025年8月,知名学者王立胜等人所著的《胖东来凭什么:一家幸福企业的哲学逻辑》一书由中国民主法制出版社出版发行
2025-08-29 16:03:00
小米升级澎湃OS 3Beta版后手机变得很烫,官方:约3天恢复满血
8月29日,小米澎湃OS官方微博发布答网友问,详细介绍了澎湃OS 3 Beta 后续推送计划,集中回答大家对小米澎湃OS 3 Beta版的高频问题
2025-08-29 16:04:00
拼多多要亲自拍短剧?招聘短剧制片运营,年薪近50万
8月29日消息,拼多多在招聘平台上发布了一则引人注目的招聘信息,招聘“短剧制片运营”岗位,年薪近50万,负责短剧内容制作
2025-08-29 16:05:00
【2025数博会】可信数据空间破解数据要素流通难题
8月28日,2025中国国际大数据产业博览会上,行业专家与企业代表聚焦可信数据空间建设及数据要素市场化发展开展深度交流
2025-08-29 16:29:00
浙江卫视×浙江文交所 联手打造全球首个爆款综艺文化数字资产
综艺史上的首次突破!浙江文化产权交易所携手Z视介,联手打造的浙江卫视全球首张综艺数字卡,8月29日重磅上线浙江文交所旗下乐数通平台
2025-08-29 16:30:00
对话领航者--滨高电梯朱海涛:成立换新体验中心 业务聚焦两大领域
鲁网8月29日讯近日,齐鲁商势力联盟对话领航者走进滨州市滨高电梯销售有限公司日立换新体验中心,与公司负责人朱海涛面对面
2025-08-29 16:40:00
贵安超算中心:每秒1.3亿亿次的峰值算力助力影视项目渲染
2025年暑期档光影盛宴的背后,贵安超算中心功不可没:参与《猫和老鼠:星盘奇缘》《刺杀小说家2》《731》等12部影视项目渲染
2025-08-29 17:00:00
【2025数博会】虚拟F1驱动贵阳打造全球数字体育新生态
虚拟F1赛事已从娱乐载体跃升为融合职业竞技、技术研发与商业创新的复合生态系统,成为推动真实F1技术革新与连接尖端科技大众化的核心桥梁
2025-08-29 17:00:00