• 我的订阅
  • 科技

stabilityai推stablelm3b语言模型

类别:科技 发布时间:2023-10-04 03:55:00 来源:浅语科技

10月3日消息,StabilityAI昨日发布公告,介绍了旗下一款名为StableLM3B的语言模型,号称适用于移动平台设备,“可为相关设备带来可持续、高性能的体验”。

stabilityai推stablelm3b语言模型

▲图源StabilityAI

IT之家从公告中得知,这款StableLM3B模型包含30亿个参数,主打文本生成,拥有基于变换器解码器架构的自回归体系,并使用了多个开源大规模数据集进行训练。

stabilityai推stablelm3b语言模型

▲图源StabilityAI

官方表示,该模型使用了30亿个参数,使用了256个NVIDIAA10040GBGPU训练而成,虽然参数相比同类大模型较少,但性能依然可圈可点,且由于该模型的体积较小、功耗更低,因此更适合移动平台使用。

此外,该模型拥有多平台兼容性,并允许根据特定需求进行微调,目前模型已经在HuggingFace平台上开源,方便开发者使用和改进

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-10-04 09:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较
2023-10-17 16:31:00
一键解锁ChatGPT原理与应用
...ive Pre-trained Transformer”的缩写,中文意为“生成式预训练变换器”。1. 大模型和传统AI的区别是什么
2023-05-10 03:00:00
英伟达携手达慕思大学开发“生成式人工智能教学工具包”
...基础知识。该课程还将使用英伟达云平台对生成式预训练变换器(GPT)模型进行云驱动培训,然后再扩展到涵盖图像和视频生成的扩散模型、多模型LLM架构及其优化和LLM协调等模块,该
2024-09-08 02:40:00
stability邀请用户测试文本到图像生成模型
...同用户需求和硬件能力。StabilityDiffusion3还结合了扩散型变换器(diffusiontransformer)架构,这种架构结合了深度学习和扩散模型的优势,能够
2024-02-23 16:10:00
AI大战高考作文:瞎编、凑字数、万能套路
...2017年谷歌首次提出基于自我注意力机制(self-attention)的变换器(Transformer)模型,现在类似ChatGPT之类的语言大模型
2023-06-08 10:14:00
上海市教委副主任倪闽景:面对ChatGPT,传统教育已被逼入墙角?
...他们基于可以进行并行数据计算和训练的自我注意力机制变换器模型(transformer),推出了生成式预训练变换器GPT(Generative Pre-trained Transformer)
2023-02-10 13:51:00
掰开揉碎告诉你,ChatGPT凭啥是人工智能“流量王”
...)应用到Seq2Seq中,形成一种新的算法框架“Transformer”(变换器),不再将整个输入序列编码为固定长度的中间向量C
2023-05-29 11:00:00
深度学习在AI教育中的应用及其关键技术探究
...习模型,如卷积神经网络(CNN)、循环神经网络(RNN)和变换器(Transformer)等。模型的设计需要考虑输入数据的特点和任务的复杂性。例如,在图像分类任务中,可以选择
2023-09-12 11:30:00
速度惊人,手机跑stablediffusion,12秒出图
...图调用中完成执行。(公式②)稳定扩散中的文本/图像变换器有助于对条件分布P(z|τθ(y))进行建模,这对文本到图像的生成任务至关重要。然而,自我/交叉注意力机制在处理长序列
2023-04-28 17:14:00
更多关于科技的资讯:
满算力每天可产出上百万分钟视频,成本只需人工的10%宁企AI“拍”短剧,拓展“数字丝路”新蓝海□南京日报/紫金山新闻特派记者黄琳燕9月18日
2025-09-19 07:44:00
光博会上,宁企全球首发先进高光谱成像相机粉笔灰冒充面粉?“天眼”一拍现原形南报网讯(记者张安琪)“两堆白色粉末摆在眼前
2025-09-19 07:45:00
厦门网讯(厦门日报记者 刘艳)昨日,2025金砖国家新工业革命伙伴关系论坛6场平行分论坛发布6项成果。此次金砖国家新工业革命伙伴关系论坛共发布了12项成果
2025-09-18 08:20:00
一口预制菜,搅动全民心。近日,罗永浩与西贝的“预制菜之争”告一段落,但引发的消费者知情权问题,仍备受关注。罗永浩与西贝争论的焦点
2025-09-18 09:31:00
近日,国家知识产权局知识产权运用促进司在全国专利转化运用专项行动工作简报中,对山东科创旗下山东知识产权运营中心的创新实践工作给予充分肯定
2025-09-18 09:33:00
浪浪山小妖怪14亿票房背后,500元的毛绒玩具卖爆了
作者|兰杰编辑|乔芊又一个毛绒品牌正在崭露头角。近期,《浪浪山的小妖怪》收割了无数打工人的心,同时也让一个水下的品牌浮出水面
2025-09-18 17:53:00
把直播开成文化沙龙,中产迷上这“最安静”直播
没有秒杀倒计时,没有循环播放的背景音乐,更没有声嘶力竭的“3、2、1,上链接!”9月5日晚,ICICLE之禾的抖音直播间
2025-09-18 21:11:00
海外正畸专家到访正雅,深度研讨颌位重建技术
近日,来自意大利、泰国和沙特阿拉伯的正畸医生代表团访问了正雅并参观了位于嘉兴的智能工厂,开展了一场关于数字化正畸技术与智能制造融合的深度交流活动
2025-09-18 13:53:00
不靠运气,小众农货如何变成国民爆款?
“挖到宝了,买到了纯甜的黄金百香果!”“不允许还有人没吃过寿光的彩椒!”“是我肤浅了,青皮的冰糖橙居然不酸的?”近些年
2025-09-18 14:13:00
SKEMA商学院《金融时报》管理学硕士排名跃升至全球第18名
2025年MiM排名创历史新高,商科教育领跑全球2025年9月,权威商科教育排名再传佳讯。英国《金融时报》最新发布的2025年管理学硕士(Master in Management
2025-09-18 14:13:00
一场Open Mic,聊出行业新未来
近日,中国建博会(广州)媒体交流会——Open Mic!敞开聊!于上海圆满举办,现场邀请了澎湃新闻、财经网、1m建筑装饰沙龙学会
2025-09-18 14:14:00
妙可蓝多全球首创奶酪RDA数据资产在沪启动
随着信息技术深入发展和深度应用,数据已经成为生产经营活动必不可少的新生产要素。当前,我国将数据正式列为与土地、资本、劳动力
2025-09-18 14:22:00
2025腾讯全球数字生态大会:聚焦“AI+传媒”新趋势,腾讯云打造新一代智能化服务底座
9月16日,2025腾讯全球数字生态大会在深圳国际会展中心举办。智慧传媒专场以“AI+传媒:从效率革命到价值重构”为主题
2025-09-18 14:44:00
里工与腾讯云达成战略合作,共拓具身智能工业落地新路径
9月16日,在2025腾讯全球数字生态大会期间,广州里工实业有限公司(以下简称“里工”)与腾讯云正式签署战略合作协议。作为泛工业领域离散型场景具身智能领导者
2025-09-18 14:44:00
零次方与腾讯云达成战略合作,加速具身智能技术突破与规模化应用
9月16日,零次方机器人与腾讯云正式签署战略合作协议。双方将围绕清洁、教育、文娱等商业服务场景的规模化应用与创新,建立战略合作伙伴关系
2025-09-18 14:44:00