• 我的订阅
  • 科技

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

类别:科技 发布时间:2024-10-01 17:04:00 来源:浅语科技

快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD-135小模型隶属于Llama家族,有两个版本:

一是基础型“AMD-Llama-135M”,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。

二是延伸型“AMD-Llama-135M-code”,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

创建与部署流程

它使用了一种名为“推测解码”(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。

比如在MI250加速器上,性能可提升最多约2.8倍,锐龙AI CPU上可提升最多约3.88倍,锐龙AI NPU上可提升最多约2.98倍。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

推测解码

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

【本文结束】如需转载请务必注明出处:快科技

责任编辑:上方文Q

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-10-02 05:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族
2024-07-21 01:19:00
stabilityai推出小语言ai模型
...年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法语等7种语言,拥有“体积小、性能高效”特
2024-01-22 11:31:00
amd公布自家首款“小语言模型”
9月29日消息,AMD在Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能
2024-09-30 04:12:00
zyphra推出zamba2-mini1.2b模型
...宣布推出Zamba2-mini1.2B模型,共有12亿参数,声称是端侧SOTA小语言模型,在4bit量化下内存占用低于700MB
2024-08-30 05:47:00
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...,各个大厂都有推出小模型系列产品——比如微软的SLM(小语言模型)Phi-3系列、苹果的“小模型”家族、谷歌的Gemma等等
2024-06-07 09:25:00
AMD举办AI PC创新峰会:150多家厂商支持
...场空间,例如AMD可以跟小型开发者一起,让RyzenAI在开源小语言模型中更加得心应手,而针对中型语言模型,AMD的Radeon同样可以一展身手
2024-03-25 01:45:00
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...量,成为首个不使用位置嵌入的DiT。 - 基于仅解码器「小语言模型」的文本编码器这里,研究人员使用了Gemma(仅解码器LLM)作为文本编码器,以增强对提示词的理解和推理能
2024-10-18 09:49:00
谷歌发布 MediaPipe Diffusion 插件
...歌发布低成本可控文生图插件模型MediaPipeDiffusion,移动端提速20+倍,在v100上运行提速高达100倍
2023-07-13 05:54:00
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
本文转自:新华网11月14日,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医疗健康、教育学习、职场办公等众多场景。夸克App将借助自研大模型全面
2023-11-14 16:05:00
更多关于科技的资讯:
打破“禁戒定理” 中国科大提出不需要共同参考系的分布式量子传感协议
大皖新闻讯 “这种反向编码协议,打破了由于共同参考系缺失造成的‘禁戒定理’。”相关人员表示。2月1日,大皖新闻记者从中国科学技术大学获悉
2026-02-01 19:36:00
商报讯 近日,钱江世纪城2025“世纪云想”第五届新锐成长企业年度路演成功举办。活动以“赋能成长、洞见未来”为核心,吸引来自电商
2026-02-01 08:32:00
河北日报讯(见习记者康晓博、李畅)1月31日,2026年雄安新区“人工智能+”创新生态系列活动举办。活动现场,清华大学与稳准智能(雄安)科技有限公司(以下简称“稳准智能”)联合研发的“极数”数据大模型(LimiX)发布最新成果与战略规划
2026-02-01 07:45:00
“公交医生”用心守护 保障乘客畅行新春
随着新春的脚步日益临近,城市公交迎来了全年运营的高峰期。在保障车辆安全高效运转的链条上,车间维修团队是不可或缺的“技术核心”
2026-01-31 18:06:00
从赛事领奖台到春晚舞台,松延动力勾勒人形机器人产业新图景
1月29日,中央广播电视总台与松延动力联合宣布,松延动力成为总台《2026年春节联欢晚会》人形机器人合作伙伴。松延动力表示
2026-01-31 17:05:00
百度智能云:800多家金融机构的首选“AI搭子”
大模型在金融行业的落地节奏正在加快。1月31日消息,根据近期媒体对2025年公开市场大模型相关招投标信息的统计,金融行业全年大模型中标项目达587个
2026-01-31 17:05:00
高顿咨询财务进化论年度峰会暨AI白皮书重磅发布
高顿咨询财务进化论年度峰会暨AI白皮书发布会于2026年1月23日在上海隆重启幕。来自AI财务领域的学界专家、企业高管汇聚一堂
2026-01-31 17:06:00
导演王晶短剧公司落地河南 称今年要拍100部精品
大河网讯 近日,香港导演王晶现身郑州,为其担任总监制、总编剧的微短剧《澳城风云》主持开机仪式,标志其正式进军河南微短剧产业
2026-01-31 16:34:00
大润发东营首店亮相东城万达广场
鲁网1月31日讯2026年1月30日,大润发东营首店正式落户东营东城万达广场。该店践行“线上线下融合”的新零售战略,线上平台“大润发优鲜”已率先运营
2026-01-31 13:04:00
元梦空间2026马上元梦嘉年华大会即将在蓉举办,开启元宇宙“虚实共生”新纪元
2026年2月3日,一场以“马上元梦·数字新生”为主题的元宇宙行业盛典——元梦空间2026马上元梦嘉年华大会,将在四川成都隆重举行
2026-01-31 08:57:00
零基础学烘焙,2026年1月郑州靠谱的蛋糕培训机构有哪些?
想在郑州学做蛋糕,却不知道选哪家?是零基础想扎实学技能,还是打算创业需要全流程支持?随着烘焙赛道越来越火,郑州的蛋糕培训机构也层出不穷
2026-01-31 08:59:00
定制钻戒哪个好?2026年高性价比国产培育钻品牌深度推荐指南
在当代珠宝消费语境中,“定制钻戒”早已不再只是婚礼场景的专属符号,而逐渐演变为一种承载情感、表达个性与彰显审美的生活方式
2026-01-31 08:59:00
定制钻戒哪个好?2026培育钻戒选购终极攻略:这些高性价比品牌别错过!
在“悦己消费”与“情感表达”日益成为主流的今天,钻戒早已超越传统婚庆符号的单一身份,演变为一种融合科技、美学与个人叙事的现代生活方式
2026-01-31 09:01:00
简单解压易分享 我市涌现一批线下拼豆店
记者体验拼豆。拼豆店里,小朋友认真地将一粒粒塑料豆摆到豆板上。 厦门网讯 (文/图 厦门日报记者 柯笛)马年将至,小马造型和新年主题的拼豆图纸在网上走红
2026-01-31 09:16:00