• 我的订阅
  • 科技

huggingface公布“smollm”小语言模型家族

类别:科技 发布时间:2024-07-21 01:19:00 来源:浅语科技

7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。

huggingface公布“smollm”小语言模型家族

据介绍,这些模型号称是以精心策划的高质量训练数据集训练而成,号称在Python程序编写性能上相当强大,团队指出他们重点优化了模型所需的RAM用量,“即使是在6GBRAM的iPhone15上也能运行”。

在训练方面,HuggingFace团队首先建立了一款名为SmolLM-Corpus的数据集(数据集地址点此访问),该数据集主要包含Python教学内容Python-Edu、Web教育内容FineWeb-Edu以及使用Mixtral-8x7B-Instruct-v0.1和Cosmopediav2两款模型生成的常识内容,token量总计6000亿。此后HuggingFace团队便使用SmolLM-Corpus数据集训练了“SmolLM”小语言模型。

HuggingFace团队将开发出的SmolLM模型与相同参数量的其他模型进行了基准测试,其中SmolLM-135M在多项测试中超越了小于2亿参数的其他模型;而SmolLM-360M的测试成绩优于所有小于5亿参数以下的模型,不过某些项目逊于Meta刚刚公布的MobileLLM-350M;SmolLM-1.7B模型则超越了所有参数量小于20亿参数的模型,包括微软Phi-1.5、MobileLLM-1.5B及Qwen2。

huggingface公布“smollm”小语言模型家族

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-21 08:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

stabilityai推出小语言ai模型
...年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法语等7种语言,拥有“体积小、性能高效”特
2024-01-22 11:31:00
AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM)
2024-10-01 17:04:00
amd公布自家首款“小语言模型”
9月29日消息,AMD在Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能
2024-09-30 04:12:00
小语人工智能外呼系统,让沟通更高效、智能
...掉,我们的生活将会变得更加轻松。为了解决这个问题,小语人工智能外呼系统应运而生。小语人工智能外呼系统利用前沿的人工智能技术,能够智能识别和处理来自电话的信息。它可以根据用户的
2024-08-11 11:47:00
唤醒·新样态 鼎泰实小语文课堂 教研有创意
本文转自:南京晨报晨报讯(通讯员 余璇 史华婷 南京晨报/爱南京记者 刘彩云)2月15日下午,江北新区鼎泰实验小学举行了“唤醒·新样态”课堂的模型结构化建构与推进研究活动。江北新
2023-02-20 04:46:00
一加Ace 5竞速版详细参数公布:全球首发天玑9400e
...功耗表现。另外,天玑9400e支持全球主流的大语言模型、小语言模型,支持端侧运行DeepSeek-R1-Distill(Qwen1
2025-05-22 16:21:00
zyphra推出zamba2-mini1.2b模型
...宣布推出Zamba2-mini1.2B模型,共有12亿参数,声称是端侧SOTA小语言模型,在4bit量化下内存占用低于700MB
2024-08-30 05:47:00
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...,各个大厂都有推出小模型系列产品——比如微软的SLM(小语言模型)Phi-3系列、苹果的“小模型”家族、谷歌的Gemma等等
2024-06-07 09:25:00
...等软硬件产品,为用户提供了更为便捷的翻译工具。突破小语译制,助力文化传播。研发了南亚东南亚语言影视剧译制系统——小语译制,系统融合机器翻译、OCR识别等技术,实现了影视剧中的
2023-08-20 07:05:00
更多关于科技的资讯:
引领健康储鲜,澳柯玛风冷变频冷柜斩获“云鼎奖”
鲁网9月5日讯近日,奥维云网2025数字生态大会在杭州闭幕。作为家电行业极具影响力的年度盛会,现场汇聚了众多家电领军品牌
2025-09-05 13:38:00
周黑鸭携四大产品线矩阵破局全场景消费,构建卤味行业新范式
齐鲁晚报·齐鲁壹点 记者 张召旭在近期举办的行业展会上,周黑鸭凭借前瞻性战略布局引发行业广泛关注——品牌首次系统推出针对多元消费需求与渠道特性开发的四大产品线
2025-09-05 11:00:00
当“保温杯里泡枸杞”从段子变成日常,当“中药房下午茶”取代美式咖啡成为年轻人新宠,老字号品牌们逐渐发现:年轻人不是在买一杯饮料
2025-09-05 11:02:00
本报记者 魏 静 □ 忽 艳在国内鼓励创新、倡导在世界舞台展示中国实力产品与个人实力的大环境下,越来越多中国品牌凭借创新精神与卓越品质
2025-09-05 11:02:00
近日,阳光人寿秦皇岛中支在益寿园开展“银发课堂”特色活动,为老年群体送上内容丰富的金融知识。活动现场,工作人员通过生动的案例
2025-09-05 09:36:00
36氪首发|掘金“微醺”社交经济,精酿品牌「TAGSIU」获近千万 Pre-A 轮融资
作者 | 李小霞36 氪获悉,精酿品牌「TAGSIU 醍宿酿造」(下称“TAGSIU”)已完成近千万 Pre-A轮融资
2025-09-04 22:09:00
从形态突破到生态跃迁:华为三折叠的「鸿蒙时刻」
三折叠这个赛道,或许只有华为能够超越华为。华为Mate XT 非凡大师发布一年之后,三折叠这片“无人区”,仍然只有华为的身影
2025-09-05 00:13:00
大众网记者 张田夏荫 实习记者 张智尧 报道海信集团总裁、海信视像科技股份有限公司董事长于芝涛正式以大赛形象大使与推介大使的身份
2025-09-04 10:04:00
第26届GOPS全球运维大会落幕,AI Infra赋能运维转型
2025年6月28日,为期两天的第26届GOPS全球运维大会暨研运数智化技术峰会在北京市圆满落幕。作为国内首个运维行业盛会
2025-09-04 11:33:00
三联家电“伙拼9.12”权益全解析!三重补贴省心省钱嗨购金秋
鲁网9月4日讯金秋家装季撞上三联家电第十一季“伙拼9.12”大型内购福利会!这场被万千家庭期待的消费盛宴即将引爆全城!多重补贴
2025-09-04 11:33:00
灵动集团旗下欢米粒心理:新学期,为青少年心理护航——以专业体系构建成长防护网
在青少年心理健康服务需求进入 “刚性增长期” 的当下,资质与专业双轮驱动成为行业发展的核心支撑。灵动生活集团作为《互联网心理服务・心理测评服务通用规范》国家标准制定委员单位
2025-09-04 11:55:00
金秀之光,宏瑶传承千年瑶浴的现代创新之路
金秀大瑶山的采药人每日清晨踏遍青山,采集当地草药。这些草药通过广西宏瑶生物科技股份有限公司(以下简称“宏瑶股份”)的现代研发与技术加工
2025-09-04 11:55:00
井壁稳定“智能分析师”:Biot - Coussy PORORI团队研发井壁失稳风险分析系统
在深层能源勘探开发不断推进的背景下,钻井工程常面临地质条件复杂、井下环境多变等严峻挑战。其中,井壁失稳是导致钻井周期延长
2025-09-04 12:08:00
锦纶新材料首秀!南山智尚亮相2025中国国际纺织面料及辅料(秋冬)博览会
9月2日至4日,2025中国国际纺织面料及辅料(秋冬)博览会在上海国家会展中心举行。南山智尚(股票代码:300918)及旗下锦纶新材料公司共同亮相
2025-09-04 12:11:00
36氪2025 AI Partner百业大会 | 思必驰定义对话式AI新价值
AI浪潮席卷千行百业,“中国式方案”正在无声地改写着全球科技产业版图,实现“AI+”与千行百业的深度赋能。日前,36氪与中欧国际工商学院联合主办2025 AI Partner百业大会
2025-09-04 13:56:00