• 我的订阅
  • 科技

huggingface公布“smollm”小语言模型家族

类别:科技 发布时间:2024-07-21 01:19:00 来源:浅语科技

7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。

huggingface公布“smollm”小语言模型家族

据介绍,这些模型号称是以精心策划的高质量训练数据集训练而成,号称在Python程序编写性能上相当强大,团队指出他们重点优化了模型所需的RAM用量,“即使是在6GBRAM的iPhone15上也能运行”。

在训练方面,HuggingFace团队首先建立了一款名为SmolLM-Corpus的数据集(数据集地址点此访问),该数据集主要包含Python教学内容Python-Edu、Web教育内容FineWeb-Edu以及使用Mixtral-8x7B-Instruct-v0.1和Cosmopediav2两款模型生成的常识内容,token量总计6000亿。此后HuggingFace团队便使用SmolLM-Corpus数据集训练了“SmolLM”小语言模型。

HuggingFace团队将开发出的SmolLM模型与相同参数量的其他模型进行了基准测试,其中SmolLM-135M在多项测试中超越了小于2亿参数的其他模型;而SmolLM-360M的测试成绩优于所有小于5亿参数以下的模型,不过某些项目逊于Meta刚刚公布的MobileLLM-350M;SmolLM-1.7B模型则超越了所有参数量小于20亿参数的模型,包括微软Phi-1.5、MobileLLM-1.5B及Qwen2。

huggingface公布“smollm”小语言模型家族

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-21 08:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

stabilityai推出小语言ai模型
...年推出的第二款模型,号称是“自家迄今以来最为强大的小语言AI模型”。从新闻稿中得知,这款AI模型支持英语、西班牙语、德语、意大利语、法语等7种语言,拥有“体积小、性能高效”特
2024-01-22 11:31:00
AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为“AMD-135M”。相比于越来越庞大的大语言模型(LLM)
2024-10-01 17:04:00
amd公布自家首款“小语言模型”
9月29日消息,AMD在Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能
2024-09-30 04:12:00
小语人工智能外呼系统,让沟通更高效、智能
...掉,我们的生活将会变得更加轻松。为了解决这个问题,小语人工智能外呼系统应运而生。小语人工智能外呼系统利用前沿的人工智能技术,能够智能识别和处理来自电话的信息。它可以根据用户的
2024-08-11 11:47:00
唤醒·新样态 鼎泰实小语文课堂 教研有创意
本文转自:南京晨报晨报讯(通讯员 余璇 史华婷 南京晨报/爱南京记者 刘彩云)2月15日下午,江北新区鼎泰实验小学举行了“唤醒·新样态”课堂的模型结构化建构与推进研究活动。江北新
2023-02-20 04:46:00
一加Ace 5竞速版详细参数公布:全球首发天玑9400e
...功耗表现。另外,天玑9400e支持全球主流的大语言模型、小语言模型,支持端侧运行DeepSeek-R1-Distill(Qwen1
2025-05-22 16:21:00
zyphra推出zamba2-mini1.2b模型
...宣布推出Zamba2-mini1.2B模型,共有12亿参数,声称是端侧SOTA小语言模型,在4bit量化下内存占用低于700MB
2024-08-30 05:47:00
一毛钱写两本红楼梦,智谱AI再降价,已服务30万企业用户
...,各个大厂都有推出小模型系列产品——比如微软的SLM(小语言模型)Phi-3系列、苹果的“小模型”家族、谷歌的Gemma等等
2024-06-07 09:25:00
...等软硬件产品,为用户提供了更为便捷的翻译工具。突破小语译制,助力文化传播。研发了南亚东南亚语言影视剧译制系统——小语译制,系统融合机器翻译、OCR识别等技术,实现了影视剧中的
2023-08-20 07:05:00
更多关于科技的资讯:
杭州小锣号网络科技:在GEO营销领域的深度探索与产业革新
在人工智能‌深度渗透生活‌的今天,数字营销正经历着从“广泛覆盖”到“精准触达”的深刻变革。杭州小锣号网络科技有限公司,作为一家坚持自主创新理念的综合数字营销服务商
2026-02-03 20:57:00
智能非智慧乐符在心↑↑点击上方视频↑↑看肖白谈AI与音乐创作2026年,人工智能技术持续渗透各行各业,音乐领域亦迎来新的思考与挑战
2026-02-03 21:09:00
今天(3日),工业和信息化部等八部门联合发布了《汽车数据出境安全指引(2026版)》(以下简称《安全指引》),这一《安全指引》的发布
2026-02-03 21:41:00
仁怀:以码立质 以价惠民 产区金字招牌持续擦亮
多彩贵州网讯作为中国酱香白酒核心产区,近年来,贵州仁怀通过认证赋码、发布亲民酒等创新举措,由政府与行业协会双重背书,帮助优质产品在市场中脱颖而出
2026-02-03 22:31:00
新春走基层|“AI”上春运,让回家的路更“懂”你
春运,这场承载亿万家庭团圆期盼的“流动史诗”,在2026年的寒冬里因AI技术的深度浸润而暖意倍增。当智能客服毫秒级响应旅途困惑
2026-02-03 16:53:00
鲁网2月3日讯2月3日,济南市槐荫区第十九届人民代表大会第五次会议开幕,槐荫区区长刘敬涛代表区政府作政府工作报告。报告提到
2026-02-03 17:28:00
八部门联合发文 推进汽车数据高效便利安全跨境流动
中国网2月3日讯 据“工信微报”微信公众号消息,为贯彻落实党中央、国务院决策部署,推动建立高效便利安全的汽车数据跨境流动机制
2026-02-03 18:27:00
近日,在上海临港新片区一栋现代化研发楼里,没有黑板与讲台,却有真实的测试机台、高速示波器和正在运行仿真的EDA软件界面
2026-02-03 18:18:00
1月29日下午,“数智赋能 全链护航”吴江区企业全周期服务赋能大会在苏州东太湖大厦举行。吴江区40余家企业和商协会代表参会
2026-02-03 14:42:00
鲁网2月3日讯1月30日晚间,苏宁易购发布2025年度业绩预告。公告显示,公司预计全年实现归属于上市公司股东的净利润5000万元至7500万元
2026-02-03 15:10:00
初瑞雪年货节首秀告捷,辛选合伙人制激发主播新活力
鲁网2月3日讯春节临近,市场的消费热情也逐渐高涨。2月1日,辛选集团董事长、快手头部主播初瑞雪首度开启辛选超级年货节,为用户打造了一场绚丽多彩的春节“线上集市”
2026-02-03 15:42:00
中国消费者报武汉讯(记者吴采平)2月2日,记者从湖北省消费者委员会了解到,2025年,湖北各级消协组织共受理消费者投诉73567件
2026-02-03 15:00:00
中国消费者报报道(记者李燕京)如今,随着健康类可穿戴设备市场规模持续扩大,消费需求也告别了尝鲜猎奇的初级阶段,全面转向健康实用的核心诉求
2026-02-03 15:00:00
鲁网2月3日讯面对自助设备服务投诉这一长期困扰客户体验与银行声誉的痛点,建行临沂分行深入贯彻落实总行关于运营服务提质增效的要求
2026-02-03 11:06:00
新春走基层|从南到北,这群技术牛人为何选择捷翼科技?
在外企拥有稳定职位、优渥待遇的技术专家周同昌,在2025年底,做了一个令许多人意外的决定:放弃原有的“舒适区”,加入长春捷翼汽车科技股份有限公司
2026-02-03 11:31:00