• 我的订阅
  • 科技

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

类别:科技 发布时间:2024-02-03 16:03:00 来源:36氪

文 | 周鑫雨

编辑 | 邓咏仪

当大模型加速应用落地,运行成本就成为各厂商的现实考量。

将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参数规模,达到比肩大模型的性能,是需要解决的难题。

“以小博大”的励志故事,2023年9月发生在法国AI独角兽Mistral上。其发布的开源模型用7B的参数规模,在MMLU(多任务语言理解)、Knowledge(知识)、Reasoning(推理)、Comprehension(理解)等关键指标上均超越了Meta Llama 2的13B模型。

这一个故事,在2024年2月1日的发布会上,也被AI模型层公司面壁智能的CEO李大海不断提起。

对标Mistral,面壁智能发布了训练数据规模近1T、参数规模仅2B的模型:聚焦于适配端侧硬件的端侧大模型MiniCPM-2B。

为什么瞄准端侧场景?李大海给出的理由,仍然是旺盛的市场需求,和云端协同的部署趋势。自2023年下半年起,三星、华为、小米、特斯拉、理想等国内外手机和智驾厂商都发布了适配于终端硬件的大模型。

在终端硬件厂商加速产品AI化的趋势下,面壁智能认为,成本是大模型的隐形竞争力,“比起size,我们更在意成本”。

以搭载了骁龙855芯片的OPPO手机为例,MiniCPM每秒能处理7.5 Tokens,运行5年后报废,成本为600元,由此可得170万Tokens的推理成本仅1元——MiniCPM的推理成本仅Mistral的1/100,GPT-4的1/360。

据介绍,目前MiniCPM-2B在CPU(比GPU计算吞吐量低)上就能跑起来,相较于用GPU才能运行的大模型,能够降低推理成本。与此同时,即便将大小压缩75%,MiniCPM的性能也能做到基本无损耗。

在性能上,MiniCPM-2B的中文知识能力、代码能力、数学能力已经超过Mistral-7B,而英文知识能力、逻辑能力和常识问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上,MiniCPM-2B的表现超过了Llama 2-70B-Chat。

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

MiniCPM-2B和Mistral-7B在主流评测集上的测评结果。图源:面壁智能

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

MiniCPM-2B和主流模型在MT-Bench上的测评结果。图源:面壁智能

就实际效果而言,MiniCPM-2B能够理解“中夹英”的多语言问题,并用法语作答;同时也能实现代码生成。

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

MiniCPM-2B的多语言交互。图源:面壁智能

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

MiniCPM-2B书写自身代码。图源:面壁智能

为了能够让MiniCPM以小博大,面壁智能主要在Infra、算法和数据三个层面,做了技术优化。

在Infra层面,基于集成了训练、推理、压缩、微调的全流程高效Infra,面壁智能能够将推理加速到10倍,将算力成本降低90%。

在算法层面,通过上千次的模型沙盒实验,面壁智能对模型批次大小、超参数配置等最优训练配置进行了探索。

在数据层面,用于MiniCPM的1T精选训练数据,来源于经过数据治理、多维评测的数据工厂。

为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。

通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模态问答。比如,MiniCPM-V可以识别毒蘑菇和毒蛇,并给出防护建议。模型响应速度接近7 Tokens/秒,几乎无延迟。

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

MiniCPM-V有关毒蘑菇的问答。图源:面壁智能

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

MiniCPM-V有关毒蛇的问答。图源:面壁智能

相较于MiniCPM-V,OmniLMM不仅支持多模态对话,还支持多模态的实时交互,比如用户可以实时与模型进行石头剪刀布的游戏,也可以让模型实时识别路况。李大海介绍,未来OmniLMM的能力,也将逐步集成到MiniCPM-V上。

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

OmniLMM有关景点的问答。图源:面壁智能

目前,MiniCPM已经与国际主流手机机型和CPU进行了配置测试。当然,将模型接入终端设备,依然有不少问题亟待解决。

比如接入后,模型是否还能在端侧进行自主学习和迭代?面壁认为,通过高效参数微调技术,目前MiniCPM能在手机夜间充电时段,基于用户人机交互产生的数据知识和信息进行自主微调,但效果仍有待提高。

无论是端侧模型的自我迭代能力,还是软硬件适配的标准建立,大模型想要进入端侧,仍需要全产业链的推动。

面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线

欢迎交流!

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-03 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...高推理成本、高资源占用这“三高”,以及算力层的硬件适配,一直是困扰模型落地的最后一公里。尤其在AI+消费级硬件成为行业趋势的当下,如何让大模型在有限算力的终端设备上跑起来,也
2024-06-03 15:23:00
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...还能为其模型优化提供精确指导。不仅如此,通过大量的适配工作,百川智能还实现了多平台适配的私有化部署方案,和英伟达、华为、寒武纪、高通、MTK、天数等主流芯片都能适配。多、快、
2024-11-04 09:50:00
优刻得首个「国产千卡智算集群」落地,支持智源千亿大模型训练
...、数据传输和算力调度等方面具有极高的效率。经过精心适配和调优,优刻得国产智算集群现已在上海青浦智算中心全面部署,智源研究院正基于国产算力更高效地完成大模型的训推工作。突破算力
2024-06-27 19:01:00
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...制条件,提高视频内容生成的一致性和可控性; 5.算力适配通用化,在模型推理运行方面,针对重点行业客户应用,与多家国内外算力厂商的产品适配,形成了算力模型一体化产品; 6.
2024-04-11 10:30:00
京东云:智能体大规模“上岗”,企业深度应用正当时
...据安全合规基础上,针对券商、银行等机构需求进行优化适配。深度应用全面开启,智能体重塑AI生产力虽然“超级应用”还有距离,但聚焦企业端的“深度应用”已奔涌而至,正在加速渗透到需
2025-05-20 14:47:00
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...出新的产品。在闭源的商业模型中,厂商把模型和硬件都适配好了,调到了最优状态,客户直接复制成熟经验就可以。但如果你用开源,还要自己去适配调,投入的算力成本、工程师的成本更高。所
2024-08-28 09:44:00
蚂蚁百宝箱接入Qwen3 可0成本调用Qwen3全系列模型
...发者可以直观对比不同模型的生成效果、推理速度及任务适配性。同时,百宝箱还提供 50 多款插件和近百款工具,方便开发者们选择量身定做的智能体方案。目前,行业已采用百宝箱推出了多
2025-05-05 23:39:00
蚂蚁数科SOFAStack发布全栈AI服务,助力企业用好大模型
...aaS平台SOFAStack正式发布大模型服务平台AI Max。该平台兼容适配主流开源大模型、国产算力,向企业提供进行模型训练
2024-06-28 18:10:00
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中
2024-07-01 09:21:00
更多关于科技的资讯:
智慧助老,温暖相伴!龙岩联通开展线下“联通客户日”活动
东南网龙岩1月29日讯(通讯员 曹可煊)1月,龙岩联通新罗分公司、漳平分公司在营业厅如期举行“联通客户日”专属活动。作为每月常态化的客户互动专场
2026-01-29 21:07:00
一颗播州辣椒的全球之旅
多彩贵州网讯 在黔北播州的绵延青山之间,一颗颗红彤彤的辣椒经过烘烤后,被集中送往位于石板镇国际辣椒产业园的遵义中椒生物科技有限公司
2026-01-29 17:49:00
科力装备携手华为云深化智能制造,打造汽车零部件行业数智化升级标杆
日前,工业和信息化部、教育部、市场监管总局、国家数据局四部门联合印发《汽车行业数字化转型实施方案》(以下简称《实施方案》)
2026-01-29 18:25:00
随着AI(人工智能)技术飞速发展,一种被称为OPC(One Person Company,一人公司)的新型创业形态正在兴起
2026-01-29 18:59:00
“咪咕阅读”正式升级为“咪咕悦看”,以文剧融合新生态践行数字文化发展使命
从追求流量到追求质量,微短剧行业正迈向精品化与主流化的升级之路,拥有大量好内容的网络文学是微短剧发展的重要推动力。咪咕阅读率先以“文剧融合”为抓手
2026-01-29 14:24:00
星聚会KTV中国香港双店同开
2026年1月27日,星聚会KTV(以下简称星聚会)正式官宣,中国香港铜锣湾V Point店与兰桂坊加州大厦店双店同步盛大启幕
2026-01-29 14:34:00
星巴克中国发布一季度财报 营收连续五个季度增长
1月28日晚,星巴克发布2026财年第一季度业绩报告,营收实现双位数增长,同店销售额连续三个季度正增长。营收连续五个季度增长
2026-01-29 15:24:00
五大优化精准惠民,2026年郯城县以旧换新再发力
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:44:00
惠民2800余万元!郯城县以旧换新释放消费新动能
鲁网1月29日讯 (记者 吴艳萍)1月29日,郯城县人民政府召开“惠企利民 消费品以旧换新”新闻发布会。郯城县商务局相关负责人介绍2025年郯城县消费品以旧换新工作开展情况
2026-01-29 16:46:00
注意力差、上课走神、做事拖拉磨蹭?这可能是学习能力需要“专业锻炼”的信号
鲁网1月29日讯学习困难是儿童成长过程中常见的问题,严重影响孩子的学业成绩和心理健康。因此,建立科学的筛查和干预机制,对于早期发现和解决学习困难问题至关重要
2026-01-29 15:35:00
科学探秘 巧手求真 观湖社区伯努利实验点亮青少年科学梦
“原来流动的空气真的有力量!”“乒乓球居然能悬浮在空中不掉下来!”近日,苏州工业园区唯亭街道观湖社区阿里博士实验室内欢呼声此起彼伏
2026-01-29 11:28:00
大皖新闻讯 1月28日晚间,星巴克发布2026财年第一季度业绩报告,中国市场延续强劲增长势头,营收实现双位数增长,同店销售额连续三个季度正增长
2026-01-29 12:51:00
京东携机器人亮相乡村舞台 光明村首届“村晚”科技感拉满
当智能机器人遇上“村晚”,科技与年味会碰撞出怎样的精彩?1月28日,江苏宿迁来龙镇光明村热闹非凡,由京东打造的首届“村晚”正式上演
2026-01-29 13:13:00
“溪山模式+溪有物种实践”赋能科创:从商业航天到核聚变
2026年1月22日,NSE2026第四届新物种进化大会暨2026溪山天使年会在北京大北农凤凰国际创新园隆重举行。这场由溪山天使汇
2026-01-29 13:14:00
爱喏与宅智造达成战略合作:融合产品体系与服务网络,打造高效家装新平台
近日,融合产品设计与实用美学的健康水生态品牌“爱喏”与国内领先的一站式建材服务商“宅智造”建材超市正式签署战略合作协议
2026-01-29 13:16:00