• 我的订阅
  • 科技

小米大模型交成绩单

类别:科技 发布时间:2023-08-11 21:01:00 来源:金融界

距4月14日雷军官宣杀入大模型不到4个月,小米大模型终于首次曝光,并交出了一份初步成绩单!

多方消息显示,小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。

根据GitHub项目页给出的信息,MiLM-6B(下称:小米大模型)是由小米开发的一个大规模预训练语言模型,参数规模为64亿。

相关页面显示,小米大模型在C-Eval榜单中排名第9、同参数量级排名第1,在CMMLU中文向大模型排名第1。

值得一提的是,雷军将于下周一(8月14日)晚间的新品发布会上,发表年度演讲。

本次演讲以“成长”为主题,雷军发布的微博透露,“当初做的一个决定,改变了我的一生。”而且,这个决定让他庆幸至今。

外界猜测,雷军年度演讲的内容,除了与小米造车相关,或许还将与小米筹备已久的大模型有关。

小米大模型交成绩单

来源:微博截图

小米大模型取得双“第一”,下周一或亮相

C-Eval榜单,全称C-Eval全球大模型综合性考试测试榜,是由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。

该套件覆盖人文、社科、理工、其他专业四个大方向,包括52个学科,涵盖微积分、线性代数等多个知识领域。共有13948道中文知识和推理型题目,难度分为中学、本科、研究生、职业等四个考试级别,能够更加全面的对模型的语言处理能力进行评估,对中文社区语言大模型的研发有着很好的参考价值。

具体而言,在C-Eval评估中,小米大模型的平均分为60.2,在STEM、社会科学、人文科学、其他这四个类别中,均取得了不错的表现。

小米大模型交成绩单

来源:C-Eval截图

其中,在STEM(科学、技术、工程和数学教育)全部20个科目中,小米大模型得分54.5,在计量师、物理、化学、生物等多个项目中获得了较高的准确率;在10个社会科学科目中,小米大模型得分71.7,在教育学和地理外的所有科目中,获得了较为理想的准确率;在11个人文科学科目中,小米大模型得分62.7,在历史与法律基础上,获得了不错的准确率;在其他分类下,小米大模型则得分57.7。

整体而言,小米大模型在法学、数学、编程、概率论、离散数学等科目上的表现,仍然有明显进步空间。

CMMLU,则是由MBZUAI、上海交通大学、微软亚洲研究院合作完成的,一个全面的中文大模型基准。它涵盖了67个主题,涉及自然科学、社会科学、工程、人文、以及常识等,可以全面地评估大模型在中文知识储备和语言理解上的能力。

在CMMLU中文向大模型评估中,小米大模型在zero-shot和five-shot测试中的平均分分别为60.37和57.17,表现出良好的知识和推理能力。

在zero-shot测试中,小米大模型在人文学科得分63.49,社会科学得分66.2,其他得分62.14,中国特定主题得分62.07,平均分为60.37。

小米大模型交成绩单

来源:CMMLU截图

在five-shot测试中,小米大模型在人文学科得分61.12,社会科学得分61.68,其他得分58.84,中国特定主题得分59.39,平均分为57.17。

小米大模型交成绩单

来源:CMMLU截图

小米大模型首次曝光于上述两个评测榜单中,并取得“双第一”的不错成绩,也为其接下来的亮相,带来了充足底气。

至于亮相的时间,或许就在下周一,小米举办的新品发布会中,雷军的年度演讲环节。

此前,雷军曾表示,“今年的演讲比前几年更长些,演讲之后是我们的年度新品发布,还会披露我们技术探索的新进展。今年内容也非常多,估计3小时左右。”

雷军口中的“技术探索的新进展”,除了小米汽车,可能就要数小米大模型了。

任命栾剑做领头人,千人团队百亿研发护航

4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。

公开资料显示,栾剑现任小米技术委员会AI实验室语音生成团队负责人,曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

紧随其后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。

“全力以赴、坚决拥抱”,雷军为小米大模型发展定调!他还透露,对于大模型,小米“正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”

雷军在微博提及小米,在AI领域有AI实验室、小爱同学、自动驾驶等团队。

小米大模型交成绩单

来源:微博截图

此外,从服务能力协同来看,雷军手中亦有金山云这张底牌。金山云是金山软件的附属公司,在公司掌舵人雷军超前布局下,是与阿里巴巴最早在中国全力进军云计算的企业。

要知道,ChatGPT热潮带来的AI竞争,最直接的受益者正是云计算平台。一方面,生成式AI应用背后的大模型需要更强的算力;另一方面,区别于传统云计算平台提供的算力、存储等资源,拥有大模型的云厂商未来可以提供基于大模型开发应用。

早在今年2月的小米投资者日上,对于小米在ChatGPT上的布局,小米手机部总裁曾学忠就表示,ChatGPT基于AI大模型、千亿级参数量、数据量、还有人工标注支撑,AI大模型方面小米一直都有投入。手机和汽车业务有很多AI大模型落地的场景。

随后,在今年3月的2022年财报电话会议上,小米集团总裁卢伟冰谈到ChatGPT相关问题时表示,小米很早就在AI大模型方面进行了许多部署,同时采用了多技术路线并行的策略,小爱同学就是小米大模型落地的代表。

5月24日晚,小米披露的2023年第一季度业绩数据中提到,目前小米AI领域相关研发人员超1200人,未来小米将不断挖掘AI相关的用户场景,发挥技术优势,并以开放的态度与合作伙伴开拓更多机会。

卢伟冰再次强调,小米会积极拥抱大模型技术,但小米不会像OpenAI那样去做通用大模型,而是寻求大模型与自身业务的深度协同,例如与小爱同学、MIUI、机器人等业务相结合,同时也不断提升集团的内部工作效率。

小米副总裁、首席财务官林世伟也在业绩电话会上透露,“已经把业内大模型团队都过了一遍”,小米会采用惯用的“打法”,也就是战略投资等方式,来实现AI大模型方面的生态合作。

第一季度业绩数据还显示,小米一季度持续投入研发,研发支出同比增长17.7%达41亿元。小米表示,预计2023年总研发投入将超200亿元。

从目前综合信息来看,小米大模型“万事俱备,只欠东风”。下周一晚间,能否见证它的正式亮相,外界正翘首以待。

来源:猎云精选返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-12 00:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

预售价81.49万!小米汽车SU7 Ultra亮相,雷军...
...S 2新品发布会上,小米CEO雷军公布了小米汽车最新的销售成绩单。除了最新亮相的小米15,雷军还公布了小米SU7的高性能版本——SU7 Ultra
2024-10-30 09:03:00
手机业务难回暖、第二曲线要烧钱 小米压力山大
...务难回暖,全球市场份额难保小米交出了一份不算优秀的成绩单。财报显示,自2022年全年,小米营收连续四个季度同比下滑之后,2023年第一季度,小米营收的同比跌幅进一步扩大至18
2023-05-29 17:04:00
小米翻番、哪吒“失踪”,新势力10月榜单透露什么信号?
图片系AI生成造车新势力10月成绩单发布,虽然与9月相比,排名变化并不大,但部分企业在销量数字上出现了一些引人关注的变化。销量最高的依然是理想汽车,虽然环比略有下降,但销量仍然维
2024-11-04 14:27:00
小米Q1:高端收获、盈利上扬,开启长坡厚雪新周期
...期”,但头部“大玩家”小米交出了一份超出市场预期的成绩单。5月24日,小米发布2023年Q1财报。财报期间,小米营收为595亿元
2023-05-29 19:00:00
重估小米:惨遭印度“打劫” 市值缩水七成 汽车爆发在即
...内、全球数字广告、游戏市场处境都不算太好,小米这份成绩单已经算十分出色。和苹果、华为等互联网业务出类拔萃的同行一样,小米互联网服务的成功秘诀在于善用流量。经过近十年狂飙猛进之
2023-06-16 16:47:00
小米大语言模型MiLM-6B首次现身!同参数量级排名第一
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿
2023-08-11 17:00:00
小米卖一辆车亏6万上热搜 雷军:不用焦虑
...度,也是小米自小米汽车交付以来,首次交出独立的季度成绩单。具体来看,小米的季度报将业务划为“手机×AIoT”和“智能电动汽车等创新业务”两大部分
2024-08-22 21:14:00
小米ai大模型milm-6b首次曝光
小米公司此前并未“官宣”直接加入 AI 大模型赛道中,不过小米的 AI 大模型MiLM-6B目前已经悄然现身C-Eval
2023-08-12 06:35:00
雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏
...k-V2的研发,是这款模型的关键开发者之一。AI的风狂吹,小米创始人雷军闻声而动,在DeepSeek-V3发布前几天
2024-12-31 09:53:00
更多关于科技的资讯:
节日我在岗丨十堰高周波:抓创新赶订单 全力冲刺年度目标
十堰广电讯(全媒体记者 陈林)在国庆中秋假期,位于十堰经济开发区的十堰高周波科工贸有限公司抓创新赶订单,全力冲刺年度目标
2025-10-05 20:21:00
节日我在岗丨艾斯卓智能科技:节日不休 赶制订单
十堰广电讯(全媒体记者 耿吉国)放假不放松,生产不停工。国庆中秋长假,我市各生产企业铆足干劲抓生产、赶订单,奋力冲刺年度目标任务
2025-10-05 20:21:00
普阳钢铁工程机械用高强高韧宽厚板全国市场占有率名列前茅一块宽厚板的靶向发力——“铁疙瘩”怎样变成“金娃娃”(十)从矿山到港口
2025-10-05 07:47:00
人气旺 厦门多个商场假日客流爆棚、销售额亮眼
集美大悦城商圈内,小朋友和机器人亲密互动。(本组图/厦门日报记者 黄晓珍 摄)国庆中秋假期, 厦门SM购物中心潮玩店内人气火爆
2025-10-04 09:20:00
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00