我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

小米大模型交成绩单

类别：科技发布时间：2023-08-11 21:01:00 来源：金融界

距4月14日雷军官宣杀入大模型不到4个月，小米大模型终于首次曝光，并交出了一份初步成绩单！

多方消息显示，小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。

根据GitHub项目页给出的信息，MiLM-6B（下称：小米大模型）是由小米开发的一个大规模预训练语言模型，参数规模为64亿。

相关页面显示，小米大模型在C-Eval榜单中排名第9、同参数量级排名第1，在CMMLU中文向大模型排名第1。

值得一提的是，雷军将于下周一（8月14日）晚间的新品发布会上，发表年度演讲。

本次演讲以“成长”为主题，雷军发布的微博透露，“当初做的一个决定，改变了我的一生。”而且，这个决定让他庆幸至今。

外界猜测，雷军年度演讲的内容，除了与小米造车相关，或许还将与小米筹备已久的大模型有关。

来源：微博截图

小米大模型取得双“第一”，下周一或亮相

C-Eval榜单，全称C-Eval全球大模型综合性考试测试榜，是由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。

该套件覆盖人文、社科、理工、其他专业四个大方向，包括52个学科，涵盖微积分、线性代数等多个知识领域。共有13948道中文知识和推理型题目，难度分为中学、本科、研究生、职业等四个考试级别，能够更加全面的对模型的语言处理能力进行评估，对中文社区语言大模型的研发有着很好的参考价值。

具体而言，在C-Eval评估中，小米大模型的平均分为60.2，在STEM、社会科学、人文科学、其他这四个类别中，均取得了不错的表现。

来源：C-Eval截图

其中，在STEM（科学、技术、工程和数学教育）全部20个科目中，小米大模型得分54.5，在计量师、物理、化学、生物等多个项目中获得了较高的准确率；在10个社会科学科目中，小米大模型得分71.7，在教育学和地理外的所有科目中，获得了较为理想的准确率；在11个人文科学科目中，小米大模型得分62.7，在历史与法律基础上，获得了不错的准确率；在其他分类下，小米大模型则得分57.7。

整体而言，小米大模型在法学、数学、编程、概率论、离散数学等科目上的表现，仍然有明显进步空间。

CMMLU，则是由MBZUAI、上海交通大学、微软亚洲研究院合作完成的，一个全面的中文大模型基准。它涵盖了67个主题，涉及自然科学、社会科学、工程、人文、以及常识等，可以全面地评估大模型在中文知识储备和语言理解上的能力。

在CMMLU中文向大模型评估中，小米大模型在zero-shot和five-shot测试中的平均分分别为60.37和57.17，表现出良好的知识和推理能力。

在zero-shot测试中，小米大模型在人文学科得分63.49，社会科学得分66.2，其他得分62.14，中国特定主题得分62.07，平均分为60.37。

来源：CMMLU截图

在five-shot测试中，小米大模型在人文学科得分61.12，社会科学得分61.68，其他得分58.84，中国特定主题得分59.39，平均分为57.17。

来源：CMMLU截图

小米大模型首次曝光于上述两个评测榜单中，并取得“双第一”的不错成绩，也为其接下来的亮相，带来了充足底气。

至于亮相的时间，或许就在下周一，小米举办的新品发布会中，雷军的年度演讲环节。

此前，雷军曾表示，“今年的演讲比前几年更长些，演讲之后是我们的年度新品发布，还会披露我们技术探索的新进展。今年内容也非常多，估计3小时左右。”

雷军口中的“技术探索的新进展”，除了小米汽车，可能就要数小米大模型了。

任命栾剑做领头人，千人团队百亿研发护航

4月14日，据澎湃新闻报道，小米集团发布内部邮件，任命栾剑担任技术委员会AI实验室大模型团队负责人，向技术委员会副主席、AI实验室主任王斌汇报。

公开资料显示，栾剑现任小米技术委员会AI实验室语音生成团队负责人，曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

紧随其后，雷军于4月14日晚间在微博发文，首度谈及小米对大模型和AIGC的看法。

“全力以赴、坚决拥抱”，雷军为小米大模型发展定调！他还透露，对于大模型，小米“正在研发一些有趣的技术和产品，等我们打磨好了，再给大家展示。”

雷军在微博提及小米，在AI领域有AI实验室、小爱同学、自动驾驶等团队。

来源：微博截图

此外，从服务能力协同来看，雷军手中亦有金山云这张底牌。金山云是金山软件的附属公司，在公司掌舵人雷军超前布局下，是与阿里巴巴最早在中国全力进军云计算的企业。

要知道，ChatGPT热潮带来的AI竞争，最直接的受益者正是云计算平台。一方面，生成式AI应用背后的大模型需要更强的算力；另一方面，区别于传统云计算平台提供的算力、存储等资源，拥有大模型的云厂商未来可以提供基于大模型开发应用。

早在今年2月的小米投资者日上，对于小米在ChatGPT上的布局，小米手机部总裁曾学忠就表示，ChatGPT基于AI大模型、千亿级参数量、数据量、还有人工标注支撑，AI大模型方面小米一直都有投入。手机和汽车业务有很多AI大模型落地的场景。

随后，在今年3月的2022年财报电话会议上，小米集团总裁卢伟冰谈到ChatGPT相关问题时表示，小米很早就在AI大模型方面进行了许多部署，同时采用了多技术路线并行的策略，小爱同学就是小米大模型落地的代表。

5月24日晚，小米披露的2023年第一季度业绩数据中提到，目前小米AI领域相关研发人员超1200人，未来小米将不断挖掘AI相关的用户场景，发挥技术优势，并以开放的态度与合作伙伴开拓更多机会。

卢伟冰再次强调，小米会积极拥抱大模型技术，但小米不会像OpenAI那样去做通用大模型，而是寻求大模型与自身业务的深度协同，例如与小爱同学、MIUI、机器人等业务相结合，同时也不断提升集团的内部工作效率。

小米副总裁、首席财务官林世伟也在业绩电话会上透露，“已经把业内大模型团队都过了一遍”，小米会采用惯用的“打法”，也就是战略投资等方式，来实现AI大模型方面的生态合作。

第一季度业绩数据还显示，小米一季度持续投入研发，研发支出同比增长17.7%达41亿元。小米表示，预计2023年总研发投入将超200亿元。

从目前综合信息来看，小米大模型“万事俱备，只欠东风”。下周一晚间，能否见证它的正式亮相，外界正翘首以待。

来源：猎云精选返回搜狐，查看更多

责任编辑：

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-08-12 00:45:25

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于成绩单,小米,模型,成绩,小米,模型的资讯：

预售价81.49万！小米汽车SU7 Ultra亮相，雷军..

...S 2新品发布会上，小米CEO雷军公布了小米汽车最新的销售成绩单。除了最新亮相的小米15，雷军还公布了小米SU7的高性能版本——SU7 Ultra

2024-10-30 09:03:00

手机业务难回暖、第二曲线要烧钱小米压力山大

...务难回暖，全球市场份额难保小米交出了一份不算优秀的成绩单。财报显示，自2022年全年，小米营收连续四个季度同比下滑之后，2023年第一季度，小米营收的同比跌幅进一步扩大至18

2023-05-29 17:04:00

小米翻番、哪吒“失踪”，新势力10月榜单透露什么信号？

图片系AI生成造车新势力10月成绩单发布，虽然与9月相比，排名变化并不大，但部分企业在销量数字上出现了一些引人关注的变化。销量最高的依然是理想汽车，虽然环比略有下降，但销量仍然维

2024-11-04 14:27:00

小米Q1：高端收获、盈利上扬，开启长坡厚雪新周期

...期”，但头部“大玩家”小米交出了一份超出市场预期的成绩单。5月24日，小米发布2023年Q1财报。财报期间，小米营收为595亿元

2023-05-29 19:00:00

重估小米：惨遭印度“打劫” 市值缩水七成汽车爆发在即

...内、全球数字广告、游戏市场处境都不算太好，小米这份成绩单已经算十分出色。和苹果、华为等互联网业务出类拔萃的同行一样，小米互联网服务的成功秘诀在于善用流量。经过近十年狂飙猛进之

2023-06-16 16:47:00

小米大语言模型MiLM-6B首次现身！同参数量级排名第一

快科技8月11日消息，近日，小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿

2023-08-11 17:00:00

小米卖一辆车亏6万上热搜雷军：不用焦虑

...度，也是小米自小米汽车交付以来，首次交出独立的季度成绩单。具体来看，小米的季度报将业务划为“手机×AIoT”和“智能电动汽车等创新业务”两大部分

2024-08-22 21:14:00

小米ai大模型milm-6b首次曝光

小米公司此前并未“官宣”直接加入 AI 大模型赛道中，不过小米的 AI 大模型MiLM-6B目前已经悄然现身C-Eval

2023-08-12 06:35:00

雷军花千万挖人、头部量化私募创立、95后AI“天才少女”，这

...k-V2的研发，是这款模型的关键开发者之一。AI的风狂吹，小米创始人雷军闻声而动，在DeepSeek-V3发布前几天

2024-12-31 09:53:00

更多关于科技的资讯：

公用事业领域反垄断指南出台

中新经纬2月11日电据国家市场监督管理总局网站消息，2月4日，国务院反垄断反不正当竞争委员会印发施行《关于公用事业领域的反垄断指南》(以下简称《指南》)

2026-02-11 20:18:00

季季有主题，周周有优惠！2026年河北省电影惠民观影促消费活

河北日报客户端讯（记者肖煜）为积极响应落实国家电影局全国电影惠民消费季安排，进一步激活河北电影市场消费潜力，丰富群众文化生活

2026-02-11 22:05:00

2025国际宠物博览会落幕：Benarmi倡导全生命周期健康

12月20日，2025国际宠物博览会在北京市平谷区博物馆、体育中心拉开帷幕，汇聚全球名宠、产业企业与创新项目，集中展现宠物经济的前沿动态与发展趋势

2026-02-11 20:08:00

“民生科幻”领军人吴楚新作《背叛文明》出版，聚焦星际外交博弈

如果高等文明的馈赠是一颗带毒的蜜糖，那人类是否有智慧拒绝唾手可得的诱惑？当思想需要向未来跨出一大步时，阅读科幻依然是当下最高效的途径

2026-02-11 17:22:00

数智化转型驱动下国家休假制度改革与体系优化

随着云计算、大数据、人工智能等数智技术的迅猛发展，传统劳动形态正经历着前所未有的变革。工作场所的虚拟化、劳动时间的弹性化以及用工关系的多元化

2026-02-11 17:31:00

厦门城市可信数据空间开放试运行

厦门城市可信数据空间开放试运行推出“马上有数”进驻激励计划首发5个月资源免费共享东南网2月11日讯（海峡导报记者康泽辉）近日

2026-02-11 17:50:00

元梦空间荣膺两项大奖闪耀2025人工智能未来设计大赛

2025年11月10日，由工业和信息化部工业文化发展中心主办的2025“人工智能未来设计大赛”全国总决赛在山西太原圆满落幕

2026-02-11 17:50:00

【寒假摘镜总动员】选择哪种近视手术方式？——济南普瑞眼科王晓

视力是体检中至关重要的一环。选择一种既安全稳定、又符合体检标准的近视手术方式，是实现梦想的关键一步。济南普瑞眼科作为山东省首批蔡司全飞秒4

2026-02-11 17:51:00

涌金楼丨浙江省长专题调研的这一细分赛道，牵动万亿规模庞大产业

潮新闻讯随着人工智能兴起，数据要素领域的生产性服务业，规模正迅速壮大。近日，浙江省委副书记、省长刘捷在杭州专题调研服务业发展工作

2026-02-11 17:58:00

俊小白与上海吴淞材料实验室联合成立实验室

中国消费者报北京讯（记者孙蔚）近日，上海吴淞材料实验室与国货科创口腔护理品牌俊小白联合成立的个人护理功能介孔材料联合实验室正式落成

2026-02-11 18:06:00

合肥零次方机器人完成工信部这项“家庭测试”

大皖新闻讯大皖新闻记者从国先中心（合肥）了解到，日前，零次方机器人率先完成中国信通院“可信AI”具身智能基准测试（EAI Bench）

2026-02-11 18:18:00

新型消费更需筑牢诚信底线

2月5日，中国消费者协会公布了2025年全国消协组织受理投诉情况统计数据，去年全国消协组织共受理消费者投诉2016448件

2026-02-11 18:06:00

职场人年货买什么？食品类、数码类需求上升

日前，智联招聘发布《职场人春节生存图鉴调研报告》，呈现职场人在春节前后的工作状态、社交压力、休闲计划等。春节前后通常是离职高峰期

2026-02-11 19:14:00

安徽太和县烟草专卖局（营销部）：“智”在细微处 “惠”在商户

2025年，安徽太和县烟草专卖局（营销部）紧扣行业高质量发展要求，以“强基固本、提质增效”为主线，深化终端现代化转型，在数字化赋能

2026-02-11 14:18:00

从技术到情感，2026值得入手的定制珠宝品牌，一文读懂不踩坑

一、定制珠宝为何成为新消费时代的“刚需”？过去几年，全球珠宝产业正经历一场由内而外的结构性重塑。根据《2026全球珠宝行业白皮书》披露的数据

2026-02-11 14:20:00

头条订阅服务

小米大模型交成绩单