• 我的订阅
  • 科技

小米大模型交成绩单

类别:科技 发布时间:2023-08-11 21:01:00 来源:金融界

距4月14日雷军官宣杀入大模型不到4个月,小米大模型终于首次曝光,并交出了一份初步成绩单!

多方消息显示,小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。

根据GitHub项目页给出的信息,MiLM-6B(下称:小米大模型)是由小米开发的一个大规模预训练语言模型,参数规模为64亿。

相关页面显示,小米大模型在C-Eval榜单中排名第9、同参数量级排名第1,在CMMLU中文向大模型排名第1。

值得一提的是,雷军将于下周一(8月14日)晚间的新品发布会上,发表年度演讲。

本次演讲以“成长”为主题,雷军发布的微博透露,“当初做的一个决定,改变了我的一生。”而且,这个决定让他庆幸至今。

外界猜测,雷军年度演讲的内容,除了与小米造车相关,或许还将与小米筹备已久的大模型有关。

小米大模型交成绩单

来源:微博截图

小米大模型取得双“第一”,下周一或亮相

C-Eval榜单,全称C-Eval全球大模型综合性考试测试榜,是由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。

该套件覆盖人文、社科、理工、其他专业四个大方向,包括52个学科,涵盖微积分、线性代数等多个知识领域。共有13948道中文知识和推理型题目,难度分为中学、本科、研究生、职业等四个考试级别,能够更加全面的对模型的语言处理能力进行评估,对中文社区语言大模型的研发有着很好的参考价值。

具体而言,在C-Eval评估中,小米大模型的平均分为60.2,在STEM、社会科学、人文科学、其他这四个类别中,均取得了不错的表现。

小米大模型交成绩单

来源:C-Eval截图

其中,在STEM(科学、技术、工程和数学教育)全部20个科目中,小米大模型得分54.5,在计量师、物理、化学、生物等多个项目中获得了较高的准确率;在10个社会科学科目中,小米大模型得分71.7,在教育学和地理外的所有科目中,获得了较为理想的准确率;在11个人文科学科目中,小米大模型得分62.7,在历史与法律基础上,获得了不错的准确率;在其他分类下,小米大模型则得分57.7。

整体而言,小米大模型在法学、数学、编程、概率论、离散数学等科目上的表现,仍然有明显进步空间。

CMMLU,则是由MBZUAI、上海交通大学、微软亚洲研究院合作完成的,一个全面的中文大模型基准。它涵盖了67个主题,涉及自然科学、社会科学、工程、人文、以及常识等,可以全面地评估大模型在中文知识储备和语言理解上的能力。

在CMMLU中文向大模型评估中,小米大模型在zero-shot和five-shot测试中的平均分分别为60.37和57.17,表现出良好的知识和推理能力。

在zero-shot测试中,小米大模型在人文学科得分63.49,社会科学得分66.2,其他得分62.14,中国特定主题得分62.07,平均分为60.37。

小米大模型交成绩单

来源:CMMLU截图

在five-shot测试中,小米大模型在人文学科得分61.12,社会科学得分61.68,其他得分58.84,中国特定主题得分59.39,平均分为57.17。

小米大模型交成绩单

来源:CMMLU截图

小米大模型首次曝光于上述两个评测榜单中,并取得“双第一”的不错成绩,也为其接下来的亮相,带来了充足底气。

至于亮相的时间,或许就在下周一,小米举办的新品发布会中,雷军的年度演讲环节。

此前,雷军曾表示,“今年的演讲比前几年更长些,演讲之后是我们的年度新品发布,还会披露我们技术探索的新进展。今年内容也非常多,估计3小时左右。”

雷军口中的“技术探索的新进展”,除了小米汽车,可能就要数小米大模型了。

任命栾剑做领头人,千人团队百亿研发护航

4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。

公开资料显示,栾剑现任小米技术委员会AI实验室语音生成团队负责人,曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

紧随其后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。

“全力以赴、坚决拥抱”,雷军为小米大模型发展定调!他还透露,对于大模型,小米“正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”

雷军在微博提及小米,在AI领域有AI实验室、小爱同学、自动驾驶等团队。

小米大模型交成绩单

来源:微博截图

此外,从服务能力协同来看,雷军手中亦有金山云这张底牌。金山云是金山软件的附属公司,在公司掌舵人雷军超前布局下,是与阿里巴巴最早在中国全力进军云计算的企业。

要知道,ChatGPT热潮带来的AI竞争,最直接的受益者正是云计算平台。一方面,生成式AI应用背后的大模型需要更强的算力;另一方面,区别于传统云计算平台提供的算力、存储等资源,拥有大模型的云厂商未来可以提供基于大模型开发应用。

早在今年2月的小米投资者日上,对于小米在ChatGPT上的布局,小米手机部总裁曾学忠就表示,ChatGPT基于AI大模型、千亿级参数量、数据量、还有人工标注支撑,AI大模型方面小米一直都有投入。手机和汽车业务有很多AI大模型落地的场景。

随后,在今年3月的2022年财报电话会议上,小米集团总裁卢伟冰谈到ChatGPT相关问题时表示,小米很早就在AI大模型方面进行了许多部署,同时采用了多技术路线并行的策略,小爱同学就是小米大模型落地的代表。

5月24日晚,小米披露的2023年第一季度业绩数据中提到,目前小米AI领域相关研发人员超1200人,未来小米将不断挖掘AI相关的用户场景,发挥技术优势,并以开放的态度与合作伙伴开拓更多机会。

卢伟冰再次强调,小米会积极拥抱大模型技术,但小米不会像OpenAI那样去做通用大模型,而是寻求大模型与自身业务的深度协同,例如与小爱同学、MIUI、机器人等业务相结合,同时也不断提升集团的内部工作效率。

小米副总裁、首席财务官林世伟也在业绩电话会上透露,“已经把业内大模型团队都过了一遍”,小米会采用惯用的“打法”,也就是战略投资等方式,来实现AI大模型方面的生态合作。

第一季度业绩数据还显示,小米一季度持续投入研发,研发支出同比增长17.7%达41亿元。小米表示,预计2023年总研发投入将超200亿元。

从目前综合信息来看,小米大模型“万事俱备,只欠东风”。下周一晚间,能否见证它的正式亮相,外界正翘首以待。

来源:猎云精选返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-12 00:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

预售价81.49万!小米汽车SU7 Ultra亮相,雷军...
...S 2新品发布会上,小米CEO雷军公布了小米汽车最新的销售成绩单。除了最新亮相的小米15,雷军还公布了小米SU7的高性能版本——SU7 Ultra
2024-10-30 09:03:00
手机业务难回暖、第二曲线要烧钱 小米压力山大
...务难回暖,全球市场份额难保小米交出了一份不算优秀的成绩单。财报显示,自2022年全年,小米营收连续四个季度同比下滑之后,2023年第一季度,小米营收的同比跌幅进一步扩大至18
2023-05-29 17:04:00
小米翻番、哪吒“失踪”,新势力10月榜单透露什么信号?
图片系AI生成造车新势力10月成绩单发布,虽然与9月相比,排名变化并不大,但部分企业在销量数字上出现了一些引人关注的变化。销量最高的依然是理想汽车,虽然环比略有下降,但销量仍然维
2024-11-04 14:27:00
小米Q1:高端收获、盈利上扬,开启长坡厚雪新周期
...期”,但头部“大玩家”小米交出了一份超出市场预期的成绩单。5月24日,小米发布2023年Q1财报。财报期间,小米营收为595亿元
2023-05-29 19:00:00
重估小米:惨遭印度“打劫” 市值缩水七成 汽车爆发在即
...内、全球数字广告、游戏市场处境都不算太好,小米这份成绩单已经算十分出色。和苹果、华为等互联网业务出类拔萃的同行一样,小米互联网服务的成功秘诀在于善用流量。经过近十年狂飙猛进之
2023-06-16 16:47:00
小米大语言模型MiLM-6B首次现身!同参数量级排名第一
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿
2023-08-11 17:00:00
小米卖一辆车亏6万上热搜 雷军:不用焦虑
...度,也是小米自小米汽车交付以来,首次交出独立的季度成绩单。具体来看,小米的季度报将业务划为“手机×AIoT”和“智能电动汽车等创新业务”两大部分
2024-08-22 21:14:00
小米ai大模型milm-6b首次曝光
小米公司此前并未“官宣”直接加入 AI 大模型赛道中,不过小米的 AI 大模型MiLM-6B目前已经悄然现身C-Eval
2023-08-12 06:35:00
雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏
...k-V2的研发,是这款模型的关键开发者之一。AI的风狂吹,小米创始人雷军闻声而动,在DeepSeek-V3发布前几天
2024-12-31 09:53:00
更多关于科技的资讯:
为建设“人工智能第一城”注入新动能杭州日报讯 杭州正加快构建场景驱动的AI产业基金,为人工智能产业发展注入全新动力。近日
2025-12-31 07:07:00
单个项目最高补助5000万元每日商报讯 用“意念”操控机械臂帮助瘫痪患者重获行动能力,以人脑为蓝本打造超低功耗芯片处理复杂任务……这些曾只存在于科幻作品中的场景
2025-12-31 07:37:00
日复一日,年复一年,新年的脚步已悄然叩响门环,无论你我是否整理好行囊。这一年的时光,有多少已从指缝间不经意溜走——被闹钟唤醒的清晨
2025-12-31 07:38:00
“现代化城市雄安探路”系列报道(五):数字孪生 创新之城
数字孪生 创新之城——“现代化城市雄安探路”系列报道⑤日前拍摄的雄安城市计算中心。它是雄安数字城市建设的核心枢纽。 河北日报记者 刘光昱摄建筑通过数字建模
2025-12-31 07:42:00
■王鑫摘要:在数字化转型的背景下,企业财务管理正面临由传统核算型向智能决策型的系统性变革。本文从数字化发展的实际需求出发
2025-12-31 04:48:00
1元租机器人,线下开首店:人形机器人打响大众化“发令枪”
大皖新闻讯 2025年的最后两天,中国的人形机器人产业以两件标志性事件,为即将到来的2026年按下了商业化加速键。一边是擎天租以“1元闪租”的体验价格将可以“打太极”的人形机器人推向大众市场
2025-12-30 21:48:00
从\
鲁网12月30日讯12月30日,在济南召开的"永生之手叩响仿生机器人元年之门"主题峰会上,山东未来机器人技术有限公司首次提出将人类生命划分为"碳基阶段"与"硅基阶段"的颠覆性理论框架
2025-12-30 22:13:00
贵州艺森源集团:从手工敲打到智能轰鸣 书写酒包装产业升级答卷
多彩贵州网讯 近日,贵州艺森源集团有限公司生产车间内,智能设备高效运转,自动化生产线有序作业,一派繁忙景象。历经十年深耕
2025-12-30 22:38:00
浪潮智慧文旅“智享商旅 聚力同行”2025浪潮商旅服务日成功举办
鲁网12月30日讯12月25日,由山东浪潮智慧文旅产业发展有限公司主办、山东浪潮智慧空间技术服务有限公司承办的“智享商旅·聚力同行——2025浪潮商旅服务日”在浪潮科技园圆满落幕
2025-12-30 17:23:00
潮新闻讯 浙商,是商业期刊的常客。2025年,他们的名字却接连登上《细胞》(Cell)《自然》(Nature)《科学》(Science)等学术期刊的作者栏
2025-12-30 17:52:00
扎根毕节十年,年产能超7500万只,出口覆盖欧非亚——贵州贵航新能源科技有限公司,已成为推动区域新能源产业链发展的“关键一环”
2025-12-30 18:35:00
肯悦咖啡苹果冰雕点亮冰城 代言人白敬亭助阵亮灯迎新春
2025年12月29日,肯悦咖啡在哈尔滨中央大街举办了一场别开生面的“红苹果心愿季”冰雕点灯仪式。肯悦咖啡的巨型红色咖啡杯造型冰雕搭配“水晶”苹果
2025-12-30 18:50:00
博士创新站典型案例|保定市鑫诺电科软件开发有限公司博士创新站:校企协同创新赋民生
当前供水行业智能化转型加速推进,保定市鑫诺电科软件开发有限公司作为本地企业,在技术层面面临自主开发的智能客服系统缺乏适配技术
2025-12-30 19:36:00
京东京喜自营2025年成交额增长10倍 5大产业带订单量破亿
2025年即将结束,回看这一年,外贸逆袭、市场反内卷、AI全面爆发,用户消费需求回归理性,带动品质消费。今日,京东旗下特价购物品牌京喜自营披露了这一年的成绩单——2025年实现成交额10倍增长
2025-12-30 19:48:00
事关以旧换新!河南公开征集
大河网讯 为深入推进2026年消费品以旧换新政策实施,河南省商务厅日前正式发布《河南省2026年消费品以旧换新家电及数码智能产品参与品牌厂家征集公告》
2025-12-30 19:55:00