• 我的订阅
  • 科技

小米大模型交成绩单

类别:科技 发布时间:2023-08-11 21:01:00 来源:金融界

距4月14日雷军官宣杀入大模型不到4个月,小米大模型终于首次曝光,并交出了一份初步成绩单!

多方消息显示,小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。

根据GitHub项目页给出的信息,MiLM-6B(下称:小米大模型)是由小米开发的一个大规模预训练语言模型,参数规模为64亿。

相关页面显示,小米大模型在C-Eval榜单中排名第9、同参数量级排名第1,在CMMLU中文向大模型排名第1。

值得一提的是,雷军将于下周一(8月14日)晚间的新品发布会上,发表年度演讲。

本次演讲以“成长”为主题,雷军发布的微博透露,“当初做的一个决定,改变了我的一生。”而且,这个决定让他庆幸至今。

外界猜测,雷军年度演讲的内容,除了与小米造车相关,或许还将与小米筹备已久的大模型有关。

小米大模型交成绩单

来源:微博截图

小米大模型取得双“第一”,下周一或亮相

C-Eval榜单,全称C-Eval全球大模型综合性考试测试榜,是由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。

该套件覆盖人文、社科、理工、其他专业四个大方向,包括52个学科,涵盖微积分、线性代数等多个知识领域。共有13948道中文知识和推理型题目,难度分为中学、本科、研究生、职业等四个考试级别,能够更加全面的对模型的语言处理能力进行评估,对中文社区语言大模型的研发有着很好的参考价值。

具体而言,在C-Eval评估中,小米大模型的平均分为60.2,在STEM、社会科学、人文科学、其他这四个类别中,均取得了不错的表现。

小米大模型交成绩单

来源:C-Eval截图

其中,在STEM(科学、技术、工程和数学教育)全部20个科目中,小米大模型得分54.5,在计量师、物理、化学、生物等多个项目中获得了较高的准确率;在10个社会科学科目中,小米大模型得分71.7,在教育学和地理外的所有科目中,获得了较为理想的准确率;在11个人文科学科目中,小米大模型得分62.7,在历史与法律基础上,获得了不错的准确率;在其他分类下,小米大模型则得分57.7。

整体而言,小米大模型在法学、数学、编程、概率论、离散数学等科目上的表现,仍然有明显进步空间。

CMMLU,则是由MBZUAI、上海交通大学、微软亚洲研究院合作完成的,一个全面的中文大模型基准。它涵盖了67个主题,涉及自然科学、社会科学、工程、人文、以及常识等,可以全面地评估大模型在中文知识储备和语言理解上的能力。

在CMMLU中文向大模型评估中,小米大模型在zero-shot和five-shot测试中的平均分分别为60.37和57.17,表现出良好的知识和推理能力。

在zero-shot测试中,小米大模型在人文学科得分63.49,社会科学得分66.2,其他得分62.14,中国特定主题得分62.07,平均分为60.37。

小米大模型交成绩单

来源:CMMLU截图

在five-shot测试中,小米大模型在人文学科得分61.12,社会科学得分61.68,其他得分58.84,中国特定主题得分59.39,平均分为57.17。

小米大模型交成绩单

来源:CMMLU截图

小米大模型首次曝光于上述两个评测榜单中,并取得“双第一”的不错成绩,也为其接下来的亮相,带来了充足底气。

至于亮相的时间,或许就在下周一,小米举办的新品发布会中,雷军的年度演讲环节。

此前,雷军曾表示,“今年的演讲比前几年更长些,演讲之后是我们的年度新品发布,还会披露我们技术探索的新进展。今年内容也非常多,估计3小时左右。”

雷军口中的“技术探索的新进展”,除了小米汽车,可能就要数小米大模型了。

任命栾剑做领头人,千人团队百亿研发护航

4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。

公开资料显示,栾剑现任小米技术委员会AI实验室语音生成团队负责人,曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

紧随其后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。

“全力以赴、坚决拥抱”,雷军为小米大模型发展定调!他还透露,对于大模型,小米“正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”

雷军在微博提及小米,在AI领域有AI实验室、小爱同学、自动驾驶等团队。

小米大模型交成绩单

来源:微博截图

此外,从服务能力协同来看,雷军手中亦有金山云这张底牌。金山云是金山软件的附属公司,在公司掌舵人雷军超前布局下,是与阿里巴巴最早在中国全力进军云计算的企业。

要知道,ChatGPT热潮带来的AI竞争,最直接的受益者正是云计算平台。一方面,生成式AI应用背后的大模型需要更强的算力;另一方面,区别于传统云计算平台提供的算力、存储等资源,拥有大模型的云厂商未来可以提供基于大模型开发应用。

早在今年2月的小米投资者日上,对于小米在ChatGPT上的布局,小米手机部总裁曾学忠就表示,ChatGPT基于AI大模型、千亿级参数量、数据量、还有人工标注支撑,AI大模型方面小米一直都有投入。手机和汽车业务有很多AI大模型落地的场景。

随后,在今年3月的2022年财报电话会议上,小米集团总裁卢伟冰谈到ChatGPT相关问题时表示,小米很早就在AI大模型方面进行了许多部署,同时采用了多技术路线并行的策略,小爱同学就是小米大模型落地的代表。

5月24日晚,小米披露的2023年第一季度业绩数据中提到,目前小米AI领域相关研发人员超1200人,未来小米将不断挖掘AI相关的用户场景,发挥技术优势,并以开放的态度与合作伙伴开拓更多机会。

卢伟冰再次强调,小米会积极拥抱大模型技术,但小米不会像OpenAI那样去做通用大模型,而是寻求大模型与自身业务的深度协同,例如与小爱同学、MIUI、机器人等业务相结合,同时也不断提升集团的内部工作效率。

小米副总裁、首席财务官林世伟也在业绩电话会上透露,“已经把业内大模型团队都过了一遍”,小米会采用惯用的“打法”,也就是战略投资等方式,来实现AI大模型方面的生态合作。

第一季度业绩数据还显示,小米一季度持续投入研发,研发支出同比增长17.7%达41亿元。小米表示,预计2023年总研发投入将超200亿元。

从目前综合信息来看,小米大模型“万事俱备,只欠东风”。下周一晚间,能否见证它的正式亮相,外界正翘首以待。

来源:猎云精选返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-12 00:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

预售价81.49万!小米汽车SU7 Ultra亮相,雷军...
...S 2新品发布会上,小米CEO雷军公布了小米汽车最新的销售成绩单。除了最新亮相的小米15,雷军还公布了小米SU7的高性能版本——SU7 Ultra
2024-10-30 09:03:00
手机业务难回暖、第二曲线要烧钱 小米压力山大
...务难回暖,全球市场份额难保小米交出了一份不算优秀的成绩单。财报显示,自2022年全年,小米营收连续四个季度同比下滑之后,2023年第一季度,小米营收的同比跌幅进一步扩大至18
2023-05-29 17:04:00
小米翻番、哪吒“失踪”,新势力10月榜单透露什么信号?
图片系AI生成造车新势力10月成绩单发布,虽然与9月相比,排名变化并不大,但部分企业在销量数字上出现了一些引人关注的变化。销量最高的依然是理想汽车,虽然环比略有下降,但销量仍然维
2024-11-04 14:27:00
小米Q1:高端收获、盈利上扬,开启长坡厚雪新周期
...期”,但头部“大玩家”小米交出了一份超出市场预期的成绩单。5月24日,小米发布2023年Q1财报。财报期间,小米营收为595亿元
2023-05-29 19:00:00
重估小米:惨遭印度“打劫” 市值缩水七成 汽车爆发在即
...内、全球数字广告、游戏市场处境都不算太好,小米这份成绩单已经算十分出色。和苹果、华为等互联网业务出类拔萃的同行一样,小米互联网服务的成功秘诀在于善用流量。经过近十年狂飙猛进之
2023-06-16 16:47:00
小米大语言模型MiLM-6B首次现身!同参数量级排名第一
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿
2023-08-11 17:00:00
小米卖一辆车亏6万上热搜 雷军:不用焦虑
...度,也是小米自小米汽车交付以来,首次交出独立的季度成绩单。具体来看,小米的季度报将业务划为“手机×AIoT”和“智能电动汽车等创新业务”两大部分
2024-08-22 21:14:00
小米ai大模型milm-6b首次曝光
小米公司此前并未“官宣”直接加入 AI 大模型赛道中,不过小米的 AI 大模型MiLM-6B目前已经悄然现身C-Eval
2023-08-12 06:35:00
雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏
...k-V2的研发,是这款模型的关键开发者之一。AI的风狂吹,小米创始人雷军闻声而动,在DeepSeek-V3发布前几天
2024-12-31 09:53:00
更多关于科技的资讯:
日前,太重智能高端装备产业园区的厂房内一片欢腾。由企业自主研发的智能轴承,成功应用于大型电铲并顺利完成厂内模拟测试,各项性能指标均优于设计标准
2026-01-22 07:03:00
最近有件事儿越来越常见:外国人不光来中国旅游,还专门“打飞的”来看病。不是出于好奇体验,而是真心觉得值!值在哪儿?三个字
2026-01-21 21:52:00
中新经纬1月21日电 广东省政府网站21日公布《广东省人工智能赋能交通运输高质量发展若干政策措施》(下称《政策措施》)
2026-01-21 20:20:00
织金平远公司完成 500kVⅡ 组母线母差保护装置校验及传动
多彩贵州网讯(通讯员 史凡莉)近日,织金平远公司厂区内,500kVⅡ组母线设备区域一派忙碌景象。电热检修部与发电运行部工作人员有条不紊地开展母差保护A屏
2026-01-21 17:15:00
九阳太空厨房已安全稳定运行超1500天
中国消费者报报道(记者桑雪骐)航天员们如何健康、舒适地展开太空生活和吃好一日三餐,是大家都很关心的话题。据了解,这背后其实有一个我国自主研制的太空厨房
2026-01-21 18:05:00
秦皇岛经开区第一小学开展人工智能科技实践活动
河北新闻网讯(李佳新)日前,秦皇岛经开区第一小学开展以“AI探索,智创未来”为主题的人工智能科技实践,通过沉浸式实训活动激发学生的科技探索热情
2026-01-21 18:11:00
马年将至(农历),在广州大夫山森林公园,一些徒步爱好者分享了一种创意玩法——“画马”,相关穿越路线攻略一时引发追捧。所谓“画马”
2026-01-21 18:36:00
三重蝶变,中天钢铁解锁“企业主理”新范式
大寒虽寒,热潮涌动。原点空间路演大厅内,由中天钢铁主理的第37场沙龙——“AI智能体创新大赛总结沙龙”以三重蝶变,为常州“智能体+场景应用”示范城市建设吹响了热力全开的奋进号角
2026-01-21 18:28:00
苏州市女企协秘书长、国浩律师(苏州)事务所合伙人葛霞青律师荣登《钱伯斯大中华区指南2026》推荐榜单
江南时报讯 1月15日,全球领先的法律研究和分析机构钱伯斯(Chambers & Partners)发布《钱伯斯大中华区指南2026》(Chambers Greater China Region Guide 2026)
2026-01-21 15:23:00
盐城盐都:“翼”技傍身 照亮前程
江南时报讯 启动无人机,校准飞行参数,规划测绘航线,精准捕捉地面数据……日前,2026年盐城市盐都区首期无人机测绘操控员技能培训在都U+乐业空间正式开班
2026-01-21 15:24:00
全国首款!仙库3D智能足脊扫描仪正式发布!
近日,深圳仙库智能有限公司(以下简称“仙库”)正式发布仙库3D智能足脊扫描仪XK-CH005,这是全国首款实现“足脊一体”同步评估的硬核科技产品
2026-01-21 16:24:00
国家级备案落地!疯狂体育Foretell革命性AI平台,开启体育智能决策新阶段
2026年1月20日,疯狂体育正式官宣推出旗下AI赛事预测工具Foretell。凭借已经完成的国家互联网信息办公室深度合成服务算法备案资质
2026-01-21 16:47:00
当我们在思考“哪些中国企业创新做得不错”时,CES 2026舞台上的联想集团给出了一个全面而深刻的答案。这不仅仅是一次产品发布会
2026-01-21 16:49:00
近日,剑桥大学教育学院院长Hilary正式受聘为中国素质教育品牌欣乾程的学术顾问。此次合作不仅是国际顶尖学术力量与中国创新型教育机构的一次重要握手
2026-01-21 14:24:00
跨越顶奢与潮饮的“美酒+美食”表达 五粮液全力构建中国白酒全球新叙事
鲁网1月21日讯当一位新加坡米其林星厨在构思新菜单时,正在将中国白酒作为风味拼图中一块充满惊喜的“香料”。在他手中,一杯五粮液可能被用来平衡炙烤龙虾的鲜甜
2026-01-21 12:03:00