• 我的订阅
  • 科技

小米大模型交成绩单

类别:科技 发布时间:2023-08-11 21:01:00 来源:金融界

距4月14日雷军官宣杀入大模型不到4个月,小米大模型终于首次曝光,并交出了一份初步成绩单!

多方消息显示,小米大模型MiLM-6B现身C-Eval、CMMLU大模型评测榜单。

根据GitHub项目页给出的信息,MiLM-6B(下称:小米大模型)是由小米开发的一个大规模预训练语言模型,参数规模为64亿。

相关页面显示,小米大模型在C-Eval榜单中排名第9、同参数量级排名第1,在CMMLU中文向大模型排名第1。

值得一提的是,雷军将于下周一(8月14日)晚间的新品发布会上,发表年度演讲。

本次演讲以“成长”为主题,雷军发布的微博透露,“当初做的一个决定,改变了我的一生。”而且,这个决定让他庆幸至今。

外界猜测,雷军年度演讲的内容,除了与小米造车相关,或许还将与小米筹备已久的大模型有关。

小米大模型交成绩单

来源:微博截图

小米大模型取得双“第一”,下周一或亮相

C-Eval榜单,全称C-Eval全球大模型综合性考试测试榜,是由清华大学、上海交通大学和爱丁堡大学合作构建的中文语言模型综合性考试评估套件。

该套件覆盖人文、社科、理工、其他专业四个大方向,包括52个学科,涵盖微积分、线性代数等多个知识领域。共有13948道中文知识和推理型题目,难度分为中学、本科、研究生、职业等四个考试级别,能够更加全面的对模型的语言处理能力进行评估,对中文社区语言大模型的研发有着很好的参考价值。

具体而言,在C-Eval评估中,小米大模型的平均分为60.2,在STEM、社会科学、人文科学、其他这四个类别中,均取得了不错的表现。

小米大模型交成绩单

来源:C-Eval截图

其中,在STEM(科学、技术、工程和数学教育)全部20个科目中,小米大模型得分54.5,在计量师、物理、化学、生物等多个项目中获得了较高的准确率;在10个社会科学科目中,小米大模型得分71.7,在教育学和地理外的所有科目中,获得了较为理想的准确率;在11个人文科学科目中,小米大模型得分62.7,在历史与法律基础上,获得了不错的准确率;在其他分类下,小米大模型则得分57.7。

整体而言,小米大模型在法学、数学、编程、概率论、离散数学等科目上的表现,仍然有明显进步空间。

CMMLU,则是由MBZUAI、上海交通大学、微软亚洲研究院合作完成的,一个全面的中文大模型基准。它涵盖了67个主题,涉及自然科学、社会科学、工程、人文、以及常识等,可以全面地评估大模型在中文知识储备和语言理解上的能力。

在CMMLU中文向大模型评估中,小米大模型在zero-shot和five-shot测试中的平均分分别为60.37和57.17,表现出良好的知识和推理能力。

在zero-shot测试中,小米大模型在人文学科得分63.49,社会科学得分66.2,其他得分62.14,中国特定主题得分62.07,平均分为60.37。

小米大模型交成绩单

来源:CMMLU截图

在five-shot测试中,小米大模型在人文学科得分61.12,社会科学得分61.68,其他得分58.84,中国特定主题得分59.39,平均分为57.17。

小米大模型交成绩单

来源:CMMLU截图

小米大模型首次曝光于上述两个评测榜单中,并取得“双第一”的不错成绩,也为其接下来的亮相,带来了充足底气。

至于亮相的时间,或许就在下周一,小米举办的新品发布会中,雷军的年度演讲环节。

此前,雷军曾表示,“今年的演讲比前几年更长些,演讲之后是我们的年度新品发布,还会披露我们技术探索的新进展。今年内容也非常多,估计3小时左右。”

雷军口中的“技术探索的新进展”,除了小米汽车,可能就要数小米大模型了。

任命栾剑做领头人,千人团队百亿研发护航

4月14日,据澎湃新闻报道,小米集团发布内部邮件,任命栾剑担任技术委员会AI实验室大模型团队负责人,向技术委员会副主席、AI实验室主任王斌汇报。

公开资料显示,栾剑现任小米技术委员会AI实验室语音生成团队负责人,曾任东芝研究院研究员、微软工程院高级语音科学家、微软小冰首席语音科学家及语音团队负责人等职位。

紧随其后,雷军于4月14日晚间在微博发文,首度谈及小米对大模型和AIGC的看法。

“全力以赴、坚决拥抱”,雷军为小米大模型发展定调!他还透露,对于大模型,小米“正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”

雷军在微博提及小米,在AI领域有AI实验室、小爱同学、自动驾驶等团队。

小米大模型交成绩单

来源:微博截图

此外,从服务能力协同来看,雷军手中亦有金山云这张底牌。金山云是金山软件的附属公司,在公司掌舵人雷军超前布局下,是与阿里巴巴最早在中国全力进军云计算的企业。

要知道,ChatGPT热潮带来的AI竞争,最直接的受益者正是云计算平台。一方面,生成式AI应用背后的大模型需要更强的算力;另一方面,区别于传统云计算平台提供的算力、存储等资源,拥有大模型的云厂商未来可以提供基于大模型开发应用。

早在今年2月的小米投资者日上,对于小米在ChatGPT上的布局,小米手机部总裁曾学忠就表示,ChatGPT基于AI大模型、千亿级参数量、数据量、还有人工标注支撑,AI大模型方面小米一直都有投入。手机和汽车业务有很多AI大模型落地的场景。

随后,在今年3月的2022年财报电话会议上,小米集团总裁卢伟冰谈到ChatGPT相关问题时表示,小米很早就在AI大模型方面进行了许多部署,同时采用了多技术路线并行的策略,小爱同学就是小米大模型落地的代表。

5月24日晚,小米披露的2023年第一季度业绩数据中提到,目前小米AI领域相关研发人员超1200人,未来小米将不断挖掘AI相关的用户场景,发挥技术优势,并以开放的态度与合作伙伴开拓更多机会。

卢伟冰再次强调,小米会积极拥抱大模型技术,但小米不会像OpenAI那样去做通用大模型,而是寻求大模型与自身业务的深度协同,例如与小爱同学、MIUI、机器人等业务相结合,同时也不断提升集团的内部工作效率。

小米副总裁、首席财务官林世伟也在业绩电话会上透露,“已经把业内大模型团队都过了一遍”,小米会采用惯用的“打法”,也就是战略投资等方式,来实现AI大模型方面的生态合作。

第一季度业绩数据还显示,小米一季度持续投入研发,研发支出同比增长17.7%达41亿元。小米表示,预计2023年总研发投入将超200亿元。

从目前综合信息来看,小米大模型“万事俱备,只欠东风”。下周一晚间,能否见证它的正式亮相,外界正翘首以待。

来源:猎云精选返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-12 00:45:25

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

预售价81.49万!小米汽车SU7 Ultra亮相,雷军...
...S 2新品发布会上,小米CEO雷军公布了小米汽车最新的销售成绩单。除了最新亮相的小米15,雷军还公布了小米SU7的高性能版本——SU7 Ultra
2024-10-30 09:03:00
手机业务难回暖、第二曲线要烧钱 小米压力山大
...务难回暖,全球市场份额难保小米交出了一份不算优秀的成绩单。财报显示,自2022年全年,小米营收连续四个季度同比下滑之后,2023年第一季度,小米营收的同比跌幅进一步扩大至18
2023-05-29 17:04:00
小米翻番、哪吒“失踪”,新势力10月榜单透露什么信号?
图片系AI生成造车新势力10月成绩单发布,虽然与9月相比,排名变化并不大,但部分企业在销量数字上出现了一些引人关注的变化。销量最高的依然是理想汽车,虽然环比略有下降,但销量仍然维
2024-11-04 14:27:00
小米Q1:高端收获、盈利上扬,开启长坡厚雪新周期
...期”,但头部“大玩家”小米交出了一份超出市场预期的成绩单。5月24日,小米发布2023年Q1财报。财报期间,小米营收为595亿元
2023-05-29 19:00:00
重估小米:惨遭印度“打劫” 市值缩水七成 汽车爆发在即
...内、全球数字广告、游戏市场处境都不算太好,小米这份成绩单已经算十分出色。和苹果、华为等互联网业务出类拔萃的同行一样,小米互联网服务的成功秘诀在于善用流量。经过近十年狂飙猛进之
2023-06-16 16:47:00
小米大语言模型MiLM-6B首次现身!同参数量级排名第一
快科技8月11日消息,近日,小米的大语言模型MiLM-6B首次现身C-Eval、CMMLU两大AI模型评测榜单。截至本文成稿
2023-08-11 17:00:00
小米卖一辆车亏6万上热搜 雷军:不用焦虑
...度,也是小米自小米汽车交付以来,首次交出独立的季度成绩单。具体来看,小米的季度报将业务划为“手机×AIoT”和“智能电动汽车等创新业务”两大部分
2024-08-22 21:14:00
小米ai大模型milm-6b首次曝光
小米公司此前并未“官宣”直接加入 AI 大模型赛道中,不过小米的 AI 大模型MiLM-6B目前已经悄然现身C-Eval
2023-08-12 06:35:00
雷军花千万挖人、头部量化私募创立、95后AI“天才少女”,这家AI公司刷屏
...k-V2的研发,是这款模型的关键开发者之一。AI的风狂吹,小米创始人雷军闻声而动,在DeepSeek-V3发布前几天
2024-12-31 09:53:00
更多关于科技的资讯:
一年一度的天猫双11购物节再次引爆消费市场。但与往年不同,今年的关键词不再是简单的“低价”或“流量”,而是全面转向“效率”
2025-11-10 20:57:00
这个周末,朋友圈彻底被KPL总决赛刷屏了。这场赛事创下12秒售罄门票、6.2万人现场观赛的亮眼成绩,一举打破单场电竞赛事观众人数最多的吉尼斯世界纪录
2025-11-10 16:46:00
重获森林呼吸:“半亩森林”在杭发布新品,开启环境益生菌空气净化新纪元
2025年11月8日,杭州梦想小镇络绎科学社区迎来了一场充满科技想象与生活温度的创新体验活动——体验π|环境益生菌,开启“森林呼吸”新纪元
2025-11-10 15:40:00
武当山智慧旅游平台升级 多语种 AI 客服暖心上线
近日,武当山智慧旅游平台迎来重要升级,智能 AI 客服多语种功能正式上线,为全球游客打造无障碍智慧游览新体验,也标志着景区公共服务国际化水平迈上新台阶
2025-11-10 15:31:00
“双11”火到海外,全球网民纷纷加入抢购浪潮厦门空港迎来跨境电商出口高峰东南网11月10日讯(海峡导报记者孙春燕)一年一度的购物狂欢节——“双11”正在如火如荼的进行中
2025-11-10 11:19:00
中国银行与中国银联、华住集团举办提振消费主题签约活动
11月6日,中国银行携手中国银联、华住集团,在商务部、文旅部、人民银行上海总部、上海市政府的共同见证下,成功举办“聚力进博新引擎
2025-11-10 11:26:00
澳柯玛推出2026年风冷无霜、立式多系列冷柜新品
鲁网11月10日讯近日,“双擎智控,深冷领鲜”——澳柯玛2026年制冷营销峰会在青岛隆重召开。来自全国各地的合作伙伴、渠道商及主流媒体代表齐聚一堂
2025-11-10 11:31:00
赛德斯耳机产品线深度盘点:以精准科技满足全场景音频需求
在竞争激烈的音频市场,一个品牌能否立足,关键在于其产品线能否精准覆盖多元化的用户场景。游戏耳机品牌赛德斯(SADES)通过其精心布局的耳机产品矩阵
2025-11-10 12:08:00
神都镜像照见数字文明 作家维摩眼中的“河洛智慧”
大河网讯(记者 赵檬)在千年古都洛阳的深厚文明积淀与瞬息万变的互联网浪潮之间,一场跨越时空的对话正在展开。11月5日,作家维摩参加了2025河南省网络文明大会
2025-11-10 12:39:00
2025青岛虚拟现实创新大会|专访自然语义(青岛)科技有限公司CMO薛铮:以轻量化“语义桥梁”助推虚拟现实产业智能升级
鲁网11月10日讯 (记者 尤奕钧 刘晓伟)人工智能技术快速发展,离不开其背后的核心驱动力——自然语言处理(NLP),NLP依赖于算法和模型分析
2025-11-10 11:34:00
卖场变生活场能否“赢”客?解码五缘湾商圈零售新生态
京东MALL的DIY电竞区人气高。(京东MALL 供图)五缘湾天虹超市将闽南古早味引进精品区。(记者 庄筱婧 摄)五缘湾天虹超市将“烟火市集”升级为顾客的“星级家庭后厨”
2025-11-10 08:13:00
在2025年世界互联网大会乌镇峰会主论坛上,国家移民局、国家网信办联合发布外国人资讯服务App——SinoGuide。SinoGuide旨在帮助外国人更好融入并体验中国丰富便捷的数字化服务
2025-11-10 09:49:00
本报讯(全媒体记者黄祥晟、罗晋粤)11月8日,在2025年世界互联网大会乌镇峰会“互联网之光”博览会现场,从算力基建到智能产品
2025-11-10 07:03:00
11月7日从太原福莱瑞达科技有限公司获悉,2025年度“机械工业科学技术奖”获奖名单日前公示,福莱瑞达与太原科技大学联合研发的“多形态货物的智能抓取与装车技术及装备”项目
2025-11-10 07:19:00
江苏南京:以“智”赋“能”,南京AI军团点亮智能制造
建模降本、“鹰眼”护安全、机器人夜检地铁……以“智”赋“能”,南京AI军团点亮智能制造□南京日报/紫金山新闻记者 徐宁周容璇 实习生黄倩以“激光扫描+AI建模”
2025-11-10 08:00:00