• 我的订阅
  • 科技

AI大模型也高考?成绩单出来了,星火综合第一

类别:科技 发布时间:2024-06-12 09:29:00 来源:盘点科技

高考结束,高三学子们成功卸下重担,该玩的玩,寒窗苦读12年迎接首个冲,充满自由气息的假期。但是在这个AI元年,另一支“高考队伍”加入了这场大考中,那就是国产人工智能,格外队伍引人注目!!

在这场特殊的高考中,包括搜狐科技、潇湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下:

AI大模型也高考?成绩单出来了,星火综合第一

首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。

AI大模型也高考?成绩单出来了,星火综合第一

给讯飞星火打出“全场最高分”56分的阅卷老师表示:“本文观点清晰,论述集中且层层推进,很多句子都简洁有力,颇有思想性。如果是某个学生写的,无疑是难得的佳作。”另外,从网友的热门评论中也能看出讯飞星火摘得高分的原因。

网友@2024:感觉星火好点,更像作文,有些更像回答问题。

网友@烟花绽放的节日:讯飞星火更有高考味。

接下来是数学科目的较量。在搜狐科技的数学评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。

AI大模型也高考?成绩单出来了,星火综合第一

在量子位的高考数学评测中,虽然没有给出详细成绩单,但展示了各家大模型详细的解题思路,交由网友打分,通过网友的投票打分可以看出,讯飞星火的“识图+解数学题”能力收到了最高认可,位居其后的分别是Kimi、通义千问、文心一言、豆包等。

AI大模型也高考?成绩单出来了,星火综合第一

最后是高考物理的测试。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,即正确率为28.6%;豆包、天工、智谱清言正确率为1/2,即正确率为14.3%。

AI大模型也高考?成绩单出来了,星火综合第一

综合以上媒体在作文、数学、物理三门科目的成绩,我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名,通义千问、文心一言分别位列第二、第三名,而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

第一名:52.49 讯飞星火

第二名:46.08 通义千问

第三名:37.67 文心一言

第四名:34.68 Kimi

第五名:33.57 字节豆包

第六名:31.92 海螺AI

第七名:30.61 腾讯元宝

第八名:30.28 智谱清言

第九名:21.56 百川百小应

尽管评测方式可能不够严谨科学,但这次大模型高考无疑展示了国产人工智能在多个学科的优秀表现和长足进步,尤其是讯飞星火的表现堪称“文理兼修”!期待国产大模型再接再厉,在明年的高考中取得更加出色的成绩!

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-12 13:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo
2024-10-24 16:48:00
...用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、月之暗面Kimi等作为“考生”,围绕“大模型高考测试”得出了一系列结果,为人们更好地了解大模型产品
2024-06-26 07:26:00
讯飞星火V4.0将于6月下旬发布 刘庆峰详解五大战略打赢大模型之战
...市场。刘庆峰通过多项行业和产品应用,亮出目前大模型成绩单。据了解,目前中国汽车出口的多语种技术,几乎全部由科大讯飞提供。奇瑞、蔚来、广汽、一汽等国产品牌都在和讯飞合作,国际汽
2024-06-12 20:17:00
...1名;二段线以上30名,这是“树人计划”今年高考优异的成绩单。 永嘉“树人计划”的发起,源于永嘉籍旅美侨领、温州叶康松慈善基金会创始人叶康松先生,他出资600万元,为期10年
2023-08-23 14:06:00
高考忙坏了大厂大模型
...心一言(百度)、通义千问(阿里)、钉钉、360 智脑、星火(科大讯飞)、天工(昆仑万维)、金山文档 AI、必应 AI(微软)也展示了自家在AI写作上能力。 钉钉斜杠“/”也
2023-06-08 11:38:00
AI模型火拼,科大讯飞选择做“老实人”?
...其盈利能力的质疑上。实际上,科大讯飞今年发出的两份成绩单都不算好看。2023年科大讯飞营收196亿元,同比增长4.4%
2024-06-30 22:21:00
预计24日晚8点后可查高考成绩
...日6:00至6月30日16:00,携带本人身份证、高考准考证、高考成绩单、户口簿等前往江苏警官学院浦口校区(南京市浦口区石佛寺三宫48号),参加由省公安厅与公安院校共同组织的
2023-06-11 01:05:00
五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半
...10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上差异显著。最“聪明”的讯飞
2023-06-08 21:00:00
聚焦北京车展丨中国汽车出海十强企业 八家获“安徽AI”助力
...,连续21年保持中国品牌乘用车出口第一。在奇瑞的出海成绩单上,也有科大讯飞的贡献。在智能语音交互方面,科大讯飞是奇瑞最重要的合作伙伴。2024年1月,首个搭载讯飞星火大模型的
2024-04-27 20:02:00
更多关于科技的资讯: