• 我的订阅
  • 科技

五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半

类别:科技 发布时间:2023-06-08 21:00:00 来源:搜狐科技

出品 | 搜狐科技、搜狐教育

一年一度高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。AI大模型数学功底到底如何?比人类“聪明”吗?搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中,搜狐科技选取了高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半

测试结果显示,这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题,正确率50%。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。

360智脑和通义千问则“全军覆没”,一道题也没答对,交了白卷。

五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半

值得一提的是,昨天搜狐科技也用五款大语言模型产品,对高考作文全国卷(甲)进行了测试,并邀请了5位语文名师打分。

打分结果显示,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题,对大模型能力考察的维度并不尽相同。但巧合的是,不擅长写作文的360智脑和通义千问,似乎也不擅长做数学题。

通过这两次高考题测试,也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”,那么360智脑和通义千问则是妥妥的“学渣”。

五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半

附测试中使用的高考数学题题目:

1.不等式|x-2|<1的解集为__

2.a=(2,3),b=(-1,2),则a·b=__

3.首项为3,公比为2的等比数列的前六项和S6=__

4.tanA=3,tan2A=__

5.f(x)={2^xx>0;1,x≤0}的值域为__

6.复数z=1-i,则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π,则m=__

8.三角形的三边长为a=4,b=5,c=6,则sinA=__

9.某地一年四个季度的GDP(亿元),第一季度GDP为232,第四季度GDP为241,且四个季度的GDP逐季度增长,中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0,正数k的最大值为__返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-08 21:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI大模型也高考?成绩单出来了,星火综合第一
...一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。而在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首
2024-06-12 09:29:00
阿里云推新 “杠”上讯飞
来源:企业供图“这不降维battle讯飞吗?”昨日,在朋友圈一张通义听悟的专属口令福利海报下,一位媒体工作者留言道。彼时在粤港湾大湾区的广州,阿里云CTO周靖人对通义听悟给出了如
2023-06-02 17:45:00
...,使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、月之暗面Kimi等作为“考生”,围绕“大模型高考测试”得出了一系列结果,为人们更好地了解大模型
2024-06-26 07:26:00
科大讯飞业界首推永久免费大模型,讯飞星火Lite今起免费用
大皖新闻讯 5月22日,科大讯飞宣布,讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放,讯飞星火Pro/Max API低至0
2024-05-22 14:29:00
看完讯飞星火发布会后,我看到了国产大模型的未来
...司必须参加的一场大考。身为“人工智能国家队”的科大讯飞,自然不会错过这样一场盛宴。5月6日,科大讯飞在合肥市滨湖会展中心举行了讯飞“星火”认知大模型成果发布会,科大讯飞董事长
2023-05-08 09:11:00
科大讯飞、阿里云、腾讯打价格战,大模型厂商“卷”起来
...争愈演愈烈,如今多个品牌正掀起价格战。5月22日,科大讯飞宣布,讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放
2024-05-23 13:42:00
大模型应用疯狂加速,洗牌却在静悄悄进行了
...的腾讯混元大模型,一亮相便“秀”起了“肌肉”,科大讯飞与华为合作发布“星火一体机”,进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来,正推动整个“大模型+”应
2023-10-07 15:24:00
告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!
...前言:面向用户使用场景 打造高效的生产力工具6月9日,讯飞星火大模型V1.5正式亮相,时隔一个月后,星火大模型的各项能力获得了持续的提升,此次更新的重点正是突破开放式问答、多
2023-06-15 22:00:00
科大讯飞背上抄袭OpenAI的骂名,冤吗?
...时代,不同的思考模式和产品形式。处于巨变前夜,科大讯飞表态在10月底,新发布的星火大模型会追上ChatGPT的发言
2023-05-11 16:57:00
更多关于科技的资讯: