我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半

类别：科技发布时间：2023-06-08 21:00:00 来源：搜狐科技

出品 | 搜狐科技、搜狐教育

一年一度高考季，高考试题是大众关注的焦点，也成为了AI能力的试金石。AI大模型数学功底到底如何？比人类“聪明”吗？搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。

在测试中，搜狐科技选取了高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示，这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题，正确率50％。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

360智脑和通义千问则“全军覆没”，一道题也没答对，交了白卷。

值得一提的是，昨天搜狐科技也用五款大语言模型产品，对高考作文全国卷（甲）进行了测试，并邀请了5位语文名师打分。

打分结果显示，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。360智脑和通义千问得分最低。

虽然语文作文题和数学计算题，对大模型能力考察的维度并不尽相同。但巧合的是，不擅长写作文的360智脑和通义千问，似乎也不擅长做数学题。

通过这两次高考题测试，也能从侧面反应出各家大模型的能力确实是“参差不齐”。如果ChatGPT、文心一言、讯飞星火是“学霸”，那么360智脑和通义千问则是妥妥的“学渣”。

附测试中使用的高考数学题题目：

1.不等式|x-2|<1的解集为__

2.a=(2,3)，b=(-1,2)，则a·b=__

3.首项为3，公比为2的等比数列的前六项和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域为__

6.复数z=1-i，则|1+iz|=__

7.圆的方程x^2+y^2-4y-m=0的面积为π，则m=__

8.三角形的三边长为a=4，b=5，c=6，则sinA=__

9.某地一年四个季度的GDP(亿元)，第一季度GDP为232，第四季度GDP为241，且四个季度的GDP逐季度增长，中位数、平均数相等。则该地一年的GDP为__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正数k的最大值为__返回搜狐，查看更多

责任编辑：

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-06-08 21:45:08

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于讯飞,通义,星火,阿里,模型,数学的资讯：

AI大模型也高考？成绩单出来了，星火综合第一

...一言以超过50分的成绩位居前列，智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。而在潇湘晨报的“AI写作”评测中，讯飞星火不仅平均分位居首

2024-06-12 09:29:00

阿里云推新 “杠”上讯飞

来源：企业供图“这不降维battle讯飞吗？”昨日，在朋友圈一张通义听悟的专属口令福利海报下，一位媒体工作者留言道。彼时在粤港湾大湾区的广州，阿里云CTO周靖人对通义听悟给出了如

2023-06-02 17:45:00

“AI考生”闯关高考，谁是最会做题大模型？

...，使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、月之暗面Kimi等作为“考生”，围绕“大模型高考测试”得出了一系列结果，为人们更好地了解大模型

2024-06-26 07:26:00

科大讯飞业界首推永久免费大模型，讯飞星火Lite今起免费用

大皖新闻讯 5月22日，科大讯飞宣布，讯飞星火API能力正式免费开放。其中，讯飞星火Lite API永久免费开放，讯飞星火Pro/Max API低至0

2024-05-22 14:29:00

看完讯飞星火发布会后，我看到了国产大模型的未来

...司必须参加的一场大考。身为“人工智能国家队”的科大讯飞，自然不会错过这样一场盛宴。5月6日，科大讯飞在合肥市滨湖会展中心举行了讯飞“星火”认知大模型成果发布会，科大讯飞董事长

2023-05-08 09:11:00

科大讯飞、阿里云、腾讯打价格战，大模型厂商“卷”起来

...争愈演愈烈，如今多个品牌正掀起价格战。5月22日，科大讯飞宣布，讯飞星火API能力正式免费开放。其中，讯飞星火Lite API永久免费开放

2024-05-23 13:42:00

大模型应用疯狂加速，洗牌却在静悄悄进行了

...的腾讯混元大模型，一亮相便“秀”起了“肌肉”，科大讯飞与华为合作发布“星火一体机”，进一步把大模型端侧应用摆在了台面上。一波接一波的行业浪潮席卷而来，正推动整个“大模型+”应

2023-10-07 15:24:00

告别搜索引擎！讯飞星火认知大模型评测：改变人机交互方式还能

...前言：面向用户使用场景打造高效的生产力工具6月9日，讯飞星火大模型V1.5正式亮相，时隔一个月后，星火大模型的各项能力获得了持续的提升，此次更新的重点正是突破开放式问答、多

2023-06-15 22:00:00

科大讯飞背上抄袭OpenAI的骂名，冤吗？

...时代，不同的思考模式和产品形式。处于巨变前夜，科大讯飞表态在10月底，新发布的星火大模型会追上ChatGPT的发言

2023-05-11 16:57:00

更多关于科技的资讯：

7499元“全国人民都买得起”：第一批华为Pura X快速卖

2025-03-23 15:31:00

我国自主研发首套重载铁路智能调车系统正式投运

2025-03-23 15:54:00

38.98万起！比亚迪腾势旗舰级SUV N9正式开启交付

2025-03-23 16:01:00

2025中桦神鸟AI项目启动会在贵阳圆满落幕

2025-03-23 16:16:00

史无前例！韩路开小米SU7 Ultra速通珠穆朗玛峰雷军：

2025-03-23 16:31:00

跃居全球第一！2024年上海港汽车吞吐量突破363万台

2025-03-23 16:31:00

三星李在镕造访小米与雷军合影！雷军曾亲自给三星高管赔罪饭局

2025-03-23 17:01:00

新型轻量形状记忆合金问世：超弹性覆盖400摄氏度温度变化

2025-03-23 17:01:00

2025年第二届“中国酒·向心而生”——杯中真言·行业破局探

2025-03-23 17:17:00

17.98万元起！2025款广汽本田雅阁正式上市：依旧搭载1

2025-03-23 17:31:00

台积电嘉义封测厂3年后量产：年薪70万招技术员

2025-03-23 17:31:00

极氪出海已成了吗？

2025-03-23 17:36:00

头条订阅服务

五大模型解高考数学：阿里通义千问、360智脑10题全错得0分；讯飞星火答对一半