• 我的订阅
  • 科技

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

类别:科技 发布时间:2023-03-16 17:00:00 来源:搜狐科技
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

出品 | 搜狐科技

作者 | 郑松毅

编辑 | 杨锦

3月16日,百度大语言模型、生成式AI产品文心一言正式发布,定位预训练生成式大预言模型,主要面向文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景。

会上,百度创始人、董事长兼首席执行官李彦宏通过问答演示展示了这五个场景下文心一言的表现。

相比昨日OpenAI最新推出的GPT-4大模型,文心一言的能力究竟如何?搜狐科技将百度在发布会上展示的问题,在GPT-4上进行了同题问答,希望能够直观地观察文心一言与GPT-4这两款大模型的水平与特色。

Q1.《三体》的作者是哪里人?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言的回答更为详细。

Q2.可以总结一下三体的核心内容吗?如果续写的话,可以从哪些角度出发?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:文心一言更多的从文学结构及符合中国逻辑的文学创作角度出发去寻找续写的方向,而GPT-4的思维更偏向于利用外星人等创造性话题凸显剧情的精彩。

Q3.如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起什么公司名字?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言是利用中文字义凸显中国的取名文化,而ChatGPT-4更多的是基于英文的词义特点体现取名文化。

Q4.下面我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果笼子里有9个头,40只脚,应该有多少只鸡,多少只兔子?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:虽然文言一心和ChatGPT-4都能识别出本题目有错,但看起来ChatGPT-4将错误点讲解的更为详细,有利于题目创作者更快的发现问题所在。

把Q4的问题更正后:下面我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果笼子里有9个头,30只脚,应该有多少只鸡,多少只兔子?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言对这个问题回答的是正确的结果,而ChatGPT-4给出的是错误答案。可见文心一言对于复杂问题的计算能力优于GPT-4。

Q5. 请用洛阳纸贵四个字写一首藏头诗?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

ChatGPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言对于中文的理解力及创造能力优于GPT-4。

从测试结果中可以发现,百度文心一言的对话、计算能力及文本创作能力似乎并不逊于GPT4,相较于主要基于外国数据库训练的GPT-4,百度文心一言在中文语境下的确更有优势。

不过,需要指出的是,百度在发布会上做文心一言能力展示时,有些问题尚未描述完结果就已出现,更像是提前录制好的“DEMO”,而非现场实测。

“不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。”

发布会上,李彦宏坦言,自己测试后感觉还是有很多不完美的地方。李彦宏在整个发布过程中也明显可以看出紧张情绪。文心一言发布后,港股百度集团股价盘中走低,一度跌近10%。

据了解,百度将于即日起开启文心一言的内测,首批用户可以通过邀请测试码体验,后续搜狐科技也将带来更为深入的实测对比。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-16 18:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...洛阳纸贵的含义、对应的经济学理论,还以此创作了一首藏头诗。李彦宏表示,文心一言具备中文领域最先进的自然语言处理能力,但他也坦言目前对英文语种、代码场景的训练还不够多,表现还不
2023-03-17 10:00:00
体验报告来了!记者亲测百度“文心一言”
...”吧。之后,记者让文心一言写一首“祝你生日快乐”的藏头诗。这次表现不俗,在10秒左右就完成了,并实现了押韵。李彦宏认为,“藏头诗”很考验AI对中文和中国文化的理解,能比较清楚
2023-03-17 14:00:00
搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
...食制作方法和种草文案,另外还有可供娱乐的夸夸达人、藏头诗。在灵感发现的Tab里,有包括日常工作、营销、编程、生活、角色扮演、娱乐等多个不同大类,在场景设置以及指令的预设推荐中
2023-09-15 13:35:00
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
...计算能力、推理能力等方面为大家带来文心一言的深度真实测评!中文理解能力1.“今朝牙里相,老重光,老地方,吾请侬切饭哦”,这句话是哪个地方方言,什么意思?文心一言回答:总结:文
2023-03-17 10:00:00
文心一言率先落地,百度能否把握大模型产业化先机?
...理解方面,能理解“洛阳纸贵”背后的经济学原理、写出藏头诗等。多模态生成能力方面,可以根据输入的文本,生成图片或者是视频。具体的商业化方面,据悉,文心一言目前已经接入各行各业,
2023-07-06 18:00:00
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...文心一言还根据李彦宏的要求写出了一首包含洛阳纸贵的藏头诗。从理解“洛阳纸贵”到理解“藏头诗”,文心一言充分体现了对中文文本的理解能力。对于当下的生成式AI产品来讲,解读问题中
2023-03-17 09:00:00
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文
2024-03-23 14:00:00
\\\
...大模型。MathGPT是否意味着“AI家教”成为可能?搜狐科技实测后发现MathGPT能够顺利完成小学试卷并且给出清晰的解答
2023-08-28 15:17:00
百度文心一言发布会详细纪要
...求定律,就是物以稀为贵”。最后“用洛阳纸贵来写一首藏头诗”,回答“洛阳城里春光好,阳燕无双不负赏。纸贵漫天诗词赋,贵比黄金乐未央”。所以看到文心一言中文的理解能力,对中国文化
2023-03-17 12:00:00
更多关于科技的资讯: