• 我的订阅
  • 科技

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

类别:科技 发布时间:2023-03-16 17:00:00 来源:搜狐科技
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

出品 | 搜狐科技

作者 | 郑松毅

编辑 | 杨锦

3月16日,百度大语言模型、生成式AI产品文心一言正式发布,定位预训练生成式大预言模型,主要面向文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景。

会上,百度创始人、董事长兼首席执行官李彦宏通过问答演示展示了这五个场景下文心一言的表现。

相比昨日OpenAI最新推出的GPT-4大模型,文心一言的能力究竟如何?搜狐科技将百度在发布会上展示的问题,在GPT-4上进行了同题问答,希望能够直观地观察文心一言与GPT-4这两款大模型的水平与特色。

Q1.《三体》的作者是哪里人?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言的回答更为详细。

Q2.可以总结一下三体的核心内容吗?如果续写的话,可以从哪些角度出发?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:文心一言更多的从文学结构及符合中国逻辑的文学创作角度出发去寻找续写的方向,而GPT-4的思维更偏向于利用外星人等创造性话题凸显剧情的精彩。

Q3.如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起什么公司名字?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言是利用中文字义凸显中国的取名文化,而ChatGPT-4更多的是基于英文的词义特点体现取名文化。

Q4.下面我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果笼子里有9个头,40只脚,应该有多少只鸡,多少只兔子?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:虽然文言一心和ChatGPT-4都能识别出本题目有错,但看起来ChatGPT-4将错误点讲解的更为详细,有利于题目创作者更快的发现问题所在。

把Q4的问题更正后:下面我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果笼子里有9个头,30只脚,应该有多少只鸡,多少只兔子?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言对这个问题回答的是正确的结果,而ChatGPT-4给出的是错误答案。可见文心一言对于复杂问题的计算能力优于GPT-4。

Q5. 请用洛阳纸贵四个字写一首藏头诗?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

ChatGPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言对于中文的理解力及创造能力优于GPT-4。

从测试结果中可以发现,百度文心一言的对话、计算能力及文本创作能力似乎并不逊于GPT4,相较于主要基于外国数据库训练的GPT-4,百度文心一言在中文语境下的确更有优势。

不过,需要指出的是,百度在发布会上做文心一言能力展示时,有些问题尚未描述完结果就已出现,更像是提前录制好的“DEMO”,而非现场实测。

“不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。”

发布会上,李彦宏坦言,自己测试后感觉还是有很多不完美的地方。李彦宏在整个发布过程中也明显可以看出紧张情绪。文心一言发布后,港股百度集团股价盘中走低,一度跌近10%。

据了解,百度将于即日起开启文心一言的内测,首批用户可以通过邀请测试码体验,后续搜狐科技也将带来更为深入的实测对比。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-16 18:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...洛阳纸贵的含义、对应的经济学理论,还以此创作了一首藏头诗。李彦宏表示,文心一言具备中文领域最先进的自然语言处理能力,但他也坦言目前对英文语种、代码场景的训练还不够多,表现还不
2023-03-17 10:00:00
体验报告来了!记者亲测百度“文心一言”
...”吧。之后,记者让文心一言写一首“祝你生日快乐”的藏头诗。这次表现不俗,在10秒左右就完成了,并实现了押韵。李彦宏认为,“藏头诗”很考验AI对中文和中国文化的理解,能比较清楚
2023-03-17 14:00:00
搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
...食制作方法和种草文案,另外还有可供娱乐的夸夸达人、藏头诗。在灵感发现的Tab里,有包括日常工作、营销、编程、生活、角色扮演、娱乐等多个不同大类,在场景设置以及指令的预设推荐中
2023-09-15 13:35:00
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
...计算能力、推理能力等方面为大家带来文心一言的深度真实测评!中文理解能力1.“今朝牙里相,老重光,老地方,吾请侬切饭哦”,这句话是哪个地方方言,什么意思?文心一言回答:总结:文
2023-03-17 10:00:00
文心一言率先落地,百度能否把握大模型产业化先机?
...理解方面,能理解“洛阳纸贵”背后的经济学原理、写出藏头诗等。多模态生成能力方面,可以根据输入的文本,生成图片或者是视频。具体的商业化方面,据悉,文心一言目前已经接入各行各业,
2023-07-06 18:00:00
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...文心一言还根据李彦宏的要求写出了一首包含洛阳纸贵的藏头诗。从理解“洛阳纸贵”到理解“藏头诗”,文心一言充分体现了对中文文本的理解能力。对于当下的生成式AI产品来讲,解读问题中
2023-03-17 09:00:00
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文
2024-03-23 14:00:00
实测升级后的文小言:吉卜力风周边一键生成,全新语音大模型、图片问答齐亮相
...尖模型能力,做出更强大、更简单的AI产品。” 搜狐科技实测显示,若切换至文心大模型并指定文心X1来解决问题,其优势在于灵活调用工具。以“设计吉卜力风的帆布包”为例,文心X1首
2025-03-31 20:04:00
\
...大模型。MathGPT是否意味着“AI家教”成为可能?搜狐科技实测后发现MathGPT能够顺利完成小学试卷并且给出清晰的解答
2023-08-28 15:17:00
更多关于科技的资讯:
上市“后备军”,钟楼+2!
近日,江苏省科技厅公布2025年度省科技企业上市培育计划拟入库企业名单,常州市共5家企业入选,其中钟楼区有2家,分别是
2025-11-06 09:09:00
□南京日报/紫金山新闻记者何洁实习生杨久久“人工智能+”专项赛中荣获特等奖!11月3日,在第十九届“挑战杯”中国移动全国大学生课外学术科技作品竞赛中
2025-11-06 07:46:00
记者走基层|巧搭“数字积木” 智绘梦想花园
10月29日,承德图布斯科技集团有限公司技术人员正在调试设计图。 河北日报记者 陈宝云摄10月29日,在承德图布斯科技集团有限公司(以下简称“图布斯公司”)的研发中心
2025-11-05 08:12:00
□曹清华党的二十届四中全会提出,实施新时代立德树人工程,促进思政课堂和社会课堂有效融合,加强体育、美育、劳动教育,完善教育评价体系
2025-11-05 08:16:00
2025年沪江网校课程质量高于预期:退费无忧+承诺与践行一致!
一、沪江网校简介为沪江教育旗下品牌,沪江网校自 2009 年成立以来,始终聚焦外语学习者需求,提供网校一对一,凭借专业教学服务与多元课程体系
2025-11-05 14:45:00
(一)开篇引言行业背景与痛点:中国信息通信研究院《2025年数字营销发展趋势报告》显示,2024年我国生成式引擎优化(GEO)市场规模已达47亿元
2025-11-05 14:47:00
在智能体产业快步迈入规模化的当下,南京正以软件产业的深厚积淀、政策生态的精准培育、应用场景的丰富储备,抢占AI科技革命新高点前几天
2025-11-05 15:06:00
Openloong开源社区亮相ROSCon China 2025大会,为智能开源注入新活力
10月31日至11月1日,ROSCon China 2025在上海虹桥新华联索菲特大酒店成功举办。这一汇聚了全球ROS领域顶尖专家与开发者的年度盛会
2025-11-05 15:29:00
职场“反内卷”调研报告 干货多多
近日,智联招聘《职场“反内卷”调研报告》,探究职场人对于“反内卷”的真实态度与选择,了解企业的相应举措。今年“多家知名企业实施强制下班”的新闻冲上热搜
2025-11-05 15:32:00
鲁网11月5日讯“真没想到,资金难题这么快就解决了!东平农商银行的‘同心乐商贷’真是及时雨,我的蛋糕房终于要开起来了。”近日
2025-11-05 15:55:00
中国联通(青岛)智算中心DC1获评“2025年度国家绿色数据中心”
鲁网11月5日讯10月27日,工业和信息化部节能与综合利用司发布《2025年度国家绿色数据中心名单公示》,中国联通(青岛)智算中心DC1荣获“2025年度国家绿色数据中心”称号
2025-11-05 15:57:00
10月19日至20日,2025世界VR产业大会在南昌举行,来自全球VR领域的专家学者、领军企业和业界精英齐聚南昌,共同探讨VR与AI融合发展的新趋势
2025-11-05 17:44:00
语言、技能与数字化:培生亮相CACIE 2025,共筑未来教育新生态
2025年10月29日至11月1日,第26届中国国际教育年会(CACIE)在北京国家会议中心举行。全球终身学习公司培生(FTS: PSON
2025-11-05 18:00:00
找对 “充电站”,心理从业者进阶不迷路!灵动生活集团幸福心理商学苑全维护航
“考下资格证却接不到个案,能做咨询却不懂怎么运营工作室”—— 这是国内超 70% 心理从业者入行后都会遇到的 “成长困境”
2025-11-05 18:01:00
第二十届福州市青少年机器人竞赛圆满落幕 近3500名青少年点燃科创热情
福州新闻网11月5日讯(记者 徐昕昀 文/图)11月2日,随着最后一场机器人竞技挑战赛的终场指令在福州高新区青少年活动中心响起
2025-11-05 18:05:00