• 我的订阅
  • 科技

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

类别:科技 发布时间:2023-03-16 17:00:00 来源:搜狐科技
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

出品 | 搜狐科技

作者 | 郑松毅

编辑 | 杨锦

3月16日,百度大语言模型、生成式AI产品文心一言正式发布,定位预训练生成式大预言模型,主要面向文学创作、商业文案创作、数理推算、中文理解和多模态生成五个场景。

会上,百度创始人、董事长兼首席执行官李彦宏通过问答演示展示了这五个场景下文心一言的表现。

相比昨日OpenAI最新推出的GPT-4大模型,文心一言的能力究竟如何?搜狐科技将百度在发布会上展示的问题,在GPT-4上进行了同题问答,希望能够直观地观察文心一言与GPT-4这两款大模型的水平与特色。

Q1.《三体》的作者是哪里人?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言的回答更为详细。

Q2.可以总结一下三体的核心内容吗?如果续写的话,可以从哪些角度出发?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:文心一言更多的从文学结构及符合中国逻辑的文学创作角度出发去寻找续写的方向,而GPT-4的思维更偏向于利用外星人等创造性话题凸显剧情的精彩。

Q3.如果要成立一个用大模型服务中小企业数字化升级的科技服务公司,可以起什么公司名字?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言是利用中文字义凸显中国的取名文化,而ChatGPT-4更多的是基于英文的词义特点体现取名文化。

Q4.下面我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果笼子里有9个头,40只脚,应该有多少只鸡,多少只兔子?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:虽然文言一心和ChatGPT-4都能识别出本题目有错,但看起来ChatGPT-4将错误点讲解的更为详细,有利于题目创作者更快的发现问题所在。

把Q4的问题更正后:下面我们来玩一个鸡兔同笼的游戏。1只鸡有2只脚1个头,1只兔子有4只脚1个头。那么,如果笼子里有9个头,30只脚,应该有多少只鸡,多少只兔子?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

GPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言对这个问题回答的是正确的结果,而ChatGPT-4给出的是错误答案。可见文心一言对于复杂问题的计算能力优于GPT-4。

Q5. 请用洛阳纸贵四个字写一首藏头诗?

百度文心一言答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

ChatGPT-4答案:

搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?

总结:百度文心一言对于中文的理解力及创造能力优于GPT-4。

从测试结果中可以发现,百度文心一言的对话、计算能力及文本创作能力似乎并不逊于GPT4,相较于主要基于外国数据库训练的GPT-4,百度文心一言在中文语境下的确更有优势。

不过,需要指出的是,百度在发布会上做文心一言能力展示时,有些问题尚未描述完结果就已出现,更像是提前录制好的“DEMO”,而非现场实测。

“不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。”

发布会上,李彦宏坦言,自己测试后感觉还是有很多不完美的地方。李彦宏在整个发布过程中也明显可以看出紧张情绪。文心一言发布后,港股百度集团股价盘中走低,一度跌近10%。

据了解,百度将于即日起开启文心一言的内测,首批用户可以通过邀请测试码体验,后续搜狐科技也将带来更为深入的实测对比。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-16 18:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...洛阳纸贵的含义、对应的经济学理论,还以此创作了一首藏头诗。李彦宏表示,文心一言具备中文领域最先进的自然语言处理能力,但他也坦言目前对英文语种、代码场景的训练还不够多,表现还不
2023-03-17 10:00:00
体验报告来了!记者亲测百度“文心一言”
...”吧。之后,记者让文心一言写一首“祝你生日快乐”的藏头诗。这次表现不俗,在10秒左右就完成了,并实现了押韵。李彦宏认为,“藏头诗”很考验AI对中文和中国文化的理解,能比较清楚
2023-03-17 14:00:00
搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
...食制作方法和种草文案,另外还有可供娱乐的夸夸达人、藏头诗。在灵感发现的Tab里,有包括日常工作、营销、编程、生活、角色扮演、娱乐等多个不同大类,在场景设置以及指令的预设推荐中
2023-09-15 13:35:00
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
...计算能力、推理能力等方面为大家带来文心一言的深度真实测评!中文理解能力1.“今朝牙里相,老重光,老地方,吾请侬切饭哦”,这句话是哪个地方方言,什么意思?文心一言回答:总结:文
2023-03-17 10:00:00
文心一言率先落地,百度能否把握大模型产业化先机?
...理解方面,能理解“洛阳纸贵”背后的经济学原理、写出藏头诗等。多模态生成能力方面,可以根据输入的文本,生成图片或者是视频。具体的商业化方面,据悉,文心一言目前已经接入各行各业,
2023-07-06 18:00:00
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...文心一言还根据李彦宏的要求写出了一首包含洛阳纸贵的藏头诗。从理解“洛阳纸贵”到理解“藏头诗”,文心一言充分体现了对中文文本的理解能力。对于当下的生成式AI产品来讲,解读问题中
2023-03-17 09:00:00
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文
2024-03-23 14:00:00
实测升级后的文小言:吉卜力风周边一键生成,全新语音大模型、图片问答齐亮相
...尖模型能力,做出更强大、更简单的AI产品。” 搜狐科技实测显示,若切换至文心大模型并指定文心X1来解决问题,其优势在于灵活调用工具。以“设计吉卜力风的帆布包”为例,文心X1首
2025-03-31 20:04:00
\
...大模型。MathGPT是否意味着“AI家教”成为可能?搜狐科技实测后发现MathGPT能够顺利完成小学试卷并且给出清晰的解答
2023-08-28 15:17:00
更多关于科技的资讯:
彩电行业唯一 海信视像荣膺工信部“首批质量管理能力高等级企业”
日前,工业和信息化部正式公布了“首批质量管理能力高等级企业名单”,海信视像科技股份有限公司以覆盖研发、采购、生产、销售
2025-08-26 21:25:00
产业链上的山东好品牌|一诺威:深挖聚氨酯产业技术“护城河”
齐鲁晚报·齐鲁壹点 张文珂8月26日,淄博市人民政府新闻办公室召开“产业链上的山东好品牌”淄博聚氨酯产业链记者见面会,邀请市传统产业发展中心
2025-08-26 21:50:00
8月22日至24日,2025中国算力大会在山西大同举行。“算力中国·创新成果展示”山西算力产业展示区全方位展示了山西打造全国算力高地的新成就
2025-08-26 06:47:00
今年夏天,“懒人经济”叠加“清凉经济”,高温不仅带火了以空调、冰箱为主的家电产品,更带火了像多筒洗衣机、制冰冰箱、家用制冰机等新家电
2025-08-26 07:41:00
厦门网讯(厦门日报记者 李晓平)在人工智能深度赋能千行百业、重塑生产生活各领域应用场景的当下,今年来,科华数据、国投智能
2025-08-25 08:54:00
英科医疗上榜TopBrand 2025中国品牌500强 位居细分行业首位
近日,《TopBrand 2025中国品牌500强榜单》在2025(第十九届)中国品牌节上正式发布,英科医疗以196.18亿元品牌价值位列第373位
2025-08-25 08:59:00
健康领跑品质卓越 飞利浦空调又获三大奖项
8月22日,以“创异破局 智启新程”为主题的2025-2026中国空调行业高峰论坛在长春举行,本次论坛汇聚行业精英,旨在探讨行业良性健康发展
2025-08-25 09:24:00
8月15日至19日,以“互通互助互利 共商共建共享”为主题的第十五届新疆喀什·中亚南亚商品交易会(以下简称“喀交会”)在喀什国际会展中心盛大举办
2025-08-25 10:33:00
进入7月以来,北京经历了数场分散性降雨,气温较高,湿度较大。气象监测显示,7月北京相对湿度一度冲高至82%。不少北京市民表示
2025-08-25 10:33:00
养老机器人产品形态日益丰富
本报记者 赵 曦 □ 唐 瑞8月20日,工业和信息化部发布通知,征集2025年度中小企业人工智能典型应用场景。通知要求
2025-08-25 10:34:00
上午9点,刚从湘潭某高校通信工程专业毕业的李明打开手机上的“零障碍”平台,一条精准推送的岗位信息映入眼帘——本地一家高新技术企业的见习工程师职位
2025-08-25 10:34:00
莱州市商务局:莱州市举办外贸政策宣讲会
大众网记者 孙建峰 烟台报道为推动莱州本地优势产业与外贸政策深度融合,搭建跨境电商行业交流合作平台,近日,2025莱州外贸政策宣讲会(亚马逊专场)在莱州市电商产业园胜利召开
2025-08-25 10:51:00
“云聚鸢都・赋能潍企”潍企云品牌发布会8月26日启幕
鲁网8月25日讯为深入贯彻国家推动制造业数字化转型、发展新质生产力的战略部署,加速潍坊市中小企业数字化、智能化转型进程
2025-08-25 11:02:00
推动新能源产业高质量发展,是践行绿色低碳发展理念、构建现代化经济体系的重要路径。国家税务总局新泰市税务局紧盯新能源汽车产业发展痛点与需求
2025-08-25 11:08:00
淘宝闪购饿了么官宣外卖行业首套制服,百万骑士将免费换新
外卖行业第一套制服今天由淘宝闪购饿了么正式官宣,网友热议称,新制服既是整个行业升级的重要标志之一,也意味着社会各界对骑士这一职业的全新认同
2025-08-25 11:08:00