• 我的订阅
  • 科技

体验报告来了!记者亲测百度“文心一言”

类别:科技 发布时间:2023-03-17 14:00:00 来源:金融界

今日百度召开文心一言新闻发布会,宣布开启邀请测试。《科创板日报》记者第一时间拿到了文心一言的内测码,实际测试了文心一言的效果。整体而言,百度文心一言能够基本完成发布会上所演示的问题回答和图片生成。但在某些问题理解上仍有待进一步完善。

首先,《科创板日报》提出了一个比较常见的问题:你和chatGPT的区别是什么?

体验报告来了!记者亲测百度“文心一言”

可以看到,文心一言的中文组织能力表现不错,能够语句通顺地问答完整。

随后,我们又问了关于国内涉足预训练大模型的公司有哪些?文心一言回答得也较为全面。

体验报告来了!记者亲测百度“文心一言”

记者尝试了一个需要涉及信息搜索的问题。

特斯拉在国内过去五个月、过去一年的销量是多少?文心一言的答案是:

而记者直接通过百度搜索获得答案是:乘联会发布的统计数据显示,2023年1月份,特斯拉中国销量达66051辆,环比增长18%;月出口39208辆。

文心一言没有能够抓取到正确的数据来源,仍有待进一步优化。

在发布会现场,百度重点展示了文心一言在五个场景下的综合能力。根据其演示的demo,文心一言不仅具备了文学创作、商业文案创作、数理推算等大语言模型较常见的优势和能力,还表现出了中文理解、多模态生成能力。

《科创板日报》记者特地从这些方面进行了测试。

首先是文学创作,记者让其仿造三体风格写一篇800字的科幻小说。

文心一言的回答是:

体验报告来了!记者亲测百度“文心一言”

之后,记者让其编写一首与小黄鸭有关的儿歌,文心一言在十几秒时间内完成了。

体验报告来了!记者亲测百度“文心一言”

对于打工人来说,写工作总结是一件令人头疼的事。记者也为此提问了文心一言。

体验报告来了!记者亲测百度“文心一言”

从答案来看,似乎是程序员的工作总结,写得较为工整。

然后,记者试了试文心一言在商业文案创作方向的能力。

我们让文心一言写一段针对双11促销的童装营销文案,并设定了“用料健康、性价比高”的关键词。

体验报告来了!记者亲测百度“文心一言”

显然,文心一言理解了关键词的含义,并且把“用料健康、性价比高”融合在了文案之中。

记者继续让其生成针对AI医疗公司的中秋节海报文案。

从答案来看,文心一言能够准确地理解问题的中文含义,只是文采仍有待提高。

记者又让它对一家大数据和商业智能公司起名。

体验报告来了!记者亲测百度“文心一言”

文心一言给出的公司起名,只能说非常地“望文生义”吧。

之后,记者让文心一言写一首“祝你生日快乐”的藏头诗。

这次表现不俗,在10秒左右就完成了,并实现了押韵。

体验报告来了!记者亲测百度“文心一言”

李彦宏认为,“藏头诗”很考验AI对中文和中国文化的理解,能比较清楚地展示了文心一言在中文上的优势。“不过,相对应的,一言目前对英文语种、代码场景的训练还不够多,表现还不够好,接下来我们还要加紧训练,不断完善这些能力。”

接着,记者希望考一下文心一言的数理逻辑推算能力,在发布会上,文心一言顺利答对了鸡兔同笼的经典题目。

《科创板日报》从网络上找了几道小升初数学题目。

比如:鸡和免放在一只笼子里,上面有 29 个头,下面有 92 只脚。问: 笼中有鸡、兔各多少只?

文心一言的答案是12只鸡,17只兔,与标准答案一致。

但对于其他数学题,文心一言则有失误。

2分和5分的硬币共36 枚,共值 99分。问:两种硬币各多少枚?

正确答案是2分27枚,5分9枚。但文心一言没有算对。

某次数学竞赛共20道题,评分标准为每做对一题得5分,每做错或不做一题扣1分。小华参加了这次竞赛,得了64分。问:小华做对几道题?

体验报告来了!记者亲测百度“文心一言”

正确答案应该是14题,而文心一言得出了16题。

李彦宏在发布会上表示,文心一言已具备了一定的思维能力,能够学会数学推演及逻辑推理这类相对复杂任务。但现阶段准确率还不是100%,还需要给它更多的时间来学习和成长。

李彦宏还在现场演示了多模态生成方向的Demo,>;比如为2023世界智能交通大会创作一张海报。以下为演示效果:

体验报告来了!记者亲测百度“文心一言”

在实际测试中,文心一言似乎还不具备为大会生成海报的功能,只是给出了一些设计建议。

体验报告来了!记者亲测百度“文心一言”

不过,对于带有关键词的简单图片,文心一言完成得还不错。

体验报告来了!记者亲测百度“文心一言”
体验报告来了!记者亲测百度“文心一言”

生成的图片效果基本达标,并且速度极快,只需十几秒左右。

此前,有多名互联网大厂员工对《科创板日报》记者表示,已经开始用ChatGPT自动生成业务代码和重构代码。

于是,记者尝试了一下文心一言能否顺利写代码。

提问:我需要一段冒泡排序java代码

体验报告来了!记者亲测百度“文心一言”

提问:画椭圆形的JS脚本

体验报告来了!记者亲测百度“文心一言”

记者让程序员朋友检查了下,对方表示:粗略看上去没有问题,感觉以后会对程序员会是不错的辅助工具。

李彦宏表示,目前的文心一言版本,已经能够生成文字、图片和语音。“生成视频因为成本比较高,还没有对所有用户开放,未来我们会逐步接入。但是熟悉百家号创作的朋友,应该都体验过这个功能了,每天有几万篇文章通过这个能力转成视频内容在百度分发。”

李彦宏指出,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。

从记者的体验来看,文心一言已经能够较为流畅、准确地回答提问,但在一些问答场景上仍待优化。

李彦宏则在发布会上表示:整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。未来这段时间它一定会飞速发展,日新月异。

来源:财联社返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-17 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

本文转自:成都日报李彦宏发内部信:“文心一言”将与百度多个业务深度整合2月22日,百度发布了截至2022年12月31日的第四季度及全年未经审计的财务报告。报告数据显示,2022年
2023-02-23 04:47:00
文心一言开放 大模型开抢C端市场
...型从业者松了一口气。让科技圈人士大半夜沸腾的是百度文心一言正式面向公众开放的消息,紧接着百川智能宣布通过备案,开放公众服务。此外抖音、智谱AI、中科院、商汤、MiniMax、
2023-09-01 00:07:00
9月22日,率先向全社会全面开放的大语言模型文心一言发布了首份《文心一言用户使用报告》(以下简称《报告》),向外界披露文心一言用户群体的画像、使用习惯等内容。《报告》显示,文心一
2023-09-23 11:43:00
...型风口。11月1日,北京商报记者发现,百度生成式AI产品文心一言上线了面向用户的会员和联合会员服务,开通任意一种会员后,用户可体验最新发布的文心大模型4.0相关能力,非会员可
2023-11-02 00:18:00
红星资本局8月10日消息,日前,百度网盘基于文心大模型全面升级,推出“云一朵”智能助理,用户可通过“云一朵”快速搜索文件和视频、总结知识、翻译文档,甚至进行内容创作。据悉,百度网
2023-08-10 17:49:00
...记者 魏蔚)8月30日晚间,北京商报记者获悉,8月31日,文心一言将率先向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”体验。百度还将开放一批
2023-08-31 00:21:00
...型体验报告2.0》(以下简称报告)显示,讯飞星火、百度文心一言、商汤商量和智谱AI-ChatGLM均表现抢眼,AI大模型的发展为人类工作和生活的提质增效均带来了正向积极的影响
2023-08-12 18:18:00
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
...主流的拥有自主大模型的对话式AIGC移动应用产品,包括文心一言app、通义千问app、讯飞星火app、豆包app、天工app
2024-03-14 17:06:00
...度创始人、董事长兼首席执行官李彦宏表示,百度正在用文心大模型重构广告系统,包括生成式创意、生成式定向等服务,这些举措有望在四季度带来数亿元人民币的增量收入。李彦宏表示,采用A
2023-11-22 11:44:00
更多关于科技的资讯: