• 我的订阅
  • 科技

OpenAI 总裁:GPT-4 并不完美但却绝对与众不同

类别:科技 发布时间:2023-03-16 21:12:00 来源:浅语科技

人工智能研究公司OpenAI于昨日发布了备受期待的文本生成AI模型GPT-4。OpenAI联合创始人兼总裁格雷格・布罗克曼(GregBrockman)在接受采访时表示,GPT-4并不完美,但却绝对与众不同。

OpenAI 总裁:GPT-4 并不完美但却绝对与众不同

GPT-4在其前身GPT-3的基础上,在许多关键方面进行了改进,例如提供了更多真实的陈述,并允许开发人员更容易控制其风格和行为。从某种意义上说,GPT-4也是多模式的,因为它可以理解图像,能给照片添加注释,甚至详细描述照片中的内容。

但GPT-4也有严重的缺陷。就像GPT-3一样,该模型会产生“幻觉”(即模型聚合的文本与源文本无关或不够准确),并会犯下基本的推理错误。OpenAI在自己的博客上举了一个例子,GPT-4将“猫王”埃尔维斯・普雷斯利(ElvisPresley)描述为“演员的儿子”,但实际上他的父母都不是演员。

当被要求将GPT-4与GPT-3进行比较时,布罗克曼只给出了四个字回答:与众不同。他解释称:“GPT-4绝对与众不同,尽管它还存在很多问题和错误。但你可以看到其在微积分或法律等学科技能方面的跃升。它在某些领域的表现曾很糟糕,现在却已经达到超越普通人的水准。”

测试结果支持了布罗克曼的观点。在高考微积分考试中,GPT-4得4分(满分5分),GPT-3得1分,介于GPT-3和GPT-4之间的GPT-3.5也得4分。在模拟律师考试中,GPT-4成绩进入了前10%行列,而GPT-3.5的分数在后10%左右徘徊。

OpenAI 总裁:GPT-4 并不完美但却绝对与众不同

与此同时,GPT-4更受人关注的地方在于上面提到的多模式。与GPT-3和GPT-3.5不同,它们只能接受文本提示,例如可以要求“写一篇关于长颈鹿的文章”,而GPT-4可以同时接受图像和文本提示来执行某些操作,比如识别在塞伦盖蒂拍摄的长颈鹿图像,并给出基本的内容描述。

这是因为GPT-4是针对图像和文本数据进行培训的,而它的前身只针对文本进行了培训。OpenAI表示,培训数据来自“各种合法授权的、公开可用的数据源,其中可能包括公开可用的个人信息”,但当被要求提供细节时,布罗克曼表示拒绝。训练数据以前也曾让OpenAI陷入法律纠纷。

GPT-4的图像理解能力给人留下了相当深刻的印象。例如,输入提示“这张图片有什么好笑的?GPT-4会将整张图片分解,并正确地解释了这个笑话的笑点。

目前,只有一个合作伙伴可以使用GPT-4的图像分析功能,这是一款针对视障人士的辅助应用程序,名为BeMyEyes。布罗克曼说,在OpenAI评估风险和利弊的过程中,无论何时,更广泛的推广都将是“缓慢而有意的”。

他还称:“有些政策问题也需要解决,比如面部识别和如何处理人的图像。我们需要找出危险区域在哪里,红线在哪里,然后随着时间的推移找到解决方案。”

OpenAI在其文本到图像转换系统Dall-E2上也遇到了类似伦理困境。在最初禁用该功能后,OpenAI允许客户上传人脸,以使用AI支持的图像生成系统对其进行编辑。当时,OpenAI声称,其安全系统的升级使面部编辑功能成为可能,因为它将深度造假以及试图创造色情、政治和暴力内容的潜在危害降至最低。

另一个长期问题是防止GPT-4在无意中被用于可能造成伤害的方式使用。该模型发布几小时后,以色列网络安全初创公司AdversaAI发布了一篇博客文章,演示了绕过OpenAI的内容过滤器并让GPT-4生成钓鱼电子邮件、对同性恋者的攻击性描述以及其他令人反感文本的方法。

这在语言模型领域并不是新问题。Facebook母公司Meta的聊天机器人BlenderBot和OpenAI的ChatGPT也曾被诱惑输出不恰当的内容,甚至透露了它们内部工作的敏感细节。但包括记者在内的许多人曾希望,GPT-4可能会在这方面带来重大改进。

当被问及GPT-4的健壮性时,布罗克曼强调,该模型已经经过了六个月的安全培训。在内部测试中,它对OpenAI使用政策不允许的内容请求做出响应的可能性比GPT-3.5低82%,产生“事实”响应的可能性比GPT-3.5高40%。

布罗克曼说:“我们花了很多时间试图了解GPT-4的能力。我们正在不断更新,包括一系列改进,这样该模型就更具可扩展性,以适应人们希望它拥有的个性或模式。”

坦率地说,早期的现实测试结果并不是那么让人满意。除了AdversaAI测试之外,微软的聊天机器人BingChat也被证明非常容易越狱。使用精心设计的输入,用户能够让该聊天机器人表达爱意,发出威胁伤害,为大屠杀辩护,并发明阴谋论。

布罗克曼并未否认GPT-4在这方面的不足,但他强调了该模型的新限制工具,包括被称为“系统”消息的API级功能。系统消息本质上是为GPT-4的交互设定基调并建立界限的指令。例如,一条系统消息可能是这样写的:“你是一位总是以苏格拉底风格回答问题的导师。你永远不会给学生答案,而是总是试着问正确的问题,帮助他们学会独立思考。”

其思想是,系统消息充当护栏,防止GPT-4偏离轨道。布罗克曼说:“真正弄清楚GPT-4的语气、风格和实质一直是我们非常关注的问题。我认为我们开始更多地了解如何进行工程设计,如何拥有一个可重复的过程,让你得到对人们真正有用的可预测结果。”

布罗克曼还提到了Evals,这是OpenAI最新的开源软件框架,用于评估其AI模型的性能,这是OpenAI致力于“增强”其模型的标志。Evals允许用户开发和运行评估模型(如GPT-4)的基准测试,同时检查它们的性能,这是一种众包的模型测试方法。

布罗克曼说:“有了Evals,我们可以更好地看到用户关心的用例,并可以对其进行测试。我们之所以开源这个框架,部分原因是我们不再每隔三个月发布一个新模型以不断改进。你不会制造你不能测量的东西,对吧?但随着我们推出新版模型,我们至少可以知道发生了哪些变化。”

布罗克曼还被问道,OpenAI是否会补偿人们用Evals测试它的模型?他不愿就此做出承诺,但他确实指出,在有限的时间内,OpenAI允许提出申请的Eevals用户提前访问GPT-4API。

布罗克曼还谈到了GPT-4的上下文窗口,该窗口指的是模型在生成额外文本之前可以考虑的文本。OpenAI正在测试一种版本的GPT-4,它可以“记住”大约50页内容,是普通GPT-4“内存”的5倍,是GPT-3的8倍。

布罗克曼认为,扩展的上下文窗口会带来新的、以前从未探索过的用例,特别是在企业中。他设想了一款为公司打造的AI聊天机器人,它可以利用来自不同来源(包括各部门员工)的背景和知识,以一种非常内行但具有对话性的方式回答问题。

这并不是一个新概念。但布罗克曼认为,GPT-4的答案将比目前其他聊天机器人和搜索引擎提供的答案有用得多。他说:“以前,模型根本不知道你是谁,你对什么感兴趣等。而拥有更大的上下文窗口肯定会让它变得更强,从而大大增强它能为人们提供的支持。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-17 05:45:34

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

openai免费开放chatgptvoice功能
...控制权的宫斗大戏,已经暂告段落。OpenAI前总裁格雷格・布罗克曼(GregBrockman)虽然已经从公司离开,但依然关注该公司的动态
2023-11-22 11:12:00
美AI巨头被控秘密“侵吞”数据
...I员工知道这样做会涉足法律灰色地带。OpenAI总裁格雷格·布罗克曼甚至亲自参与了所使用视频的收集。但OpenAI依然认为这是合理的
2024-04-17 03:27:00
...快会取代一些助理或审核人员的工作。OpenAI总裁格雷格·布罗克曼在谈及此事时表示,AI的出现一定会带来一些混乱,也意味着一些工作岗位的消失,但一些新的工作岗位会出现,“我认
2023-03-16 09:21:00
GPT家族进化史
...。2015年12月,特斯拉汽车创始人埃隆·马斯克,格雷格·布罗克曼(OpenAI联合创始人兼总裁)、山姆·阿尔特曼(OpenAI首席执行官)
2023-03-17 22:00:00
OpenAI前总裁雷格·布罗克曼晒照并配文称“我们回来了”
OpenAI前总裁雷格·布罗克曼晒照并配文称“我们回来了” 【OpenAI前总裁雷格·布罗克曼晒照并配文称“我们回来了”】财联社11月22日电
2023-11-22 17:04:00
OpenAI怎么了?11人创始团队如今仅剩3人,GPT-5也将缺席10月的开发者大会
...着高层的人事动荡。据外媒报道,OpenAI联合创始人兼总裁布罗克曼将休长假,以“放松和充电”,另外还有两位核心人物也离职
2024-08-08 16:24:00
奥特曼重返OpenAI担任CEO!全程回顾100小时“宫斗”大戏
...姆·奥特曼(Sam Altman)OpenAI联合创始人、前总裁格雷格·布罗克曼 (Greg Brockman)OpenAI联合创始人
2023-11-22 17:06:00
OpenAI“地震”始末:理想主义的烈焰与现实的海洋
...对人类的积极影响。”文章写道。作者是创始人格雷格·布罗克曼和伊利亚·苏茨克维。 8年后,身份是OpenAI董事会成员、首席科学家的苏茨克维主导了一场“政变”,突然将总裁布罗
2023-11-21 15:47:00
数据确权的队伍又壮大了 OpenAI与美联社签订授权协议
...研究如何在后台实现共享的技术细节。OpenAI总裁格雷格·布罗克曼也在社交媒体上转发了这条新闻,并表示OpenAI将帮助美联社探索AI技术的用例,同时也会在OpenAI系统中
2023-07-14 05:00:00
更多关于科技的资讯:
拒绝闲置,学而思携手华为打造“亲子共享”学习机
12月25日,学而思与华为深度合作,联合推出基于华为擎云 C5e定制的学而思学习机。这款新品定位为入门款学习机,不仅整合了学而思深耕20余年的优质教育资源与前沿AI技术
2025-12-26 08:49:00
北京远行摘得“金厦奖”,与城市共繁荣
聚焦行业前沿,赋能城市生长。2025年12月23日,第22届中国写字楼产业园发展论坛于北京启幕。这场商业地产领域的权威盛会
2025-12-26 09:20:00
福建首个AI+教育大模型发布它的“大脑”装了6T教育专项数据,既“懂产业”,还“懂学生”“懂教学”东南网12月26日讯 (海峡导报记者 梁静 通讯员 曾妙龄 何贻婷 ) 昨日
2025-12-26 09:35:00
12月12日,由中国通信标准化协会主办、中国信息通信研究院承办的“2025 AI云产业发展大会”在北京成功召开。会上公布了2025年“软件工程智能化领航者”创新应用实践评选结果
2025-12-26 10:49:00
王涵Labubu爆红无疑是2025年最热门的经济现象之一。从外国粉丝排队数小时“抢娃”,到二手市场上部分Labubu溢价超30倍
2025-12-26 10:50:00
天柱山据《中国青年报》报道,清晨六点,北京的胡同里,宠物托管师刘硕已开始一天的忙碌。她轻手轻脚地给客户家的猫咪添粮换水
2025-12-26 10:50:00
破解家政撮合难题,58同城“AI直聘”入选“人工智能+”创新应用
“我想找一位会做饭、做家务的不住家阿姨,最好会做面食和煲汤,可以下午13:00到17:00上户。”在58同城“AI直聘”上
2025-12-26 10:50:00
变频空调哪个牌子技术最强?深度解析空调行业技术标准
变频空调哪个牌子技术最强?这个问题若仅停留在纸面参数的比较,无异于隔靴搔痒。真正的技术巅峰,在于品牌能否将顶尖的实验室数据
2025-12-26 10:54:00
欧姆龙发布《2025统合报告》:以可持续战略驱动未来增长
近日,欧姆龙集团(以下简称"欧姆龙")正式发布了《2025统合报告》,呈现了在"Shaping the Future 2030(以下简称"SF2030")"长期战略指引下
2025-12-26 13:51:00
推开邮储银行唐山玉田县支行的玻璃门,浓郁咖啡香与温暖灯光扑面而来。理财经理正为咨询客户手冲咖啡,这并非咖啡馆日常,而是该支行周三下午的寻常场景
2025-12-26 10:54:00
中新经纬12月26日电 据韩联社25日消息,韩国电商巨头酷澎25日发布新闻资料称,公司凭借通过数字鉴定获取的证据锁定泄露用户信息的前员工
2025-12-26 11:03:00
厦门网讯(厦门日报佘峥)福建省首个AI+教育大模型——“文夔”昨天正式发布,它不仅能帮助教师批改作业、试卷,还能从招聘信息中做出分析
2025-12-26 07:59:00
上传一张聊天截图,便能智能分析用户画像;孕期有疑问,即可一键对话获取专业信息……人工智能高速发展的时代,垂直母婴领域也迎来新的应用落地
2025-12-26 06:39:00
惠及11个停车场 可免费领取 元旦来武林商圈停车有福利
元旦武林商圈有多热闹?购物、打卡、看表演、逛面包节……活动多到停不下来!但你是不是也在担心:车往哪儿停?停车费是不是很贵
2025-12-26 06:39:00
最近,杭州市市场监督管理局出台《网络直播知识产权协同保护风控法务指引(试行)》。《指引》既是落实国家知识产权保护示范区建设的要求
2025-12-26 06:39:00