• 我的订阅
  • 科技

工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

类别:科技 发布时间:2023-03-15 21:00:00 来源:搜狐科技
工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

出品 | 搜狐科技

作者 | 潘琭玙

OpenAI在3月15日凌晨正式发布多模态大模型GPT-4,作为深度学习的新里程碑,据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。

能读图做网页,在律师考试中击败90%的人类,甚至在要求它输出“关于歌手麦当娜的新颖笑话”,它的回答确实能让提问者发笑。

可以肯定的是,GPT-4实现了更准确、更专业也似乎更有“人味儿”了。一时间大批新订阅用户涌入,以至于OpenAI的付款系统被挤爆。

针对GPT-4的优化升级,搜狐汽车产品技术中心高级开发工程师吴奕蒙向搜狐科技表示,GPT-4是在GPT-3.5之上的延续,“把GPT3.5原先能够处理的任务基本上推到了极致。”例如此前GPT-3.5所能实现的简单问答对话,此次GPT-4的升级在于能够更专业地解决垂直领域的问题包括数学、物理问题,都能够准确地给出答案。

但在实际场景的应用上,他举例了在开发工作上的应用。在GPT-3.5版本的ChatGPT上,已能够实现将问题复制粘贴过去,它罗列出错误的可能性,再针对它所提出的可能性进行进一步的查询。在这方面,GPT-4实际上并没有优化升级,“对开发工作而言应用场景的差别不大,它仍然不能够直接解决复杂的问题。”

OpenAI也表示,在简单的谈话中,ChatGPT与GPT-4可能看不出太大差距。但是,当任务的复杂性达到足够的阈值时, GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

“最惊艳的是它通过一张网页草图在10秒内生成代码”

与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本。吴奕蒙表示,“GPT-4会优化出图片处理能力其实不是很意外”,他指出,2021年OpenAI曾公布过把语言模型和图像的输入理解结合在一起的模型,名为CLIP。

工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

(OpenAI2021年公布的语言模型与图像结合的模型CLIP)

另外,他也指出,此前微软也尝试过实现伪图形识别或是伪多模态的方式名为visual ChatGPT,将图形转变成链接输入,“如果模型在训练的时候知道该链接与其中内容,它有可能能够理解。”他也提到,之前微软也有过相关的研究发表,类似这样的图像理解,基本上原理都是将图像和文字进行一些关联后,交给模型去学习,把图像和文字的理解尽量靠到同一个程度上,让模型进行学习。

但他指出,GPT-4的图像处理能力中,更令人意外的是通过一张网页草图在10秒内生成了网站的代码,并且可运行。“按照原来的理解,首先需要做图像的文字识别,我们叫做OCR的任务,提取图片中的文字内容,但GPT4或许没有通过这样的方式去进行。”据悉,此次迭代后,OpenAI并没有公布论文,只有一份技术报告,不提供架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等细节,因此难以确定背后的技术原理。

吴奕蒙指出,OpenAI的大方向是实现通用性,即输入后直接去处理,然后输出结果。“它不做很复杂的判定,比如说人工去写一些规则这种事,因此如果识别不同的图,需要调用它不同的理解模块的话,这显然不太符合OpenAI的思路。”

事实上,开发单纯的网页界面,这个任务本身对开发人员而言没有难度。如果将草图上的内容,通过文字描述形式交给GPT3.5版本的ChatGPT,它也能够生成网页代码。因此,吴奕蒙指出,“它最惊艳的地方对一张草图自行进行识别处理,并输出了代码。”

但他也补充说明了草图生成代码这样的功能,微软有过一个非常相似的项目,叫sketch2code,几乎是一模一样的效果。“看草图写网页这个任务和其他的写物理题数学题一样,都是一个特定的任务。”相比起“看图说话”,识图输出代码此前的相关工作较少,形式更新颖,但是背后依然有之前的大量研究工作做支撑。

工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

(微软sketch2code)

同时,他也强调,通过草图生成代码不代表GPT能够通过任意的图写出各种复杂逻辑的代码。在开发环节上,除了工程师之外,还有产品经理这样的角色,他们将一个需求理解之后,去做一系列的设计,再将其解释成工程师能够直接通过代码逻辑去完成的内容。

目前GPT-4只是在从工程师到代码产出这部分环节进行协助,但在这之前的环节仅凭它现在的能力无法实现。“模型的输出受到输入内容的影响较大,现实工作中的问题不像是网页草图这么简单。”

因此真实工作场景下,GPT依然作为工具,人类在整理思路后输入给模型,模型输出后也仍需人力进一步判断理解,进行调整。而在复杂问题下,想把这一系列工作做好,本身就需要问问题的人有一定的专业知识和理解。吴奕蒙表示,“有一个更大胆的说法是,会熟练使用ChatGPT的程序员,会替代完全不用ChatGPT工作的程序员。”

“GPT-4的出现优先挑战了AI行业从业者”

而当GPT-4的出现又一次重新划分了“人类专属技能”的这一边界,舆论场也再次掀起关于哪些行业将会失业的讨论。

对此,吴奕蒙认为GPT-4的出现或许优先挑战的是AI行业从业者。他指出AI研究此前是切分成小任务进行研究,比如CV计算机图像,或者说NLP自然语言处理,研究深入但不通用,“一个模型能解决这个问题,但解决不了另一个问题。”

GPT-4此次的迭代进一步证实了它强大的通用性,“至少在语言的理解层面,通用性很强。”仅此一个模型,能够通过输入的方式,自行调整,完成细分领域的每一个小任务。“大公司用大模型把所有的问题基本上解决了,唯一的问题就是成本问题。”这将很大程度上影响AI行业的研究方向。

对于其他行业从业者而言,吴奕蒙认为,在当前多数工作都需要使用许多辅助工具的情况下,GPT-4或许是作为“更有效率的工具”的一个可选项。

另外,GPT-4在理解人类的维度上也实现了大幅提升。OpenAI花费了6个月的时间使用对抗性测试程序,以及在ChatGPT身上累积的经验教训来迭代调整GPT-4。他们称,“GPT-4在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。”

吴奕蒙表示,这是OpenAI长期在对齐研究(alignment research)上的尝试与突破,通过从模型的帮助性、可靠性与安全性三个方面进行优化,在大模型所掌握的数据和知识已经足够充分的情况下,如何让它发挥出真正的作用,直接帮助到人类,是更难的。“需要保证它不会出现答非所问的情况,回答的内容是可靠且安全的。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-15 21:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...AI 是否会取代重复劳动力的工作,对于包括开发者在内从业者来说也是一个难题。郑勤锴则认为,短期内程序员是不太会被替代的,但未来的趋势可能会分成会用 ChatGPT 和不会用 
2023-04-21 19:00:00
300万人将被AI替代,2400亿市场谁先破局?
...常见难点,也是长期以来工业AI难以普及的根本困境。有从业者举例,一次卖出25套设备,收费300多万元,本来是个喜事儿,结果交付用了几百人,人力成本200万元,加上硬件成本,基
2023-05-06 10:46:00
丰田研究所推出生成式AI工具 帮助设计汽车外形
...全措施的设计是困难的。”根据巴拉让的说法,设计师和工程师通常来自不同的背景,具有不同的思维方式。因此,当设计师创建设计时,通常不能满足最初的工程要求,导致需要与工程团队进行大
2023-06-25 13:48:00
向AI提问 这个新职业火了
...,到了不同的领域,AI提示词工程师具体能做什么?根据从业者的说法,这个角色可以基于大模型开发垂直应用,也可以在现有职业的基础上叠加AI提示词工程师的技能,比如产品经理、设计师
2023-06-05 11:20:00
ChatGPT能取代多少程序员?
...的大学毕业生和第一次从事编码工作的求职者。有计算机从业者也进行了尝试,发现ChatGPT确实能够进行写基础的脚本,虽不能进行完整的编程直接开发一个程序,但它能通过一步步指令,
2023-03-04 09:53:00
AI 焦虑潮下,打工人的抵抗、转向、破局
...询他们的,主要是三类人:希望降本增效的企业主、设计从业者、单纯感兴趣的追浪人。由于三种类型的人需求和痛点都不同,小正两人也逐渐分化出两条培训道路—— To C 知识分享和 t
2023-04-12 23:00:00
“DeepSeek甚至绕过了CUDA”!论文细节再引热议 工程师灵魂提问:英伟达护城河还在吗
...法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折扣
2025-01-29 18:07:00
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...开发者。通过技术讲座、办公时间、社交活动以及与领先从业者的对话,OpenAI将一起探索在人工智能前沿建设中最重要的机遇和挑战
2023-12-17 18:40:00
印度AI热潮涌动:招工程师送宝马摩托车,投资人一周看5家初创企业
...有哪个国家会受到比印度更大的影响。“在其超过500万的从业者中,印度IT行业仍然有很多从事低端工作的员工,例如业务流程外包或系统维护
2023-05-06 17:23:00
更多关于科技的资讯:
元旦小长假,佳节团圆之时,亦是通信保障的关键时期,太原移动全方位筑牢节日通信防线,用满格的信号、畅通的网络,送上最真挚的新年祝福
2026-01-03 07:34:00
河北新闻网讯(王杨、王雪威)近日,河钢集团张宣科技生产的2万吨绿色汽车板材料下线,经检验,产品各项性能指标均满足订单标准
2026-01-02 22:20:00
鲁南眼科自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年成功举办
鲁网1月1日讯2025年12月31日,鲁南眼科医院成功举办自有品牌「鲁南博视」光学镜片发布会暨成人验光配镜门诊一周年庆典
2026-01-02 16:41:00
新年第一天 燕赵沐朝晖|“雄安一号”星 测试太阳翼
编者按岁序更替,华章日新。2026年是“十五五”开局之年。锐始者必图其终,成功者先计于始。新年第一天,燕赵大地欣欣向荣
2026-01-02 07:05:00
注意缺陷与多动障碍 这个疾病越来越常见 都说长大就好了 为何缠上成人?
2025年12月31日凌晨,罗永浩在微博发文回应“科技春晚”发布会迟到40分钟事件,首次公开坦承自己受注意缺陷与多动障碍(ADHD)困扰多年
2026-01-02 08:06:00
近日,湘湖首部AI动画《湘湖漫游记》第五集上线,该系列作品正式收官。本片不仅是杭州湘湖(白马湖)研究院在“文化+科技”融合上的一次重要突破
2026-01-02 06:35:00
在杭州湖滨银泰in77的B区、D区之间,复古的国王十字车站、9站台出现在现场,仿佛下一秒就有巫师推着行李箱穿墙而过;一辆编号5972的霍格沃茨特快列车静静停靠在街区中央
2026-01-02 06:35:00
2025年度票房破518亿元 动画电影成亮点 安徽全国排名第十
大皖新闻讯 国家电影局2026年1月1日公布,2025年电影票房为518.32亿元,同比增长21.95%,城市院线观影人次为12
2026-01-01 17:14:00
免费抢鲜体验!香飘飘魔芋啵啵奶茶快闪体验活动空降临沂泰盛广场 健康爆款掀起跨年打卡热潮
鲁网1月1日讯 (记者 李文静)2025年12月31日晚,国民奶茶品牌香飘飘携新品“魔芋啵啵”奶茶,在山东临沂泰盛广场开启奶茶快闪体验活动
2026-01-01 15:52:00
厦门动漫嘉年华启幕 众多热门国漫IP集中参展
厦门动漫嘉年华各项活动精彩纷呈。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)展览面积超5万平方米,汇聚众多热门国漫IP
2026-01-01 08:41:00
助力低空应急产业发展——三明市应急管理局引进低空防御项目
东南网1月1日讯 2025年12月30日,由三明市应急管理局引进,南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司
2026-01-01 09:33:00
近日,太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心,围绕高峰期通行效率低、车辆拥堵等运营痛点
2026-01-01 07:17:00
沈洁任蓟州区代理区长 扫码阅读手机版
据“掌上蓟州”微信公众号消息,天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定:沈洁为天津市蓟州区人民政府代理区长。
2025-12-31 23:10:00
东南网12月31日讯(本网记者 卢金福)元旦佳节将至,消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势
2025-12-31 23:29:00
皖企长鑫科技向上交所递交IPO招股书
大皖新闻讯 2025年12月30日,总部位于合肥的长鑫科技集团股份有限公司(以下简称“长鑫科技”)正式向上海证券交易所递交招股书
2025-12-31 21:33:00