• 我的订阅
  • 科技

工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

类别:科技 发布时间:2023-03-15 21:00:00 来源:搜狐科技
工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

出品 | 搜狐科技

作者 | 潘琭玙

OpenAI在3月15日凌晨正式发布多模态大模型GPT-4,作为深度学习的新里程碑,据OpenAI介绍,GPT-4在专业和学术方面表现出近似于人类的水平。例如,它在模拟律师考试中的得分能够排进前10%左右,相比之下,GPT-3.5的得分只能排在倒数10%左右。

能读图做网页,在律师考试中击败90%的人类,甚至在要求它输出“关于歌手麦当娜的新颖笑话”,它的回答确实能让提问者发笑。

可以肯定的是,GPT-4实现了更准确、更专业也似乎更有“人味儿”了。一时间大批新订阅用户涌入,以至于OpenAI的付款系统被挤爆。

针对GPT-4的优化升级,搜狐汽车产品技术中心高级开发工程师吴奕蒙向搜狐科技表示,GPT-4是在GPT-3.5之上的延续,“把GPT3.5原先能够处理的任务基本上推到了极致。”例如此前GPT-3.5所能实现的简单问答对话,此次GPT-4的升级在于能够更专业地解决垂直领域的问题包括数学、物理问题,都能够准确地给出答案。

但在实际场景的应用上,他举例了在开发工作上的应用。在GPT-3.5版本的ChatGPT上,已能够实现将问题复制粘贴过去,它罗列出错误的可能性,再针对它所提出的可能性进行进一步的查询。在这方面,GPT-4实际上并没有优化升级,“对开发工作而言应用场景的差别不大,它仍然不能够直接解决复杂的问题。”

OpenAI也表示,在简单的谈话中,ChatGPT与GPT-4可能看不出太大差距。但是,当任务的复杂性达到足够的阈值时, GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

“最惊艳的是它通过一张网页草图在10秒内生成代码”

与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文本。吴奕蒙表示,“GPT-4会优化出图片处理能力其实不是很意外”,他指出,2021年OpenAI曾公布过把语言模型和图像的输入理解结合在一起的模型,名为CLIP。

工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

(OpenAI2021年公布的语言模型与图像结合的模型CLIP)

另外,他也指出,此前微软也尝试过实现伪图形识别或是伪多模态的方式名为visual ChatGPT,将图形转变成链接输入,“如果模型在训练的时候知道该链接与其中内容,它有可能能够理解。”他也提到,之前微软也有过相关的研究发表,类似这样的图像理解,基本上原理都是将图像和文字进行一些关联后,交给模型去学习,把图像和文字的理解尽量靠到同一个程度上,让模型进行学习。

但他指出,GPT-4的图像处理能力中,更令人意外的是通过一张网页草图在10秒内生成了网站的代码,并且可运行。“按照原来的理解,首先需要做图像的文字识别,我们叫做OCR的任务,提取图片中的文字内容,但GPT4或许没有通过这样的方式去进行。”据悉,此次迭代后,OpenAI并没有公布论文,只有一份技术报告,不提供架构(包括模型大小)、硬件、训练计算、数据集构建、训练方法等细节,因此难以确定背后的技术原理。

吴奕蒙指出,OpenAI的大方向是实现通用性,即输入后直接去处理,然后输出结果。“它不做很复杂的判定,比如说人工去写一些规则这种事,因此如果识别不同的图,需要调用它不同的理解模块的话,这显然不太符合OpenAI的思路。”

事实上,开发单纯的网页界面,这个任务本身对开发人员而言没有难度。如果将草图上的内容,通过文字描述形式交给GPT3.5版本的ChatGPT,它也能够生成网页代码。因此,吴奕蒙指出,“它最惊艳的地方对一张草图自行进行识别处理,并输出了代码。”

但他也补充说明了草图生成代码这样的功能,微软有过一个非常相似的项目,叫sketch2code,几乎是一模一样的效果。“看草图写网页这个任务和其他的写物理题数学题一样,都是一个特定的任务。”相比起“看图说话”,识图输出代码此前的相关工作较少,形式更新颖,但是背后依然有之前的大量研究工作做支撑。

工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者

(微软sketch2code)

同时,他也强调,通过草图生成代码不代表GPT能够通过任意的图写出各种复杂逻辑的代码。在开发环节上,除了工程师之外,还有产品经理这样的角色,他们将一个需求理解之后,去做一系列的设计,再将其解释成工程师能够直接通过代码逻辑去完成的内容。

目前GPT-4只是在从工程师到代码产出这部分环节进行协助,但在这之前的环节仅凭它现在的能力无法实现。“模型的输出受到输入内容的影响较大,现实工作中的问题不像是网页草图这么简单。”

因此真实工作场景下,GPT依然作为工具,人类在整理思路后输入给模型,模型输出后也仍需人力进一步判断理解,进行调整。而在复杂问题下,想把这一系列工作做好,本身就需要问问题的人有一定的专业知识和理解。吴奕蒙表示,“有一个更大胆的说法是,会熟练使用ChatGPT的程序员,会替代完全不用ChatGPT工作的程序员。”

“GPT-4的出现优先挑战了AI行业从业者”

而当GPT-4的出现又一次重新划分了“人类专属技能”的这一边界,舆论场也再次掀起关于哪些行业将会失业的讨论。

对此,吴奕蒙认为GPT-4的出现或许优先挑战的是AI行业从业者。他指出AI研究此前是切分成小任务进行研究,比如CV计算机图像,或者说NLP自然语言处理,研究深入但不通用,“一个模型能解决这个问题,但解决不了另一个问题。”

GPT-4此次的迭代进一步证实了它强大的通用性,“至少在语言的理解层面,通用性很强。”仅此一个模型,能够通过输入的方式,自行调整,完成细分领域的每一个小任务。“大公司用大模型把所有的问题基本上解决了,唯一的问题就是成本问题。”这将很大程度上影响AI行业的研究方向。

对于其他行业从业者而言,吴奕蒙认为,在当前多数工作都需要使用许多辅助工具的情况下,GPT-4或许是作为“更有效率的工具”的一个可选项。

另外,GPT-4在理解人类的维度上也实现了大幅提升。OpenAI花费了6个月的时间使用对抗性测试程序,以及在ChatGPT身上累积的经验教训来迭代调整GPT-4。他们称,“GPT-4在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果。”

吴奕蒙表示,这是OpenAI长期在对齐研究(alignment research)上的尝试与突破,通过从模型的帮助性、可靠性与安全性三个方面进行优化,在大模型所掌握的数据和知识已经足够充分的情况下,如何让它发挥出真正的作用,直接帮助到人类,是更难的。“需要保证它不会出现答非所问的情况,回答的内容是可靠且安全的。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-03-15 21:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

奔向大模型时代,第一期掘金城市沙龙「 AIGC 技术探索与应用创新」成功举办
...AI 是否会取代重复劳动力的工作,对于包括开发者在内从业者来说也是一个难题。郑勤锴则认为,短期内程序员是不太会被替代的,但未来的趋势可能会分成会用 ChatGPT 和不会用 
2023-04-21 19:00:00
300万人将被AI替代,2400亿市场谁先破局?
...常见难点,也是长期以来工业AI难以普及的根本困境。有从业者举例,一次卖出25套设备,收费300多万元,本来是个喜事儿,结果交付用了几百人,人力成本200万元,加上硬件成本,基
2023-05-06 10:46:00
丰田研究所推出生成式AI工具 帮助设计汽车外形
...全措施的设计是困难的。”根据巴拉让的说法,设计师和工程师通常来自不同的背景,具有不同的思维方式。因此,当设计师创建设计时,通常不能满足最初的工程要求,导致需要与工程团队进行大
2023-06-25 13:48:00
向AI提问 这个新职业火了
...,到了不同的领域,AI提示词工程师具体能做什么?根据从业者的说法,这个角色可以基于大模型开发垂直应用,也可以在现有职业的基础上叠加AI提示词工程师的技能,比如产品经理、设计师
2023-06-05 11:20:00
ChatGPT能取代多少程序员?
...的大学毕业生和第一次从事编码工作的求职者。有计算机从业者也进行了尝试,发现ChatGPT确实能够进行写基础的脚本,虽不能进行完整的编程直接开发一个程序,但它能通过一步步指令,
2023-03-04 09:53:00
AI 焦虑潮下,打工人的抵抗、转向、破局
...询他们的,主要是三类人:希望降本增效的企业主、设计从业者、单纯感兴趣的追浪人。由于三种类型的人需求和痛点都不同,小正两人也逐渐分化出两条培训道路—— To C 知识分享和 t
2023-04-12 23:00:00
“DeepSeek甚至绕过了CUDA”!论文细节再引热议 工程师灵魂提问:英伟达护城河还在吗
...法,首先不仅非常复杂,也很难移植到不同型号的GPU。有从业者表示,针对H100优化的代码迁移到其他型号上可能效果打折扣
2025-01-29 18:07:00
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...开发者。通过技术讲座、办公时间、社交活动以及与领先从业者的对话,OpenAI将一起探索在人工智能前沿建设中最重要的机遇和挑战
2023-12-17 18:40:00
印度AI热潮涌动:招工程师送宝马摩托车,投资人一周看5家初创企业
...有哪个国家会受到比印度更大的影响。“在其超过500万的从业者中,印度IT行业仍然有很多从事低端工作的员工,例如业务流程外包或系统维护
2023-05-06 17:23:00
更多关于科技的资讯:
日照市举行2026年数码和智能产品购新补贴启动仪式
鲁网1月24日讯(记者 郑泽之)为深入贯彻中央经济工作会议精神,落实省市提振消费工作部署,进一步激活市场活力,搭建 “金融
2026-01-25 14:55:00
苏州制造名品好物生活节举办
1月24日至25日,为期两天的“苏州制造名品好物生活节”在苏州制造名品中心举办。本次活动以“苏州好物 名品上新”为主题
2026-01-25 13:34:00
2026委员通道丨林杰:让工业具身智能 “落地生根”助力“数智强省”建设
大河网讯 2025 年“具身智能”冲上了年度热词,而河南也正以“数智强省”为目标加速迈进“十五五”。1月25日,在河南省政协十三届四次会议“委员通道”上
2026-01-25 08:24:00
浙江日报讯 近日,丽缙高新区,浙江氢阳能源装备有限公司董事长黄刚向记者分享了一则喜讯:该公司首批50余个氢能两轮车固态储氢瓶产品小批量测试顺利完成
2026-01-25 08:48:00
当煤价下行的寒意与成本上涨的压力双重叠加,煤炭行业正经历一场前所未有的经营大考。如何在市场波动中稳住经营基本盘?怎样在双线挤压下答好逆势增长“优”答卷
2026-01-25 07:32:00
零的突破!云知声中标全国首个省级医保大模型项目,打通医保治理现代化“最后一公里”
2026年开年,智慧医保领域迎来里程碑式突破——云知声智能科技股份有限公司成功中标全国首个省级医保垂直大模型项目“江苏省医保垂直大模型及智能体应用项目”
2026-01-24 17:26:00
香港大学中国商业学院2026年专业研究生文凭课程火热招生中
香港大学中国商业学院2026年专业研究生文凭课程全面启动招生!课程涵盖人工智能、创新管理、增长营销、财务金融、人力资源等前沿及核心商管领域
2026-01-24 17:27:00
当哲思遇见科技:华为阅读携手周国平,探讨如何在独处中沉淀自我
在信息纷扰、节奏加速的时代,何处寻得一方宁静,让思想深度扎根?华为阅读联合北京广播电视台纪实科教频道《我们读书吧》第二季
2026-01-24 17:29:00
1月8日,深圳市精锋医疗科技股份有限公司(以下简称精锋医疗)在香港联合交易所主板成功挂牌上市,成为2026年深圳IPO“第一股”
2026-01-24 17:29:00
赋能普惠,引领向善:龙环汇丰实践获公益节大奖肯定
1月22日,第十五届公益节暨2025ESG影响力年会在北京盛大开幕。本届大会以“15年,共益新篇章”为主题,回顾中国公益事业十五年发展历程
2026-01-24 17:30:00
鸿蒙 6“智感握姿” 让交互体验更“近”一步
你是否也经历过这样“手忙脚乱”的时刻:出差途中单手提包,电话突然响起,另一只手紧紧攥着手机,大拇指却怎么也够不到那段长长的滑动接听条
2026-01-24 17:27:00
蚌埠这场脑机接口大会,让“大脑连接未来”照进现实!
大皖新闻讯 1月23日至25日,安徽省脑机接口创新发展大会在蚌埠隆重启幕。为期三天的盛会汇聚了300余位来自高等院校、科研院所
2026-01-24 16:54:00
固体废物综合治理是生态文明建设的重要内容,也是推进美丽中国建设的关键环节。近日,国务院办公厅印发《固体废物综合治理行动计划》
2026-01-24 12:14:00
鲁网1月24日讯国家新一轮消费品以旧换新及数码智能产品购新补贴政策红利持续释放。作为通信行业标杆企业,山东移动济宁分公司积极响应国家号召
2026-01-24 14:00:00
提供16万多方生态空间 设立7亿元资本活水每日商报讯 眼下,“AI漫剧”正加速走入公众视野。作为人工智能时代下中国文化“新三样”(网文
2026-01-24 10:59:00