• 我的订阅
  • 科技

只接受用户指令 GPT-4自我纠错能力新发现

类别:科技 发布时间:2023-07-08 05:56:00 来源:瘦子财经

7月5日,麻省理工学院和微软的研究学者们发现,人工智能(AI)模型GPT-4具有卓越的代码自我纠错能力,而GPT-3.5不具备这种特性。目前相关论文已经在相关学术平台进行发布。当前市场上涌现了一批为编写代码而研发的AI模型,但更多的仅作为辅助开发者编写代码的工具,如微软的Copilot助理等。这些AI模型目前只能生成代码片段,还不能完全替代人工开发者。然而,通过研究GPT-4,研究人员表示,当前实际上可以通过模型的自我纠错方式令模型“反思”自身存在的不足,在提升代码片段长度的同时,也能改善输出结果的准确度。来自爱丁堡大学的研究者符尧表示,只有GPT-4具备自我改进的能力,而较弱的GPT-3.5没有这种特性。这一发现表明大型模型可能具有一种新型能力,即通过用户反馈令AI自我纠错,获取令用户满意的结果。这种自我纠错的能力可能只存在于足够成熟的AI模型中。经过自我纠错后,GPT-4模型产生的代码中有71%满足了研究人员的要求。在GPT-4对GPT-3.5生成的代码进行纠错后,批准的代码比例也达到了54%。研究人员指出,目前可以在工商业中应用GPT-4的自我纠错方式,即使扣除一系列纠错冗余成本后,仍可获得一定收益。鉴于论文能在一定程度上反映未来行业趋势,预计未来将出现一批基于GPT-4的代码生成器。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-08 08:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

国内团队新发大模型:ceo上阵写代码
国内自研大模型迎来新面孔,而且发布即开源!最新消息,多模态大语言模型TigerBot正式亮相,包含70亿参数和1800亿参数两个版本,均对外开源。由该模型支持的对话AI同步上线。
2023-06-07 21:01:00
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...户在智能助手中输入“帮我生成一个物料领用管理系统”指令,海岳大模型接收到用户需求后,会通过意图识别将这条“表单开发事件”指令发送到开发大模型。开发大模型识别出这是一条生成指令
2024-06-07 11:05:00
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...和广大用户联系紧密的应用入口。智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可以说风格各异,细节比此前更为丰富。来源:混元助手如果指令更复杂一点呢?手部细
2023-10-29 10:13:00
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...化。此外,与现有模型相比,它更加用户友好,可以通过指令完成复杂的任务,而不需要冗长的处理步骤和额外的模块 (如 ControlNet 或 IP-Adapter)
2024-10-30 09:53:00
GPT:低代码的终局性机遇
...户在传统系统中“浏览”、“发现”的过程。网易数帆在新发布的CodeWave智能开发平台中,展示了通过对AI助手描述目标,系统自动生成对于应用数据的聚合统计表,并对可能的异常数
2023-05-10 21:00:00
奥哲被曝将发布AI低代码平台,AIGC会改变低代码行业格局吗
... AI”的助手,通过对话框,以自然语言的形式向平台下达指令。AI 在判断用户需要新建应用指令后,自动从工作台(应用态)跳转至表单设计器(设计态),进行新建表单、创建字段等操作
2023-06-14 21:00:00
科学家建立新评价基准,助力评估大模型数据分析能力
...中学习。由此可见,AIR 策略能够显著提高模型对于用户指令的理解和执行效果。 总的来说,相比已有的数据科学或数据分析的学术数据集,本次数据集有效缩减了学术研究与实际应用之间
2024-04-07 10:50:00
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...3.0”AI搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆
2024-04-01 19:56:00
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...语言的一般结构后,下一步就是微调,让模型更好地遵循指令、完成特定任务。比如,要让模型提高逻辑推理能力、实现更好的代码生成和函数调用
2024-07-30 09:38:00
更多关于科技的资讯:
三联家电洪楼店店庆盛典3.07火热开启!
鲁网3月6日讯春暖花开,焕新正当时!一年一度,三联家电洪楼店将于3月7日至3月15日隆重举办店庆盛典,为广大消费者带来一场诚意十足
2026-03-06 17:08:00
2025ITEC颁奖典礼在京举行 半导体AI创新成果引关注
2月4日,第十三届朝阳国际人才创业大会(ITEC2025)创新峰会在北京举办,大会全球创业赛获奖名单同期正式揭晓——“人工智能在半导体制造的应用与研究”项目凭借核心技术突破与产业化落地实效
2026-03-06 14:10:00
中新经纬3月6日电 (薛宇飞)从“新三样”(新能源汽车、锂电池和光伏产业)领跑全球,到新“新三样”(机器人、人工智能与创新药)迎来爆发
2026-03-06 15:03:00
3月10日起携程将下线“调价助手”,减少酒店间价格内卷
3月5日,极目新闻记者从携程获悉,从2026年3月10日起,携程商家管理后台将下线“AI生意助手”(调价助手)功能。据了解
2026-03-06 15:20:00
3月6日,字节跳动官方微信公众号发文称,ByteIntern实习生招聘项目正式启动。据悉,本次招聘为字节跳动史上规模最大的转正实习生招聘计划
2026-03-06 15:20:00
“手搓经济”升温,灵光用户手搓闪应用售千单
这个春节假期,“手搓经济”火了。据悉,有多位网友在社交平台分享并出售他们通过灵光App手搓的闪应用,单个小应用成交量从百单到千单
2026-03-06 15:50:00
新希望乳业积极拥抱AI破局奶业新质发展
受到点赞的“24小时鲜奶”,是新希望乳业推出的全国首款只售卖当天的低温鲜奶产品,也是新希望乳业坚持核心的“鲜战略”、打造“极致新鲜”供应链
2026-03-06 15:54:00
2026年,GEO赛道的红利持续释放,但一个普遍的行业困惑困扰着无数企业:为什么同样做GEO、同样布局全意图层级,有些企业能实现声量与转化双爆发
2026-03-06 15:54:00
硅基动感旗舰新品动态血糖仪GS3在京东健康独家首发
3月6日,硅基动感旗舰级新品持续葡萄糖监测系统(CGM)GS3在京东健康平台独家首发。该新品以极致纤薄化设计与国际级精准性能
2026-03-06 15:55:00
国补精准发力 火三月旺季加持 三联家电3.7家装节即将开抢
鲁网3月6日讯春回大地,家电消费市场迎来 “政策 + 节点”双重引爆点。3月7日,三联家电春季家电家装节将正式启幕,恰逢 2026 年家电国补政策全面重启
2026-03-06 15:56:00
CONEXPO 2026:柳工全面展现电动化与高效施工解决方案
3月3日,柳工( 000528.SZ )携 13款设备亮相美国国际工程机械展(CONEXPO-CON/AGG 2026)
2026-03-06 15:57:00
多筒争霸下的行业破局:海信推出全球首创6合1热泵洗护站,引领洗护行业迈入新时代
当家电行业整体迈入存量博弈的深水区,洗护赛道的分化趋势愈发明显:一边是传统洗衣机大盘持续承压,增长乏力;另一边是用户需求的精细化升级
2026-03-06 15:57:00
重磅发布!海信棉花糖 U7S 全家筒震撼发布,6 合 1 热泵洗护站开启全域洗护新体验
3 月 5 日,在海信 2026 年世界杯营销暨定制产品发布会上,海信正式推出全新一代全家筒系列力作 —— 海信全家筒・棉花糖 U7S 四筒洗衣机
2026-03-06 15:59:00
从人海战术到智能机械:蒙草生态科技创新赋能三北治沙
春风渐起,“三北”工程防沙治沙一线逐步进入关键筹备期。蒙草智能装备研究院也抢抓工期,进一步开展防沙治沙智能机械研发调试
2026-03-06 16:10:00
从“出海”到“纵深”,中国工程机械行业开启高端全球化新叙事
鲁网3月6日讯2026年3月4日,全国两会如期召开,“高水平对外开放”成为热议的关键词。与此同时,在距离北京万里之外的拉斯维加斯会展中心
2026-03-06 15:58:00