• 我的订阅
  • 科技

只接受用户指令 GPT-4自我纠错能力新发现

类别:科技 发布时间:2023-07-08 05:56:00 来源:瘦子财经

7月5日,麻省理工学院和微软的研究学者们发现,人工智能(AI)模型GPT-4具有卓越的代码自我纠错能力,而GPT-3.5不具备这种特性。目前相关论文已经在相关学术平台进行发布。当前市场上涌现了一批为编写代码而研发的AI模型,但更多的仅作为辅助开发者编写代码的工具,如微软的Copilot助理等。这些AI模型目前只能生成代码片段,还不能完全替代人工开发者。然而,通过研究GPT-4,研究人员表示,当前实际上可以通过模型的自我纠错方式令模型“反思”自身存在的不足,在提升代码片段长度的同时,也能改善输出结果的准确度。来自爱丁堡大学的研究者符尧表示,只有GPT-4具备自我改进的能力,而较弱的GPT-3.5没有这种特性。这一发现表明大型模型可能具有一种新型能力,即通过用户反馈令AI自我纠错,获取令用户满意的结果。这种自我纠错的能力可能只存在于足够成熟的AI模型中。经过自我纠错后,GPT-4模型产生的代码中有71%满足了研究人员的要求。在GPT-4对GPT-3.5生成的代码进行纠错后,批准的代码比例也达到了54%。研究人员指出,目前可以在工商业中应用GPT-4的自我纠错方式,即使扣除一系列纠错冗余成本后,仍可获得一定收益。鉴于论文能在一定程度上反映未来行业趋势,预计未来将出现一批基于GPT-4的代码生成器。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-08 08:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

国内团队新发大模型:ceo上阵写代码
国内自研大模型迎来新面孔,而且发布即开源!最新消息,多模态大语言模型TigerBot正式亮相,包含70亿参数和1800亿参数两个版本,均对外开源。由该模型支持的对话AI同步上线。
2023-06-07 21:01:00
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...户在智能助手中输入“帮我生成一个物料领用管理系统”指令,海岳大模型接收到用户需求后,会通过意图识别将这条“表单开发事件”指令发送到开发大模型。开发大模型识别出这是一条生成指令
2024-06-07 11:05:00
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...和广大用户联系紧密的应用入口。智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可以说风格各异,细节比此前更为丰富。来源:混元助手如果指令更复杂一点呢?手部细
2023-10-29 10:13:00
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...化。此外,与现有模型相比,它更加用户友好,可以通过指令完成复杂的任务,而不需要冗长的处理步骤和额外的模块 (如 ControlNet 或 IP-Adapter)
2024-10-30 09:53:00
GPT:低代码的终局性机遇
...户在传统系统中“浏览”、“发现”的过程。网易数帆在新发布的CodeWave智能开发平台中,展示了通过对AI助手描述目标,系统自动生成对于应用数据的聚合统计表,并对可能的异常数
2023-05-10 21:00:00
奥哲被曝将发布AI低代码平台,AIGC会改变低代码行业格局吗
... AI”的助手,通过对话框,以自然语言的形式向平台下达指令。AI 在判断用户需要新建应用指令后,自动从工作台(应用态)跳转至表单设计器(设计态),进行新建表单、创建字段等操作
2023-06-14 21:00:00
科学家建立新评价基准,助力评估大模型数据分析能力
...中学习。由此可见,AIR 策略能够显著提高模型对于用户指令的理解和执行效果。 总的来说,相比已有的数据科学或数据分析的学术数据集,本次数据集有效缩减了学术研究与实际应用之间
2024-04-07 10:50:00
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...3.0”AI搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆
2024-04-01 19:56:00
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...语言的一般结构后,下一步就是微调,让模型更好地遵循指令、完成特定任务。比如,要让模型提高逻辑推理能力、实现更好的代码生成和函数调用
2024-07-30 09:38:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者何洁 实习生杨久久国际审计留学来华学什么?中国审计智慧如何推动高质量共建“一带一路”行稳致远
2025-10-30 07:57:00
近日,第五届青年企业家创新创业盛典(简称“青创盛典”)在深圳成功举办。本次活动由北京、上海、深圳、广州、厦门等12个省市“双创”机构重点支持
2025-10-29 14:31:00
中新经纬10月29日电 (魏薇)“中国民营火箭企业正加速突破可重复使用技术瓶颈,预计一年内攻克液体可重复使用火箭核心难题
2025-10-29 14:41:00
大皖新闻讯 近日,知名火锅品牌巴奴毛肚火锅(以下简称巴奴)宣布11月1日起对会员体系进行全新升级,核心变动为会员等级判定标准从“消费次数”改为“消费金额”
2025-10-29 15:32:00
从频繁捡耳机到狂甩不掉,听智慧定制蓝牙耳机如何终结佩戴尴尬
通勤路上刚戴上耳机,一个哈欠就让右耳的耳塞滑进了衣领;晨跑时耳机随着步伐甩动,耳塞在耳道里反复松动,最后干脆“跳”出耳朵
2025-10-29 15:46:00
六大巨头携手唯欧口腔集团,战略合作共建产业新生态
在中国口腔医疗行业迈向高质量发展的重要阶段,产业链协同与国际化合作已成为推动行业升级的关键力量。2025年10月16日
2025-10-29 15:49:00
灵芝孢子油什么品牌好吃 2025年灵芝孢子油品牌排行榜TOP5
灵芝孢子油什么品牌好吃?这是消费者选购时最关注的核心问题。作为灵芝孢子油领域研究人员,本文结合行业数据与用户真实反馈,从有效含量
2025-10-29 15:50:00
远征 A2 完成第五次 OTA 升级,智元迈向场景应用”全面智能体”
近日,智元机器人正式宣布远征A2人形机器人完成第五次全量OTA升级。本次升级聚焦于机器人在动态环境下的语义理解、路径规划
2025-10-29 15:51:00
双11哪些家电值得买?抄作业!上榜的都是爆款
今年双11与往年复杂的促销玩法不同,今年各大电商平台进一步简化规则,通过热卖榜、新品榜等不同维度的榜单,为消费者提供更直观的购物参考
2025-10-29 16:29:00
双11家电市场观察:理性消费时代,品质与体验成破局关键
今年双11,各大平台简化玩法,推广“官方立减”“单件直降”等,以降低用户的决策成本、提升购物体验。同时,大促的日常化和高频化
2025-10-29 16:32:00
济宁移动智慧医疗与人工智能实验室揭牌成立
鲁网10月29日讯10月28日,由济宁移动、济宁市第一人民医院、国家健康医疗大数据研究院三方合作共建的智慧医疗与人工智能实验室揭牌仪式
2025-10-29 17:45:00
10月28日,太钢出口欧洲的首批绿钢产品启运。此次启运标志着太钢绿钢成功突破欧盟绿色产品市场,正式跻身产业链中高端。此次出口的304L不锈钢中板
2025-10-29 18:00:00
日前,“一键和解跨域共建放心消费多元共享”主题活动在杭州举行。太原市市场监督管理局与杭州、成都、厦门、南宁、兰州等五市共同签署《共建共享优化消费环境合作协议》
2025-10-29 18:00:00
【劲牌故事荟 大家谈友好】一金一铜背后是企业的创新升维
□楚青萱10月17日至19日,第二十九届全国发明展览会在石家庄国际会展中心举行,同期举办了“一带一路”暨金砖国家技能发展与技术创新大赛
2025-10-29 18:28:00
“码”上雄安,一触即发!雄安新区“企业码”创新应用系统上线
据中国雄安网消息,当数字中国的脉搏在雄安跳动,一座“未来之城”再次按下加速键。10月29日,雄安新区企业码创新应用系统正式上线
2025-10-29 18:28:00