• 我的订阅
  • 科技

谷歌deepmind公布ai模型训练法

类别:科技 发布时间:2023-12-16 02:20:00 来源:浅语科技

12月15日消息,谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法,号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。

谷歌deepmind公布ai模型训练法

▲图源谷歌DeepMind(下同)

据悉,FunSearch模型训练法主要为AI模型引入了一个“评估器(Evaluator)”系统,AI模型输出一系列“创意解题方法”,“评估器”则负责评判模型输出的解题办法,反复迭代后,就能训练出数学能力更强的AI模型。

谷歌DeepMind使用PaLM2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由评估器进行评估,其中“最佳解法”将会被重新加入到代码池中,重新开始另一次迭代。

IT之家注意到,FunSearch训练法对“离散数学(Combinatorics)”特别擅长,经训练法锻炼后的模型,可以轻松解决极值组合数学问题,研究人员在新闻稿中便介绍了模型计算“上限级问题(数学中涉及计数和排列领域的一个中心问题)”的过程方法。

谷歌deepmind公布ai模型训练法

此外,研究人员也成功使用FunSearch训练法解决了“装箱问题(BinPackingProblem)”,这是一个“将不同大小物品放进最少数量容器”的问题。

谷歌deepmind公布ai模型训练法

FunSearch为“装箱问题”提供一种即时性的解决方案,生成了一项“根据物品现有体积自动进行调整”的程序,研究人员提到,与其他利用神经网络进行学习的AI训练法相比,经过FunSearch训练法锻炼后的模型,输出的代码更易于检查与部署,也就代表更容易被整合到实际工业环境中。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-12-16 09:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,通常依赖于把监督微调(SFT)这个环节。在这个阶段,研究人员会使用大量已标注的数据对预训练的AI模型进行进一步训练。这些数据包含了问题及其对应的正确答案,以及如何建立思考步
2025-05-27 10:23:00
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...广泛关注。据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型
2025-02-07 06:25:00
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...训练模型之间的表现,后者是一个*大14倍的预训练模型。研究人员考虑了在两种模型中都预期会有 tokens的预训练和 tokens的推理
2024-09-12 09:58:00
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...导致过拟合,从而影响其原始性能。为了解决上述问题,研究人员期望探索更有效的检索和即时编辑方式,以及对模型进行更小的干预,以避免在编辑数据集上过度拟合。 模型方法知识编辑相关
2024-10-30 09:57:00
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面
2024-09-06 10:01:00
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
...?OpenAI则极力否认AI模型训练面临瓶颈。作为应对,OpenAI研究人员正在探索一项“测试时计算”(training runs)的技术
2024-11-13 14:09:00
“GPT-N”一定更强吗?专家警告:当人类数据用完 AI大模型或将越来越笨
...来训练自己时,又会怎样?近日,牛津大学、剑桥大学的研究人员及其合作者对这一问题进行了研究,并将研究成果论文发表在了预印本网站 arXiv 上
2023-06-14 11:31:00
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较
2023-10-17 16:31:00
成本不到150元!26分钟训出个推理模型 媲美o1和R1
...1团队的目标是寻找到Test-time Scaling的简单方法。过程中,研究人员先构建了一个1000个样本的数据集
2025-02-07 15:14:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 翁华鸿 通讯员 周平)近日,市公共资源交易中心正式上线渔港工程电子交易系统,标志着我市渔港工程建设项目实现就地
2026-01-27 08:02:00
人头攒动、美食飘香,腊八节前后,小店区商圈已提前奏响欢快的“幸福交响曲”,各大商超、酒店等纷纷亮出“年货王牌”,点燃市民的采购热情
2026-01-27 08:07:00
从哈尔滨到杭州,跨越2000多公里,去年刚刚大学毕业的“00后”小陆,昨天下午走进了西湖区三墩镇后陡门58号,这个因劳动纪实综艺《种地吧》成为青年心中的“奋斗地标”
2026-01-27 07:55:00
还在为办理社保业务材料不全时奔波而烦恼吗?近日,杭州“社保易窗”智能服务平台推出两项暖心新功能——“服务回单办件反馈”与“补充材料自助上传”
2026-01-27 07:25:00
阿里千问最强模型重磅亮相!性能媲美GPT-5.2、Gemini 3 Pro
1月26日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录,性能媲美GPT-5
2026-01-27 07:38:00
■徐金星摘要:在数字经济持续深化发展的背景下,新一代信息技术正深刻影响组织的人力资源管理方式。招聘管理作为人力资源管理体系的起点
2026-01-27 05:12:00
江南时报讯 近日,江苏省数据局公示全省第一批拟入库培育数据企业名单,苏州农商银行凭借在数据应用领域的创新突破和数字化转型的扎实成效
2026-01-26 22:59:00
马伯庸张小龙相关展品亮相 知乎举办15周年线下展览
中国青年报客户端讯(中青报·中青网记者蒋肖斌)1月26日,是知乎成立15周年,主题为“当经验流过时间”的15周年线下展在北京举办
2026-01-26 20:27:00
“每个企业的基因不同、体质不同,腾讯的风格就是稳扎稳打。”腾讯2026年员工大会上,面对外界AI焦虑,腾讯董事会主席兼首席执行官马化腾一开场
2026-01-26 21:04:00
临沂联通以自研数智能力助力三星智慧工地建设
鲁网1月26日讯近日,临沂联通依托省联通自研平台与全流程服务优势,成功签约某集团三星智慧工地项目,标志着联通自研技术在建筑数字化场景中的落地应用
2026-01-26 17:06:00
河南省政协委员王延哲:建议推出“Token券”,助力河南竞逐AI漫剧新赛道
大河网讯 (记者 刘瑞朝)1月26日上午,河南省十四届人大四次会议开幕,省长王凯作政府工作报告。报告提出,积极发展电竞潮玩
2026-01-26 18:16:00
“1元体验两小时羽毛球”“9.9元试听英语课或乐器培训、编程入门”等低价体验课在平台上有可观的销量。然而,除了便宜这个优点之外
2026-01-26 18:30:00
近日,《中国消费者报》评选出的2025年全国十大消费新闻,串联起全年消费市场的政策导向、业态变革与维权焦点,见证了提振消费政策落地的实效
2026-01-26 18:30:00
2026少儿英语线上外教怎么选?实测口碑榜,家长闭眼不踩雷
其实,选线上外教课,关键就在于适合孩子。怎么才算适合?先得明确孩子的语言培养方向。如果孩子还小,处于启蒙阶段,那重点就该放在口语启蒙上
2026-01-26 18:51:00