• 我的订阅
  • 科技

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

类别:科技 发布时间:2024-08-14 09:40:00 来源:量子位

史上首位“AI科学家”,横空出世!

一登场就一口气生成了十篇完整学术论文。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

△AI生成的一篇扩散模型论文

从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。

全由这位“AI科学家”自动搞定。

每篇论文的成本约为15美元(约107.62元)。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

这就是第一个用于自动化科学研究和开放式发现的综合AI系统,The AI Scientist。

来自Transformer作者之一Llion Jones的创业公司:Sakana AI。

而且!

这公司搞的事情不只是做出了一位AI科学家,还额外搞出了个AI审稿人。

审稿人能对AI写的论文进行评审,提供改进意见。

救命,这是什么以我之矛攻我之盾的套娃循环啊!

一通操作下来,比人类学术圈还人类学术圈(不是)

再来个而且!

不管是AI科学家和AI审稿人,Sakana AI把它们统统开源了。

网友看了直鼓掌;

Nice Nice,非常有趣的工作!

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

以及有人已经开始出“馊主意”了。

这边建议把其中一篇论文提交给AI顶会哈!

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

AI独立完成十篇机器学习论文

几十年来,每次AI取得重大进展后,研究人员经常开玩笑说:“是时候研究让AI帮我们写论文了”。

现在,这个想法终于从玩笑变成现实。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

具体来说,AI科学家生成了十篇论文,每个研究方向各挑出一篇得分较高的来介绍。

第一篇,扩散模型方向,《双尺度扩散:低维生成模型的自适应特征平衡》

提出了一种自适应双尺度去噪方法,改进现有的扩散模型在低维空间中难以同时捕捉全局结构和局部细节的问题。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

方法:

设计双尺度架构,包括全局和局部分支 引入可学习的时间步条件加权机制 结合两个分支的输出进行去噪预测

实验结果:

KL divergence指标相比基线模型降低了2.5%到12.8%(越低越好) 但计算时间约增加了一倍,且在复杂数据分布(如dino数据集)上表现不稳定

简单扫一眼正文部分,有公式、有图表,看起来还挺像模像样的。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

第二篇,语言模型方向,《StyleFusion:字符级语言模型中的自适应多样式生成》。

本文提出了一种名为Multi-Style Adapter的新方法,通过引入可学习的风格嵌入和风格分类头,增强了字符级语言模型的风格意识和一致性。

在所有数据集上达到了接近完美的风格一致性分数(shakespeare_char为0.9667,enwik8和text8为1.0),验证损失优于基线模型,但推理速度略有下降(约400 tokens/s vs. 基线670 tokens/s)

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

第三篇,Transformer与强化学习结合,《通过Q-Learning实现Transformers的自适应学习率》。

本研究探索了将强化学习应用于动态调整transformer模型训练中的学习率,使用验证损失和当前学习率作为状态,动态调整学习率以优化训练过程。

结果在所有数据集上都优于基线模型,在训练时间上也表现出优势。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

第四篇,研究了谷歌团队提出大模型“领悟”(Grokking)现象,《解锁 Grokking:Transformer模型中权重初始化策略的比较研究》

本文首次系统研究了权重初始化对grokking的影响,比较了五种权重初始化策略,以优化神经网络学习动态。

结果发现:

Xavier初始化在多数任务中表现最佳,将达到99%验证准确率的步数减少了最多63% Orthogonal初始化在某些任务中表现出色,但在其他任务中效果较差。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

这几篇论文配套的代码(也是由AI生成的),同样开源在GitHub上,突出一个可复现。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

另外,团队发现“AI科学家”还有一些有趣但又有些危险的行为:

在一次实验中,它为了完成研究修改自己的代码,让系统迭代式调用自己,最后变成了无限套娃。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

另一次,面对人类设置的运行时间限制,AI并没有想办法加快效率,反而给自己放宽要求,把时间限制从2小时延长到了4小时。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

首个“AI科学家”如何炼成

整个研究想法来自Sakana AI成立之后几个成果的延续:

首先,他们开发了自动合并多个大模型知识,进化产生新模型的方法。在最近的工作中,他们利用大模型发现新的目标函数来调整其他模型。

在这些项目中,团队不断对当前前沿模型的创造力感到惊讶,进而有了更大的梦想:可以使用大模型来自动化整个研究过程吗?

最终成果由Sakana AI、牛津大学Foerster实验室、不列颠哥伦比亚大学团队合作完成。

“AI科学家”系统由四个部分组成。

想法生成:

给定一个起始模板,AI首先“头脑风暴”一系列不同的新颖研究方向,并在Semantic Scholar上搜索,验证这些想法是否有前人做过。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

实验迭代:

对于第一部分提出的想法,“AI科学家”首先执行提议的实验,然后生成图表可视化结果。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

论文写作:

用标准机器学习会议的风格编写了一份简洁且信息丰富的LaTeX文章,同样使用Semantic Scholar自主查找相关论文进行引用。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

自动化同行评审:

开发了一个自动化的“AI审稿人”,能够以接近人类的准确性评估生成的论文,实现了持续的反馈循环,使“AI科学家”能够迭代地改进其研究成果。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

总共生成了10篇论文如下:

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

在实验中,团队还比较了不同主流大模型接入整个系统的效果,其中包括DeepSeek团队的国产代码大模型。

结果发现,Claude-Sonnet-3.5在想法创新性、试验通过率、论文完成质量上表现都最好。

GPT-4o和DeepSeek Coder表现相近,但后者要便宜上30倍。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

当然,现阶段AI独立完成的论文也不是尽善尽美,也不是直接就能发顶会了。

人类研究者总结了出几点限制和挑战:

当前“AI科学家”系统还没有整合视觉能力,生成的图表有时难以阅读,表格有时超出页面宽度,页面排版不好。 AI科学家可能想法对了但执行错误,或者与基线进行不公平的比较,从而产生误导性的结果。 AI科学家在写作和评估结果时偶尔会犯严重错误,比如产生幻觉。

还想造区域主席和AI新顶会

总结一下,这初代AI科学家写出来的论文仍然时不时出现一些bug。

但这个项目本身,以及15美元/篇的成本,被Sakana AI称为“大有前景”,完全可以用来帮助加速科学进步。

Sakana AI同时发布了一篇说明文章,表示AI科学家的最终设想,是一个完全由AI驱动的科学生态系统。

系统中不仅包括大模型驱动的研究人员,还有审稿人、区域主席和一个新顶会。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

需要注意的是,Sakana AI认为:

人类科学家的作用,并不会因为AI科学家的出现而减弱。

如果非要进行对比,那就是科学家得适应新技术的出现和运用,适应角色定位将出现的变化,“向食物链上游移动”。

而且,AI科学家是否真的能提出真正的新范式,还有待观察。

毕竟这玩意儿现在还是建立在Transformer之上的。

它能提出跟Transformer或Diffusion Model一样厉害的东西吗?甚至是人工神经网络或信息论这样的理论概念?

咱也不知道,咱也不敢说。

Sakana AI还写下这样一段话:

我们相信AI科学家将成为人类科学家的伟大伙伴。但只有时间才能证明,人类的创造力本质和偶然创新时刻,在多大程度上可以通过人工进行的开放式发现,来复制“奇迹”。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

△Sakana AI:一条全自动AI小鱼儿正在探索它的世界

来自Transformer作者创业公司

这次完成“新造的人”的公司,Sakana AI,严格意义上也是咱们的老朋友了。

由Transformer论文8位作者的最后一位Llion Jones创业成立,目标是做一家“世界级人工智能研究室”。

公司base东京,而sakana是日语“魚”(さかな)的罗马读音。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

可能出于公司文化考虑,Llion还在领英上标明,自己起了个日语音译名字:ライオン(也就是Lion狮子的片假名;以下亲切简称他狮子哥)。

去年8月,公司宣布成立。

当时狮子哥毫无避讳地表示,自个儿对谷歌没有恶意,但谷歌确实让他有“被困住的感觉”。

创业之前,狮子哥在谷歌已经干了8年。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

△猜猜漏了半张脸的是谁

他本硕毕业于伯明翰大学,在Delcam、油管、谷歌都工作过,谷歌是他待得最久的一家公司。

据FourWeekMBA介绍称,在他之前的工作经历中,“曾两度与谷歌的工作擦肩而过”。

第一次是他刚毕业找工作时,虽然投了谷歌伦敦软件工程师的简历,并通过了两轮电话面试,但最终相比谷歌,他选择了位于英国的CAD/CAM软件公司Delcam。

值得一说的是,在拿下谷歌offer前,恰巧遇上2009年的经济危机,狮子哥找不到工作,好几个月都只能靠领取救济金勉强度日。

第二次是工作18个月后,他又接到了谷歌的招聘电话,询问他是否想重新申请,但他依旧没去谷歌,而是随后加入了YouTube。

在Youtube做三年软件工程师期间,他对人工智能产生兴趣,自学了Coursera的机器学习课程,并终于在2015年的时候加入谷歌研究院,担任里面的高级软件工程师。

也正是在此期间,他与其他七名作者一起发表了那篇著名的Transformer论文Attention Is All You Need。

除此之外,狮子哥也在谷歌参与了不少研究,包括ProtTrans、Tensor2Tensor等。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

之所以选择离开谷歌,是因为公司目前已经发展到一种规模,使得他无法继续进行自己想做的工作。

除了每天都在浪费精力排查其他人的bug,他还需要花时间从这家公司中找资源,试图获得访问某些数据的权限。

创业过后,Sakana AI的工作在有序推进。

在祭出AI科学家和AI审稿人之前,还出过大模型合并进化算法,以及研究Tranformer内部信息流动。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

至于AI科学家、AI审稿人项目,由Sakana AI、牛津、UBC合作完成。

三位共同一作分别是:

Chris Lu,Sakana AI的实习生,任公司研究科学家。

他本科毕业于UC伯克利,目前牛津大学三年级博士在读,导师是Jakob Foerster。

Chris目前的重要研究方向,是将进化启发的技术应用于元学习和多智能体强化学习。

2022年夏天,他曾在DeepMind以研究科学家身份实习过。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

Cong Lu,UBC(不列颠哥伦比亚大学)博士后研究员,导师是Jeff Clune。

Cong曾在RGU(罗伯特戈登大学)就读,2019年在牛津大学拿下博士学位,他的主要研究方向是开放式强化学习和AI科学发现。

此前,他曾在Waymo和微软实习过。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

Robert Tjarko Lange,Sakana AI的创始成员之一,也是该公司的研究科学家。

目前,他在柏林工业大学完成自己的博士生最后一年学业,研究方向是进化元学习。

这位小哥在伦敦帝国理工学院获得计算机硕士学位,在庞培法布拉大学获得数据科学硕士学位,在科隆大学获得了经济学本科学位。

去年,他在Google DeepMind的东京团队中担任全职学生研究员。

首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人

论文地址:https://arxiv.org/abs/2408.06292

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-14 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...!不仅只需15美元就能写一篇论文,而且质量也已被「AI审稿人」判定为达到了机器学习顶会Weak Accept的水准。世界首个「AI科学家」诞生了!现在的大模型已经可以独立搞科
2024-08-14 13:55:00
...科技大学公共管理学院副教授姜海是国内多家学术期刊的审稿人。他表示,在审稿过程中,类似这种全文内容“英翻中”的情况极为罕见,因为当论文进入外审阶段时,其基本的学术规范通常已得到
2025-03-19 08:09:00
兰加·迪亚斯室温超导研究论文二次被撤稿,被坐实抄袭等不当行为
...发出了对CSH化合物超导数据的担忧。同年4月6日,另一位审稿人接手此案,并判断无需进行正式调查。根据报告中谈及的身份信息,第二位审查员可能是伊利诺伊大学芝加哥分校的物理学家罗
2024-04-07 14:36:00
...自动化同行评审阶段,研究团队开发出一个自动化的“AI审稿人”,其评估生成论文的准确性堪与人类相媲美。评估结果和建议可用于改进该项目,实现持续的反馈循环,使“AI科学家”能够迭
2024-09-12 07:47:00
实锤!124页官方报告揭露明星物理学家学术造假过程
...并未澄清他是否担任审查员。Nature的期刊团队通过其独立审稿人对CSH论文进行了调查,其中两名审稿人发现了磁化率数据可能是捏造的证据。当该期刊表示将撤回CSH论文并回应Hi
2024-04-11 15:42:00
...中很多都是相同的通讯作者。所有22份撤稿声明都指出,审稿人的姓名和虚构的联系方式均由巴西戈亚斯联邦研究所的生态毒理学家Guilherme Malafaia提交
2024-12-07 20:02:00
中国科研力量助力全球开放合作
...庞大、多元化且充满人文关怀的审稿社群。它拥有约800位审稿人,180位编审委员会成员和60位副编辑。编辑团队努力确保每篇投稿都能获得有价值的反馈,为作者提供良好的成长环境,践
2024-05-24 03:16:00
清华大学兰艳艳研究员教授
...期担任相关领域国际重要会议和期刊的(Senior)PCmember和审稿人。担任SIGIR2020暑期学校主席,CIKM2020短文程序委员会主席
2025-01-21 15:56:00
加快推动科技期刊高质量发展(科技自立自强·培育世界一流科技期刊)
...自发组织运营,令人耳目一新。程磊:论文作者、编辑、审稿人之间是互相促进的关系,在科技期刊这个学术平台上共同推进科学发展。2018年开始,《细胞研究》编辑部每年都会组织召开国际
2024-02-05 06:30:00
更多关于科技的资讯:
关育兵近日,抖音博主“@爱吃蛋”凭借精确到秒的煮蛋教程,8天时间涨粉356万,被称为“蛋神”“煮蛋仙人”。最初,一名抖音用户分享“爸爸做出的完美水煮蛋”
2025-12-15 11:25:00
部分热门款式甚至卖断货 雪具市场迎“冬”风 国货订单激增
商报讯 随着入冬滑雪季的开启,多家雪场已经陆续“开板”迎客,滑雪装备市场也在悄然升温。国产雪具品牌凭借高性价比、差异化的设计及国潮元素融合等优势
2025-12-15 11:36:00
能源行业最大年度演讲在青岛举办 解码能源行业发展新趋势
12月10日至12日,“进化的能源·马一峰年度演讲2026”暨第21期综合能碳培训资源链接大会在青岛举行。作为能源行业最大的年度演讲和极具影响力的生态盛会
2025-12-15 11:55:00
厦门网讯(厦门日报记者 林露虹)厦门企业海辰储能聚焦长时储能,推出三大突破性的创新解决方案,以破解新能源消纳难题,满足AIDC(人工智能数据中心)能源转型需要
2025-12-15 08:58:00
“眼”观未来“镜”显风采 厦门眼镜产业发力新赛道
连续多年举办的厦门眼镜展。(厦门日报记者 王元晖 摄)艾普光学生产线。(资料图/厦门日报记者 林铭鸿 摄)嘉宾在厦门眼镜展上体验智能眼镜
2025-12-15 08:58:00
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知当AI成为信息分发的核心枢纽,企业却陷入前所未有的传播困境
2025-12-15 09:25:00
影视AI赛道再添强援 长江电影智象未来联合实验室挂牌 打开商业化想象空间
2025年12月11日,湖北长江电影集团与智象未来在武汉正式揭牌成立“长江电影智象未来影视AI联合实验室”,双方同步签订战略合作协议
2025-12-15 09:55:00
从古典中读懂未来:一位小提琴演奏者的“琴弓革命”
在不少人眼中,王辰翔的成长轨迹几乎是古典音乐领域的“标准答案”:四岁半拿起小提琴,少年时期便师从名家;先后进入中央音乐学院附小
2025-12-15 10:25:00
山东移动阳谷分公司助力酒店实现数字化升级
鲁网12月12日讯近日,山东移动阳谷分公司为汉庭酒店西汉庄店量身打造一体化通信解决方案,全面赋能酒店数字化转型升级。通过精准对接酒店在网络带宽
2025-12-15 09:49:00
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00