• 我的订阅
  • 科技

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

类别:科技 发布时间:2024-12-05 09:47:00 来源:机器之心Pro机器之心编辑部

刚刚,人工智能顶会 NeurIPS 公布了今年的最佳论文(包括 Best Paper 和 Best Paper Runner-up,大会注册者可以看到)。

一共有两篇论文获得最佳论文奖:

一是由北京大学、字节跳动研究者共同完成的《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction》(视觉自回归建模:通过 Next-Scale 预测生成可扩展图像),论文一作为田柯宇(此前因涉攻击内部大模型,被字节起诉)。参见机器之心报道《GPT 超越扩散、视觉生成 Scaling Law 时刻!北大 & 字节提出 VAR 范式》。

机器之心获悉,从 2023 年开始,字节商业化技术团队就在研究图像生成的自回归模型,一直将 VAR 作为高优项目推进,不仅安排多名研究人员重点攻关此技术方向,还投入大量算力资源支持模型训练和实验。该团队近期将发布新的 VAR T2I 模型研究成果,并将对模型开源。

二是由新加坡国立大学、 Sea AI Lab 研究者共同完成的《Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators》(随机泰勒导数估计器:任意微分算子的有效摊销),论文一作为 Zekun Shi。

此外,还有两篇论文获得了最佳论文亚军(Best Paper Runner-up):

由厦门大学、清华大学、微软研究者共同完成的《Not All Tokens Are What You Need for Pretraining》(并非所有 token 都是预训练所需的), Zhenghao Lin 和 Zhibin Gou(苟志斌)为共同一作。

由英伟达和阿尔托大学共同完成的《Guiding a Diffusion Model with a Bad Version of Itself》(使用扩散模型的一个糟糕版本引导其自身),论文一作为 Tero Karras。

NeurIPS 2024 将于 12 月 10 日星期二至 12 月 15 日星期日在温哥华举办。本届共收到 15671 篇有效论文投稿,比去年又增长了 27%,但最终接收率低于 2023 年,仅有 25.8%。最佳论文的公布提前引爆了有关此次大会的讨论。

以下是获奖论文的详细信息:

最佳论文

论文 1:Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

作者:Keyu Tian, Yi Jiang, Zehuan Yuan, Bingyue Peng, Liwei Wang 机构:北京大学、字节跳动 论文地址:https://arxiv.org/pdf/2404.02905 项目地址:https://github.com/FoundationVision/VAR

论文简介:在自然语言处理中,以 GPT、LLaMa 系列等大语言模型为例的 Autoregressive(自回归模型已经取得了较大的成功,尤其扩展定律(Scaling Law)和零样本任务泛化能力(Zero-shot Task Generalizability)十分亮眼,初步展示出通往「通用人工智能 AGI」的潜力。

然而在图像生成领域中,自回归模型却广泛落后于扩散(Diffusion)模型:DALL-E、Stable Diffusion、Sora 等模型均属于 Diffusion 家族。

为了「解锁」自回归模型的能力和 Scaling Laws,研究团队从图像模态内在本质出发,模仿人类处理图像的逻辑顺序,提出一套全新的「视觉自回归」生成范式:VAR, Visual AutoRegressive Modeling,首次使得 GPT 风格的自回归视觉生成,在效果、速度、Scaling 能力多方面超越 Diffusion,迎来了视觉生成领域的 Scaling Laws。

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

VAR 为如何定义图像的自回归顺序提供了一个全新的视角,即由粗到细、由全局轮廓到局部精调的顺序。在符合直觉的同时,这样的自回归算法带来了很好的效果:VAR 显著提升了自回归模型的速度和生成质量,在多方面使得自回归模型首次超越扩散模型。同时 VAR 展现出类似 LLM 的 Scaling Laws 和零样本任务泛化能力。

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

论文 2:Stochastic Taylor Derivative Estimator: Efficient amortization for arbitrary differential operators

作者:Zekun Shi, Zheyuan Hu, Min Lin, Kenji Kawaguchi 机构:新加坡国立大学、 Sea AI Lab 论文地址:https://arxiv.org/abs/2412.00088 项目地址:https://github.com/sail-sg/stde

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

在之前的研究中,d 中多项式缩放是通过随机化在优化过程中平摊计算来解决的。另外,单变量函数(d = 1)中 k 的指数缩放通过高阶自动微分(AD)解决。

本研究展示了如何通过正确构造单变量高阶 AD 输入切线(input tangent),有效地对多元函数的任意阶导数张量进行任意收缩,这可用于有效地随机化任何微分算子。

当应用于 PINN( Physics-Informed Neural Networks )时,与使用一阶 AD 进行随机化相比,本文方法提供了 1000 倍以上的速度提升和 30 倍以上的内存减少,而且现在可以在单个 NVIDIA A100 GPU 上在 8 分钟内解决 100 万维 PDE。这项工作开启了在大规模问题中使用高阶微分算子的可能性。

最佳论文亚军(Best Paper Runner-up)

论文 1:Not All Tokens Are What You Need for Pretraining

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

作者:Zhenghao Lin, Zhibin Gou, Yeyun Gong, Xiao Liu, yelong shen, Ruochen Xu, Chen Lin, Yujiu Yang, Jian Jiao, Nan Duan, Weizhu Chen 机构:厦门大学、清华大学、微软 论文地址:https://openreview.net/pdf?id=0NMzBwqaAJ 项目地址:https://github.com/microsoft/rho

论文简介:以前的语言模型预训练方法会统一对所有训练 token 应用下一个 token 预测损失。

但这一范式并非不可挑战。这篇论文的作者首先做出了一个假设:「对于语言模型训练,并非语料库中的所有 token 都同等重要」。

然后,他们分析了语言模型的 token 级训练动态,结果发现不同 token 有着不同的损失模式。

基于这些见解,他们开发了一种新模型 RHO-1。不同于传统语言模型(会学习预测语料库中的每一下个 token),RHO-1 采用了选择性语言建模(SLM),它会选择性地使用与所需分布对齐的有用 token 进行训练。

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

该方法需要使用一个参考模型来给 token 评分,然后再在分数更高的 token 上使用一个重点关注损失(focused loss)来训练模型。

在 15B OpenWebMath 语料库上进行持续预训练时,RHO-1 在 9 个数学任务上的少样本准确率实现了 30% 的绝对提升。经过微调后,RHO-1-1B 和 7B 在 MATH 数据集上分别取得了 40.6% 和 51.8% 的 SOTA 结果 —— 仅用 3% 的预训练 token 就达到了 DeepSeekMath 相当的水平。此外,在对 80B 个通用 token 进行持续预训练时,RHO-1 在 15 个不同任务上实现了 6.8% 的平均提升,数据效率和语言模型预训练的性能都得到了提升。

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

论文 2:Guiding a Diffusion Model with a Bad Version of Itself

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

作者:Tero Karras, Miika Aittala, Tuomas Kynkäänniemi, Jaakko Lehtinen, Timo Aila, Samuli Laine 机构:英伟达、阿尔托大学 论文地址:https://arxiv.org/pdf/2406.02507

论文简介:图像生成扩散模型关注的核心是图像质量、结果的多变程度以及结果与给定条件(例如类标签或文本提示)的对齐程度。

常见的无分类器引导方法是使用无条件模型来引导条件模型,这样既能实现更好的提示词对齐,也能得到更高质量的图像,但代价是多变程度下降。

这些效果似乎本质上是纠缠在一起的,因此很难控制。

基于此,该团队得出了一个令人惊讶的观察结果:通过使用较小、训练较少的模型版本(而不是无条件模型)来引导生成,就可以在不影响多变程度的情况下获得对图像质量的控制。由此,图像质量与多变程度就分离了。

实验表明,这能显著提升 ImageNet 生成效果。他们使用公开可用的网络,为 64×64 分辨率下的生成创造了 1.01 的 FID 记录,为 512×512 创造了 1.25 的 FID 记录。此外,该方法也适用于无条件扩散模型,可极大提高其质量。

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-05 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...跳动奖学金”评选结果,来自北京大学、北京邮电大学、清华大学、香港大学、香港城市大学、新加坡管理大学、新加坡国立大学、浙江大学(按拼音首字母排序)的15名在校生获奖,每人获得奖
2025-01-15 16:41:00
...博士毕业生加入。成立短短数月内,豆包大模型团队57篇论文中选ICLR、CVPR、NeurIPS等顶会,研究成果包括下载量超百万的开源工作及GitHub万星项目
2025-01-23 09:51:00
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...击字节训练集群的实习生,居然刚刚获得了NeurIPS 2024最佳论文奖?虽然看起来像爽文剧情,但这位高材生接下来的路
2024-12-05 09:47:00
NeurIPS 2024最佳论文开奖!北大字节NUS夺冠,Ilya连续三年获奖
【新智元导读】NeurIPS 2024最佳论文终于正式揭晓了!今年,来自北大字节,以及新加坡国立大学等机构的团队摘得桂冠
2024-12-12 09:41:00
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...构。这一架构提出3个月后,Sora采用的同源基础架构DiT的论文才发表;2023年3月,朱军团队在全球首发并开源基于U-ViT架构的多模态大模型UniDiffuser
2024-04-28 11:00:00
清华硕士吐槽大厂只给2万月薪践踏学历,北大毕业者讲述:低薪恶心这种思维很学生
一则网帖提到,清华大学应届硕士生拿到某互联网公司的offer,职务是位于北京的“后端开发工程师-基础架构”。他吐槽,“给了月薪2万,甚至不如本科,恶意低薪很恶心,践踏学历制度。”
2023-01-19 08:21:00
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...经被国际人工智能协会(AAAI)接受,并获得了最佳学生论文奖的提名。自毁模型的引入标志着一个新的方式,以确保大型AI模型不会被滥用
2023-10-18 10:00:00
2023 CCF国际AIOps挑战赛决赛成功举办
...织和企业加入进来,共同受益。 接下来的“运维大模型论文闪电分享”环节,带来了ESEC/FSE2023、ICLR2023
2023-12-20 13:45:00
字节跳动清华AIR成立联合研究中心 推动大模型产学研合作
10月11日,清华大学智能产业研究院(AIR)-字节跳动 “可扩展大模型智能技术联合研究中心 (SIA Lab) ” 在清华大学举行成立仪式
2024-10-12 14:01:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者张甜甜 通讯员夏俊林娜10月31日,南京市统计局、国家统计局南京调查队发布南京经济“三季报”
2025-11-01 09:44:00
上海虹桥医院癫痫专病诊疗新高度:个性化方案,全程化守护
癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响,构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失
2025-11-01 10:05:00
第十季炒股大赛冠军诞生:光伏逆变器行业龙头涨幅登顶
在《大众证券报》读者俱乐部第十季炒股比赛中,选手“馨小憩”以159.84元/股推荐的阳光电源(300274),荐股涨幅19
2025-11-01 11:00:00
近日,国内首款真空高压铸造人形机器人腿部骨骼零部件在中信戴卡股份有限公司研制成功并生产下线,首批20件量产产品已发往国内客户
2025-11-01 11:10:00
视频制作:陈希河北新闻网讯(记者 李春炜)随着AI技术飞速发展,在今年的双十一期间,AI笔记本也成为爆款产品。近日,记者走进安徽合肥的联想PC设备研发和制造基地
2025-11-01 15:39:00
10月30日,“版权强企燕赵行”活动走进保定市高阳县。活动通过进企问需、校企对接、版权法律法规科普、版权服务平台及版权区块链平台推介等方式
2025-11-01 15:47:00
10月30日,在由盖世汽车主办的2025第七届“金辑奖”颁奖盛典上,东软集团凭借在智能汽车互联领域持续的产品创新与卓越的全球化实践
2025-11-01 16:16:00
钻戒定制怎么选?2025五大宝藏品牌全解析,一篇避坑
准备结婚选钻戒,却被天然钻的高价劝退?想入手培育钻戒,又怕遇到“参数虚标”“售后无保障”的问题?2025年培育钻石市场规模突破300亿元
2025-11-01 16:17:00
第三十七届中国仿真大会在合肥市庐阳区召开
大皖新闻讯 11月1日,第三十七届中国仿真大会在合肥市庐阳区召开,大会以“数智仿真、新质发展”为主题,吸引全国约千名学者与业界代表
2025-11-02 00:04:00
“科大讯飞1024科博展”亮点抢先看!现场黑科技拉满,免费开放
大皖新闻讯 想让AI陪你对弈吗?想穿越时空与孙悟空来场“智慧交锋”吗?第八届世界声博会暨2025科大讯飞全球1024开发者节科博展将于11月2日至6日在合肥体育中心启幕
2025-11-02 00:04:00
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00