• 我的订阅
  • 科技

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

类别:科技 发布时间:2024-06-21 09:21:00 来源:量子位

CVPR 2024最佳论文奖新鲜出炉,生成式AI成最大赢家!

一篇是Rich Human Feedback for Text-to-Image Generation,受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。

这项研究来自UCSD、谷歌等,共同一作华南农业大学校友Youwei Liang、清华校友Junfeng He、武大、港中文校友Gang Li。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

另一篇Generative Image Dynamics更偏理论一些,提出了一种基于图像空间先验的场景运动建模方法,可用于通过静态图像生成无缝循环视频,还能实现与图像中对象的交互。

这项研究来自谷歌,一作谷歌DeepMind研究员Zhengqi Li(李正奇)。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

最佳学生论文奖也一同公布。

一篇BioCLIP: A Vision Foundation Model for the Tree of Life,构建了大规模生物学图像数据集,并提出BioCLIP基础模型来学习生物分类的层次表示。

来自俄亥俄州立大学等,共同一作Samuel Stevens,Jiaman Wu。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

另一篇是3D高斯泼溅领域的Mip-Splatting: Alias-free 3D Gaussian Splatting,通过引入3D平滑滤波器、用2D Mip滤波器替换2D膨胀滤波器来消除伪影和混叠等问题。

来自图宾根大学、上海科技大学等,三位一作Zehao Yu、Anpei Chen(陈安沛)、Binbin Huang皆为上海科技大学在读或毕业生。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

今年CVPR的参与规模和受关注度都达到了新高度,在颁奖活动结束后不久,官网就被挤爆了……

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

OpenAI还在一场活动中现场献上GPT-4o语音和视觉模式的最新Demo。

今年CVPR共收到投稿11532份,比上年增加25%,其中2719篇论文被接收,接收率为23.6%,竞争非常激烈。

接下来一起看看获奖论文是如何脱颖而出的。

最佳论文

Rich Human Feedback for Text-to-Image Generation

论文作者来自加利福尼亚大学圣地亚哥分校、谷歌研究院、南加州大学、剑桥大学、布兰代斯大学。

当前文本生图模型生成的图像仍存在失真、与文本不匹配、美学质量差等问题,而现有评估指标如IS、FID等无法反映单个图像的质量细节问题。

先前一些工作尝试采集人类偏好或评分作为反馈,但仍然是单一的整体得分,缺乏可解释性和可操作性。因此,作者提出了收集丰富的细粒度人类反馈信息,用于更好地评估和改进生成模型。

作者用Stable Diffusion生成的Pick-a-Pic数据集筛选了18K张图像,之后收集了“标注文本描述中与图像不匹配的关键词”、“标记图像中的失真/不合理区域”等人类反馈信息。每张图像由3人独立标注,通过平均/投票等方式合并得到最终反馈标签。

之后,设计了一种基于ViT和T5X的多模态Transformer模型RAHF,使用三种预测器预测上述丰富的人类反馈信息:

使用卷积层和上采样层预测失真和不匹配的热力图 使用卷积层和全连接层预测4个方面的评分 使用Transformer解码器生成带有特殊token的文本序列,标识不匹配的关键词

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

实验中,RAHF模型在多个任务上显著优于基线模型,如ResNet-50和CLIP。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

此外,作者还探索了三种利用RAHF预测的丰富反馈来改进文本到图像生成模型Muse方法。

使用预测的质量评分筛选优质数据微调Muse模型,生成图像的质量前后对比如下:

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

使用预测的失真热力图生成掩码区域,在该区域内对Muse生成图像进行局部修补,减少了生成图像的失真问题:

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

Generative Image Dynamics

论文作者来自谷歌研究院。

自然界中的场景总是在运动,即使是看似静态的场景也会因为风、水流、呼吸等而产生微妙的振荡。

论文提出了一种从单张静态图像生成自然振荡动画的新方法,而且支持用户与图中物体进行交互:

团队发现自然场景中的振荡运动,如树叶摆动等,主要由低频分量组成,因此引入了谱体积作为运动表示,即对视频序列中提取的像素运动轨迹进行傅里叶变换得到的频域表示,只需少量的低频傅里叶系数即可保留大部分运动信息。

然后,作者采用潜变量扩散模型从输入图像预测谱体积,并提出了频率自适应归一化和频率协调去噪两种策略来提高预测质量。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

最后,将预测的谱体积通过逆傅里叶变换转化为运动纹理,并设计了一种基于图像的渲染模块,将输入图像按预测的运动轨迹进行前向渲染,最终生成展现自然振荡运动的动画视频序列。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

结合基于图像的渲染模块,这些轨迹可以用于多个应用场景,例如将静态图像转换为无缝循环的视频,或者通过将光谱体积解释为图像空间模态基底,近似物体动态,让用户能够与真实图片中的物体进行逼真的交互。

作者从定量和定性两方面评估生成视频的质量,结果显示该方法明显优于基准:

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

最佳学生论文

BioCLIP: A Vision Foundation Model for the Tree of Life

论文作者来自俄亥俄州立大学、微软研究院、加利福尼亚大学欧文分校、伦斯勒理工学院。

他们构建了一个大规模生物学图像数据集TreeOfLife-10M,包含1040万张图像,覆盖454103个生物物种,并提出了BioCLIP模型,利用CLIP式的多模态对比学习目标,结合生物学分类层次结构用TreeOfLife-10M数据集预训练模型。

使用该方法可很好地捕获生物分类体系的层级结构,从而实现对看不见类别样本的泛化能力。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

Mip-Splatting: Alias-free 3D Gaussian Splatting

3D高斯溅射展示了令人印象深刻的新颖视图合成结果,达到了高效率和高保真度。然而,当改变采样率时,例如通过改变焦距或相机距离,可以观察到强烈的伪影。

团队发现这种现象的根源可归因于缺乏3D频率约束和2D膨胀滤波器的使用。

为了解决这个问题,团队引入了一个3D平滑滤波器,根据输入视图引起的最大采样频率来限制3D Gaussian primitive的大小,从而消除放大时的高频伪影。

此外,用模拟2D盒式滤波器的2D Mip滤波器替换2D膨胀滤波器,可以有效缓解混叠和膨胀问题。

CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖

团队还提供了在线演示,感兴趣的可以玩起来了。https://niujinshuchong.github.io/mip-splatting-demo/

最佳论文:https://arxiv.org/abs/2312.10240https://generative-dynamics.github.io

最佳学生论文:https://arxiv.org/abs/2311.16493https://arxiv.org/pdf/2311.18803

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-21 12:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华南农业大学迎来办学115周年:加快建设农业特色世界一流大学
...生共同创作,近四百场高端学术报告贯穿全年……连日来,华南农业大学(以下简称“华南农大”)以迎来办学115周年为契机,以“薪火相继,聚力一流”为主题,举办“学术华农”“文化华农
2024-11-11 12:41:00
三秩芳华 湖南农大举行土地资源管理专业本科办学30周年庆典
本文转自:人民网-湖南频道仪式现场。王思雨摄三十载砥砺耕耘,三十年春华秋实。10月19日,湖南农业大学资源学院土地资源管理专业本科办学30周年暨专业建设36周年庆典活动在湖南农业
2024-10-19 19:46:00
华南理工大学建校70周年校庆:77级校友李东生谈“笃行”精神
本文转自:人民日报客户端12月17日,华南理工大学庆祝组建70周年。华南理工大学1977级校友,TCL创始人、董事长李东生作为校友代表发言,分享自身坚守实业40多年的“笃行”精神
2022-12-17 15:59:00
49位科学家上榜,清华方璐、复旦周鹏等获得科学探索奖
...首创全前向智能光计算训练架构,戴琼海、方璐领衔》。华南理工大学 章秀银章秀银,华南理工大学电子与信息学院教授、博导
2024-08-27 09:53:00
...。中国工程院院士、中国农业大学校长孙其信指出,中国农大校友为母校捐赠设立专项基金,是校企双方共同推动科技创新与产业创新深度融合发展的重要行动。面向新一轮科技革命和产业变革的重
2025-05-26 09:03:00
清华大学校友走进镇海再签一批科创项目“镇海是个宜居宜学宜养宜创的地方,希望各位校友在这片生机勃勃的土地上,发挥聪明才智,能够拥有更好的发展。”在近日举行的清华大学校友走进镇海暨庆
2023-06-29 09:41:00
故园花开待燕归,茶香薪火映中原!河南农大园艺学院校友返校周见证五代兴农路
...源于根脉的馈赠,像一粒饱含希望的种子,必将催动更多农大学子,将青春的智慧深扎中原沃野。“回想在河南农大求学的七年时光,是学校教会我如何把论文写在大地上。”说话时,李亚磊的眼中
2025-07-07 14:28:00
广西农业农村厅与华南农大签战略合作协议
...平记者从广西农业农村厅获悉,日前,广西农业农村厅与华南农业大学校地合作恳谈会在广州举行。会上,双方签署了战略合作框架协议。座谈会现场。邓蕾雅摄根据签约协议内容,双方将联合开展
2024-03-21 21:41:00
...东蓝洋科技有限公司(Guangdong Bluesea Technology Co., Ltd.)与华南农业大学联合研发的发明专利《光诱导阳离子聚合纯植物油基聚合物及其制备方
2025-06-10 07:12:00
更多关于科技的资讯:
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00
本报讯(记者雷嘉)围绕国产车规级芯片搭载应用,北京市科委、中关村管委会会同北京市智慧城市基础设施与智能网联汽车协同发展办公室
2025-09-05 11:08:00
河北新闻网讯(王丽英)“后厨不只是生产中心,更是服务体验的心脏。”“服务不仅仅是完成交易的过程,更是以关怀为主利他主义精神的体现
2025-09-05 11:08:00
海信冰箱五款产品通过中国家用电器研究院自动制冰性能认证
日前,经中国家用电器研究院严格检测与评估,海信冰箱旗下五款产品成功通过“电冰箱自动制冰性能认证”,并获颁认证证书。此次获证不仅是对海信冰箱自动制冰技术性能的肯定
2025-09-05 11:57:00
京东全球80+高校招聘 清华、剑桥等80校专场 现场面试拿offer!
9月5日,京东招聘公众号发文:全球80+高校!京东2026校园招聘进校行程发布。文中称:将在全球20+城市,80+院校
2025-09-05 12:10:00
花一万元植入DeepSeek,一场没有终点的流量游戏
文|邓咏仪编辑|苏建勋让你的产品在DeepSeek的答案里有一席之地,需要多少钱?答案是:数千甚至上万元。人在哪,流量就在哪
2025-09-05 14:56:00
爱尔眼科开启老视多学科诊疗新时代
9月4日,2025年屈光性白内障手术国际论坛(IRCS)暨第一届老视矫正MDT管理国际高峰论坛在杭州举办我国超八成60岁以上老年人正面临老视(老花眼)与白内障的“双重眼病困扰”
2025-09-05 15:18:00
获SIAL创新奖:诺啦格兰诺拉脆片让生活更美好  
消费日报网讯 9月1日,在2025 SIAL西雅国际食品展(深圳)举办同期,第24届SIAL创新大赛获奖榜单正式发布。吉丽莎(广州)贸易有限公司选送的产品诺啦格兰诺拉脆片跻身TOP10
2025-09-05 15:18:00
桃李面包广告语引争议“五仁不好吃是你还年轻”官方账号发文:领导拍的板,这个锅只能他来背
近日,桃李面包一则电梯广告文案引发争议。社交平台上流传的图片显示,桃李蛋月烧产品的广告语写道:“有人说五仁不好吃,我们认为
2025-09-05 15:29:00
京东超市布局产地直采 加大力度进口澳洲水果 助力澳洲水果深耕中国市场
今年开始,京东超市加大力度布局澳洲水果的供给和销售,投入资源帮助澳洲橙子、提子等水果进一步扩大销量。近日,在2025中国国际水果展上
2025-09-05 15:30:00
潍坊寿光市圣城街道一企业酿出康养“新食尚”
大众网记者 刘建永 潍坊报道为企赋能、助企发展是区域经济高质量发展的推动器。潍坊寿光市圣城街道在政策引领、优化营商环境
2025-09-05 15:50:00
大众网记者 王帅 通讯员 孙丽霞 杨阳 潍坊报道走进山东禾汇食品有限公司黄豆酱生产车间,一排排瓶装黄豆酱准备打包装箱,发往各大连锁商超
2025-09-05 15:50:00
9月4日,济南市委网信办联合山东省互联网传媒集团举办“‘科创泉城 智启未来’知名网络达人济南采风”活动。当日上午,10余位全国知名网络名人
2025-09-05 16:34:00
浪潮智慧医疗卫生应用创新生态联盟主办人工智能·信息技术应用创新联盟2025高质量发展研讨会
近日,由浪潮智慧医疗卫生应用创新生态联盟主办的人工智能·信息技术应用创新联盟2025高质量发展研讨会成功举办。来自山东省内多地卫健部门领导及医疗机构专家学者
2025-09-05 17:06:00