• 我的订阅
  • 科技

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

类别:科技 发布时间:2024-07-30 09:31:00 来源:量子位

用扩散模型搞社交信息推荐,怎么解决数据噪声难题?现有的一些自监督学习方法效果还是有限。

针对此,港大数据智能实验室提出了新项目RecDiff。

RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好和兴趣,从而生成个性化、贴合用户需求的推荐内容。

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

具体而言,该框架采用隐空间扩散机制,有效清除用户表示中的噪声,无论是压缩还是密集的嵌入空间。

RecDiff通过多步扩散和噪声消除过程,展现出在不同噪声水平下均能准确识别和去除噪声的能力。

此外,扩散模块针对下游推荐任务进行了优化,以最大化其对推荐过程的增强效果。

通过广泛的实验评估,RecDiff在提高推荐准确性、训练效率以及去噪效果方面均表现出色。

研究方法

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

基于图协同过滤的编码器

受到简化图神经网络(GNN)成功应用的启发,图那对在社交去噪框架中采用了轻量级图卷积网络(GCN)作为图编码器。

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

图关系去噪模型

隐空间的社交扩散

汲取扩散模型在各个领域成功生成无噪声数据的精髓,研究团队的RecDiff框架集成了一种创新的扩散机制,用以产生净化后的社交关系数据。

面对社交图数据固有的稀疏性挑战,研究团队设计了一种策略:

在潜在空间而非直接在图数据空间中,通过正向与反向的扩散步骤,实现社交信息的高效和精准扩散。

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

如上图所示,该隐空间社交扩散过程可通过以下公式进行精炼表达:

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

正向和反向扩散

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散损失函数

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

推断过程

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

预测和优化

利用隐空间社交扩散模块,研究者将去噪后的社交关系与编码后的交互范式结合起来,以获得预测的最终嵌入。

具体方法如下:

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

模型复杂性分析

本节全面分析了研究者的 RecDiff 与社会扩散模块在时间和空间上的复杂性。

时间复杂性。

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

空间复杂性。

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

实验

模型整体性能比较

团队比较了团队的模型与基线模型的整体推荐性能。

top-20和不同top-N的验证结果列于下表:

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

团队的RecDiff始终优于最先进的基线,展示了卓越的推荐准确性。

T 检验证实了团队的结果在所有数据集和评估指标上的统计意义。

在不同的top-N设置中,RecDiff的性能优势保持一致。团队的基于扩散的社交关系去噪模块可以去除无关信息和虚假信息,从而使RecDiff有效地挖掘有价值的社交关系以增强推荐效果。

一些社交推荐方法如(DGRec、DiffNet 和 GraphRec)的表现比与社交信息无关的方法NGCF差。这表明,由于虚假或不相关的成分,社交关系会对用户-商品关系建模产生负面影响。

团队的RecDiff框架通过对社交信息去噪来解决这个问题,其性能始终优于基线模型 GDMSR。它能有效过滤社交关系中的噪音,识别有意义和有影响力的社交关系,准确编码用户偏好,从而实现精准推荐。

包含自监督学习(SSL)的基准方法在推荐性能上一直优于其他方法。MHCN、KCGN和SMIN等方法利用了局部-全局互信息最大化技术的变体,而 DSL 则采用了预测对齐自监督任务的方法。

这凸显了辅助监督信号在解决社交推荐中的数据缺陷难题(如噪声和稀疏性)方面的积极影响。

相比之下,团队的模型引入了一种基于扩散模型的多步骤去噪方法,在不同的噪声水平下生成更多的监督信号。这种强大的去噪能力带来了超越基线的卓越推荐性能。

消融实验

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

团队将通过一项消融研究来探讨RecDiff框架中不同子模块的影响。团队评估了通过删除或替换基本模块而获得的几个变体的性能。

-D:删除整体扩散模块,只保留社交和用户-商品关系学习GNN。移除扩散模块(-D)会导致性能显著下降,这凸显了团队的潜在特征级扩散模型所提供的去噪功能的有效性。 -S:不利用社交信息,完全依靠用户-物品交互图来进行推荐。将此变体与RecDiff进行比较,凸显了在用户偏好学习中纳入用户社交背景信息所带来的显著改进。然而,在含有嘈杂社交信息的epinions数据集中,-S 变体可能会优于-D变体。 -DAE:用去噪自动编码器取代RecDiff的基于扩散的去噪模块。这个基于 DAE 的去噪模块经过训练,可以重建随机屏蔽的用户表征。与普通去噪技术相比,DAE变体的次优性能展示了团队设计的扩散模块的卓越去噪能力。通过共享神经网络逐步学习从t到t-1的每个去噪过渡步骤,RecDiff可以有效地模拟复杂的表示分布,从而增强潜在特征的降噪能力。

超参数的影响

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

噪声对模型的影响

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

训练效率研究

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

与基线模型(MHCN、SMIN 和 KCGN)相比,团队在 Ciao 和 Yelp 数据集上优化 RecDiff 的效率。

RecDiff在训练和测试中都表现出了明显的效率优势。对于每个训练历时,团队都评估并记录了测试集的性能,以分析改进情况。

RecDiff的训练效率:团队的 RecDiff 在训练效率方面始终优于基线,这得益于有效的去噪扩散加速优化。 基线模型的局限性:SMIN 显示出过拟合效果,可能是太过依赖元路径图,限制了其泛化的能力。MHCN 实现了较高的最终性能,但由于其复杂的超图结构,收敛速度较慢。相比之下,团队的 RecDiff 则得益于紧凑的神经架构,不需要手工制作先验,因此能利用辅助信号进行更快的优化。

对 RecDiff 框架抗噪能力的进一步探索

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

团队评估了 RecDiff 在数据噪声情况下的鲁棒性,方法是在用户-用户图中引入随机虚假边来替代不同比例的真实社交连接。

然后使用被破坏的图对模型进行重新训练,并在真实测试集上进行评估。

具体来说,团队分析了用噪声信号替换 0%、20% 和 50% 的社交关系的效果。

比较 RecDiff 与 MHCN 和 DiffNet 的性能,上图(a)和(b)中的结果显示了原始评估结果,而(c)则说明了 NDCG 的相对性能变化。

基于这些结果,团队可以得出以下结论:

RecDiff 的鲁棒性优势:团队的模型在性能下降较小的情况下优于基线模型,展示了其在社交推荐中卓越的去噪能力。 相比于 SSL 的去噪效果:MHCN 模型在去噪方面表现出色,但与团队的 RecDiff 模型相比仍有不足。这突出表明,通用的自监督学习任务可能无法有效满足社交推荐的特定去噪要求。 Ciao 数据集的噪声比更高:与其他数据集相比,Ciao 数据集的性能下降幅度更大,这表明噪声比更高。

案例分析

扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff

团队探讨RecDiff在特定用户/商品案例中的去噪效果。

图中展示了四个子图案例,突出了去噪的必要性。

基线方法KCGN和MHCN无法识别错误的社交连接,导致这些错误社交邻居的相似性得分很高。

相比之下,RecDiff能有效识别这些噪声实例,显著降低相似性得分,并为虚假连接的用户生成不同的嵌入。

这些发现证明了 RecDiff 在不同噪声情况下的出色消噪能力。

图中还介绍了另外两种情况,即用户对共享的交互商品在类别上与用户交互的其他商品存在显著差异。

这些孤立的交互很可能存在噪声的商品,从而使相关的社交链接也变得有噪声。

RecDiff 再次成功地识别并消除了这些噪音,为虚假的社交邻居分配了较低的相似性分数并生成了更独特的嵌入。

这些案例进一步体现了 RecDiff 方法的出色去噪效果。

结语

项目团队提出了一种名为RecDiff的新型扩散模型,旨在通过消除用户之间噪音社交链接来增强社会化推荐系统。

RecDiff采用多步噪声传播和消除的训练方式,在隐藏空间中运行,利用编码的用户表征,实现了高效和简单的设计。

通过在不同扩散步骤下对模型进行训练,RecDiff 展现出了出色的噪声处理能力,能够有效应对各种类型的噪声影响。

研究图那对在真实世界数据集上评估了模型的性能,结果显示相比现有方法,RecDiff在推荐准确率方面取得了显著提升。

未来,RecDiff团队计划将RecDiff拓展到更多推荐场景中,并结合多模态信息,进一步探索该模型的潜力和应用价值。

论文:http://github.com/HKUDS/RecDiff源代码:https://github.com/HKUDS/RecDiff港大数据智能实验室:https://sites.google.com/view/chaoh

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-07-30 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

人民网发布“社交智能助理”
...月31日电 (记者李发兴)人民网、传播内容认知全国重点实验室30日晚在2024中国网络媒体论坛“技术赋能·八点见”创新项目发布会上正式发布“社交智能助理”1.0版。“社交智能
2024-03-31 22:50:00
ChatGPT笨了,还是老了?
...,但在现实生活中却无法提供准确的结果。主要是因为在实验室,采用高质量的训练数据,但是现实世界的眼睛扫描质量较低。受制于机器学习模型老化的情况,过去走出实验室的AI技术,以单一
2023-09-17 16:13:00
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
...式机器人也在这个“城市”里穿梭自如。这就是由上海AI实验室最新提出的首个模拟交互式3D世界:GRUtopia(中文名:桃源)。在这里,由多达100k个交互式、带精细注释的场景
2024-07-23 09:33:00
【上海人工智能实验室单位联合发起大模型语料数据联盟】财联社7月6日电,2023世界人工智能大会7月6日在上海世博中心正式开幕。上海人工智能实验室、中国科学技术信息研究所、上海数据
2023-07-06 14:27:00
拓尔思:已与多家头部大模型人工智能公司和国家级实验室签订销售合同 【拓尔思:已与多家头部大模型人工智能公司和国家级实验室签订销售合同】财联社11月21日电,拓尔思在互动平台表示,
2023-11-21 22:53:00
为实验监测装上“智慧之眼” 室内物理模型实验全场景变形智能追踪
...理模型实验全场景数据采集的未来。此次无人机相似模拟实验室,是团队深耕煤炭行业、服务煤炭产业、推动行业科技进步的积极尝试,落实低空经济与智能发展的双驱动新质生产力。华商报大风新
2025-07-10 10:39:00
奇绩创坛2023春季路演日:60个项目,超一半与大模型相关,企服项目占比第二
...合创始人/CEO杨浩是计算机科学博士,阿里巴巴人工智能实验室和阿里视频云的边缘计算实验室北京团队负责人,华为边缘云创新实验室及慕尼黑云智能实验室首席AI科学顾问。联合创始人J
2023-06-06 09:39:00
...算神经行为学的发展革新了经典的行为学范式,实现了从实验室环境到自然环境的行为观测。未来,人工智能赋能的神经科学研究将进一步加深从动物模型到临床医疗的大数据生理参数的理解,为实
2024-01-11 04:04:00
...的光芒,吸引全球科学家孜孜不倦地探索……每天,之江实验室天文计算研究中心高级研究专员唐晓瑜,都会望向茫茫银河。“几千亿颗恒星中,人类掌握光谱数据的仅有2亿颗。”这位出生于19
2025-05-27 09:59:00
更多关于科技的资讯:
鲁网1月19日讯近日,国家水利部正式发布《节水先进成熟适用技术设备名录(2025年)》。在此次国家级节水技术评选中,泰安市科技创新成果“双星闪耀”——东平力创科技有限公司与泰安市智慧能源科技有限公司的领先技术成功入选
2026-01-19 11:06:00
“智改数转”激活新动能 固安制造业向“新”力十足
河北新闻网讯(万倩、臧子祺、韩佳臻)近日,在固安县萨牌智能驱动技术(河北)有限公司的测试车间里,一台智能叉车正静默而精准地执行着指令
2026-01-19 11:06:00
光储直柔一体机亮相武汉工商学院
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)1月16日,一台可实现电力能源“自产、自储、自用、自调”的光储直柔一体机在武汉工商学院正式亮相
2026-01-19 12:01:00
江南时报讯 近日,苏州横扇中新智地产业园区1138KWp分布式光伏项目顺利并网发电。从方案落地到设备投运,吴江横扇供电所以“靠前对接
2026-01-19 13:05:00
重庆钢铁成功取得CRCC认证,正式进入铁路耐候钢市场
近日,重庆钢铁铁标耐候钢产品顺利通过中铁检验认证中心(CRCC)权威认证,标志着公司在该产品质量管理体系与实物质量上全面契合铁路行业严苛标准
2026-01-19 14:00:00
携手商家共拓增长新空间助力线下消费,抖音生活服务城市生态大会济南站启幕
鲁网1月19日讯1月16日,“域见美好生活·这一站济南”2026抖音生活服务城市生态大会暨北部大区年度盛典在济南召开。大会由山东省文化和旅游厅
2026-01-19 11:40:00
京东联合五大服饰品牌发布2025超级面料消费观察
你是否曾设想,一件衣物也能如“智能空调”般自动调节温度?你是否曾设想,穿过的羽绒服无需刻意清洗?你是否曾设想,冬日的保暖衣物能够自主发热
2026-01-19 11:07:00
潍坊国补正式落地,三联家电41周年店庆点燃消费热情
鲁网1月19日讯1月17日上午,潍坊市奎文区2026年家电以旧换新暨海尔年货节、三联家电41周年店庆启动仪式在三联家电东风店户外广场隆重举行
2026-01-19 11:03:00
沧州7130家企业设立首席质量官
1月13日,在沧州四星玻璃股份有限公司生产车间内,首席质量官宋小龙(左)查看自动化制瓶生产线运行情况。河北日报记者 王雅楠摄河北日报讯(记者王雅楠)沧州市大力推行企业首席质量官制度
2026-01-19 08:10:00
1月12日,在位于张家口冰雪运动装备产业园的河北米锐特气模制造有限公司厂房内,30米长的不锈钢操作台上,工人正精准划线
2026-01-19 08:14:00
中新经纬1月18日电 18日,“人民日报评论”微信号发布评论文章《人民日报评西贝关店事件:网络舆论环境不能成为企业发展的短板》
2026-01-19 08:22:00
近期,富德生命人寿枣强支公司推出一系列针对性服务举措,通过优化传统服务方式与提升智能服务便利性双管齐下,切实提升老年客户群体的金融服务体验
2026-01-19 09:33:00
近期,国家有关部门在全国范围内持续推进“AI魔改”视频专项治理行动,相关话题引发广泛关注。随着整治深入,社会讨论正从对乱象本身的集中批评
2026-01-19 10:00:00
凤凰花实验室成立 厦门发力“人工智能赋能千行百业”
凤凰花实验室启动活动现场。(集美区 供图)厦门网讯(厦门日报记者 应洁)1月17日9时许,诚毅国际商务中心直达顶楼的电梯比工作日还要繁忙
2026-01-19 08:22:00
一块小小的豆腐能蕴含多少科技力量?昨天,在杭州豆制食品有限公司2026年商业大会暨新品发布会上,“鸿光浪花”品牌发布了首款富硒豆腐
2026-01-19 07:15:00