• 我的订阅
  • 科技

搜索推荐系统中,重排模块的定位以及常见策略

类别:科技 发布时间:2023-07-03 11:00:00 来源:人人都是产品经理

在推荐搜索系统中,我们常常可以见到重排模块,那么你知道重排模块的作用是什么吗?在本篇文章里,作者就介绍了重排模块的作用,以及常见的重排策略,一起来看看吧,或许会对想了解搜索推荐系统的你有所帮助。

很多人在最开始了解搜索推荐系统时,不明白为什么还需要单独设立一个重排模块,重排模块和精排模块能不能进行合并。本篇我们就详细介绍一下重排模块的作用以及常见的重排策略。

一、推荐系统常见架构

我们先介绍一下目前行业里先进的推荐系统架构是什么样的,分别介绍各个功能模块的定位。

搜索推荐系统中,重排模块的定位以及常见策略

上图是目前工业界常见的推荐系统架构,整体系统链路上至少分为以下5层:召回层:从亿级别的物料中初筛出用户感兴趣的物料,输出的物料在万级别,大幅降低物料量级,减少后续系统中的性能压力。一般都是多路召回架构,接近20路的召回策略。粗排层:针对召回层返回的物料,预估召回点击率再进行排序,筛选出千级别的物料。过滤层:基于一些硬规则过滤掉最后不能在前端露出的物料,比如内容领域命中了黑词、电商领域无库存的商品等。过滤层也可以放在粗排层之前。精排层:将过滤层返回的所有物料进行CTR预估,然后按照Pctr进行排序,输出百级别的物料给到下一层。重排层:重排层会基于全局最优和相关业务规则等对于精排返回的物料顺序进行再次调整,一般都只是微调。最终一次请求中返回在百级别以内的物料给到前端。

每一个模块都有自己的定位,早期的推荐系统就只有一个最简单的排序模块,发展到现在推荐系统架构已经非常精细化,不同模块各司其职。

二、重排模块的定位

在搜推系统的众多模块中,重排模块主要实现以下三个目标:全局最优 + 流量调控 + 用户体验。

1. 全局最优

精排实现的是单点最优,但是用户实际在浏览推荐信息流时是连续浏览多个商品。不同商品之间的排列组合将影响用户整体的点击率。

就如同人穿搭衣服一样,精排模块的视角,是单点为用户选择最好看的上衣、裤子和鞋子。

而重排模块是站在整体视角,为用户选择既好看然后风格又匹配的最优的上衣、裤子和鞋子的组合,所以重排模块最终需要在精排的排序基础上,按照用户的浏览行为为其挑选出最优的一组商品或者内容组合。

2. 流量调控

重排模块是对物料的最后一道排序环节,很多时候业务的特殊流量诉求都是在重排模块进行干预。比如电商场景中对于新品的扶持,淘宝当年做直播生态时对于直播内容进行加权。这些特殊的流量诉求需要干预整体排序时,最好的实现方式都是在重排模块进行干预。

3. 用户体验

精排和重排整体的排序逻辑还是基于模型预估的CTR,但是有时候完全按照CTR大小来进行排序的内容会比较极端,比如连续多坑都是同一种类型的商品或者内容,导致用户审美疲劳,这种就是线上的问题案例,解决这类case都需要在重排模块做一些频控策略。

电商推荐里需要针对同三级类目、同品牌、同封面图的商品进行打散,内容推荐场景里需要针对同类型、同封面图、同作者的内容进行打散。打散可以有效防止用户审美疲劳化,同时有利于探索和捕捉用户的潜在兴趣,对用户体验和长期目标都很关键。

三、常见的重排策略

针对上述介绍的三大类目标,我们分别介绍实现三大类目标常用的策略。

1. 全局最优-List Wise策略

List Wise本身不是一个具体的算法或者模型,只是一个模型的优化目标或者是损失函数的定义方式,List Wise关注整个列表中物料之间的顺序关系,需要结合上下文的信息。List Wise整个策略分为两个步骤:

1)序列生成

第一步是序列生成。假设用户在浏览淘宝APP首页”猜你喜欢“时,平均每次浏览4个商品,那么我们设定每个序列的长度为4。序列生成模型基于精排模型返回的商品数量进行排列组合。假设单次请求中精排模型返回12个商品,那么序列生成模型理论上可以生成:

11880种组合,这个数字过于庞大了。为了减轻系统的计算负担和考虑到模型的耗时影响,实际工作中我们不可能穷举所有的序列类型,一般情况下我们还是会从精排模型中排序靠前的候选集中进行挑选,然后再设置一些策略性的筛选条件去大幅降低序列的候选集。假设我们就从精排返回排名前6的商品中,进行序列生成:

搜索推荐系统中,重排模块的定位以及常见策略

360组合。我们基于这360种组合再进行效果评估。

2)序列评估

第二步就是对生成的序列候选集进行效果预估,首先需要构建一个序列评估模型,目前序列评估模型中常用的算法是RNN(Recurrent Neural Networks,循环神经网络)。

RNN模型的一大特点是以序列数据为输入, 通过神经网络内部的结构设计可以有效捕捉序列之间的关系特征。所以RNN模型非常适合作为序列评估模型来实现List Wise。

首先序列评估模型的输入是每一个序列以及精排模型预估的CTR值,模型融合当前商品上下文,也就是排序列表中其它商品的特征,来从列表整体评估效果。序列评估模型最终是针对单个序列里的每一个商品输出一个对应的预估CTR,然后将每个序列里各个商品的CTR在一起加权最终得到一个综合的CTR分数进行排序。

搜索推荐系统中,重排模块的定位以及常见策略

如上图所示,将四个相同长度的不同序列输入到评估模型中,模型针对序列中的每个商品重新给出新的Pctr,然后将单个序列里的Pctr进行相加得到综合分数,最终取得分最高的序列返回给到前端,如上图所示得分最高的为序列3。

需要注意的是序列评估模型仍然是预估CTR,只是此时的CTR预估是结合了上下文信息,而不是像精排模型那样仅是单点的CTR预估。不过序列预估模型也是对精排模型的Pctr进行微调,不会大幅调整精排模型输出的Pctr。

2. 流量调控—动态调权

流量调控的策略实现方式一般就一种,直接在重排层上针对需要获得更多曝光的内容比如新品、新内容等进行相应权重的调整,原本预估的CTR再乘以更高的系数分比如1.2,使其得分更高。加权可以快速让某一类型物料得到更多曝光。

有时候也可以在召回模块进行调整,比如针对某一类物料单独设计一路召回策略,提升召回侧的供给。但是毕竟召回侧离最终展现还需要经历很多个模块,无法确保最终一定可以展现以及展现量,所以一般都是召回和重排层同时做策略。

但是加权策略不能一直在整个流量分发机制中存在,当实现了业务目标后,我们需要重新审视线上的各种加权策略,然后下线一些加权策略,不然长久会破坏系统整体的生态。

3. 用户体验—滑窗打散策略

用户体验里我们主要介绍滑窗打散策略。目前市场上主流的打散策略都是基于硬规则的打散,也有基于用户个性化兴趣的打散方式,但是还是容易出Bad Case。

下面我们以电商同三级类目商品打散来进行举例,假设平台要求连续4坑同一三级类目商品最多只能有2个,连续8坑同一三级类目商品最多只能有4个。针对这类打散我们一般使用滑动窗口法。

搜索推荐系统中,重排模块的定位以及常见策略

如上图所示,我们构建两个窗口,一个长度为4,一个长度为8,每个圆圈代表一个商品,不同类目的商品用不同颜色来表示。

两个窗口全部从第一个商品开始往后移动,首先判断窗口1和窗口2里的商品是否符合规则要求,如果符合则继续滑动窗口,经过第一次移动后我们可以看到窗口1里面商品的类目分布已经不符合规则要求,按照顺序将后面符合要求的商品往前移动进行替换。

按照上述流程一直进行窗口滑动,对位于窗口内不符合要求的商品进行顺序调换。

滑动窗口法容易出现末尾扎堆的情况,因为一直在用后续的物料去满足前序的规则,将不满足规则的物料进行后移,最终可能会导致末尾物料的顺序无法调整,因为已经没有后续候补物料可供调整了。

上述就是对于搜索推荐系统中重排模块的整体介绍,重排模块以其独特的定位为搜索推荐系统的精细化运作发挥重要作用。

本文由 @King James 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-03 11:45:23

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

TOB产品七字箴言之增删改查显算传
...户看来,会怀疑是系统出了bug导致按钮不见了。3)关联模块限制:对本模块和下游模块会产生什么影响?在设计各个功能前,产品需事先了解每个模块间的关联关系,比如删除了订单,对哪些
2024-04-28 11:00:00
...2024年公开专利18项,服务团队120人,已为220家企业提供GEO模块。 核心竞争力:统一适配层架构使平台差异响应时间缩短至10小时以内
2025-11-07 08:05:00
...率低于 0.3 次 / 家。自研【即搜客】智能系统集成十大 AI 模块,日处理语义数据超 8000 万条,多平台兼容满分
2025-10-28 17:18:00
文娱行业速看:用户体验与平台收益最大化双赢
...数量、怎么做内容的质量评估、如何评估内容的ROI,各个模块都需要数据支撑。然后,搭建内容质量评估体系。通过人工评估、数据评估、模型评估、货币化评估等评估方式多维度立体评价内容
2023-05-19 14:12:00
...合达标率达99%,客户满意度达98%。其技术优势由三大自研模块构建:灵脑多模态内容生成引擎:整合DeepSeek、豆包等主流AI平台的API接口资源
2025-11-07 08:06:00
尿酸超标怎么办?别慌!2025年最全降尿酸实战指南来啦
...炎、护肾、改善代谢的“四效合一”。维度一:源头阻断模块(Purine-Block™)天然的“尿酸生产阀门”采用高纯度羟基酪醇
2025-11-03 21:22:00
相册重磅升级!华为Mate 70/Pura 70等推送HarmonyOS NEXT 5.0.0.155
...格显示界面 > 右上角四点图标 > 排序方式)优化时刻模块的使用体验,支持更换封面和重命名,丰富人像时刻主题命名播放视频时,点击单帧导出按钮,可以将视频画面截屏保
2025-04-18 00:25:00
...立维修市场差异化整合营销数据模型,该模型可分为两个模块:战略规划模块与整合营销模块。战略规划模块通过分析目标市场潜力,结合公司自身的市场竞争力,确定目标市场的市场定位。整合营
2024-06-14 09:12:00
实战思考:从0到1搭建UGC社区系统
...题,当我们从0-1设计系统时,我们需要先明确整个产品的定位、然后思考产品的策略框架、再从用户视角提出功能和页面清单并评估优先级,即前期上线哪些功能和页面,最后才是进入功能页面
2023-06-13 14:00:00
更多关于科技的资讯:
贵州刺梨以高附加值产品开拓全国大市场
春节前夕,正值年货采买热潮,贵州刺梨产业也迎来新的发展节点——由贵州农发集团下属贵州刺梨集团研发的SOD(超氧化物歧化酶)肠溶片系列产品
2026-02-02 17:01:00
如何评价一家事业编培训机构?从鸿图政通教育的扎实筹备说起
在快速更迭的培训市场,不乏一时风头无两的机构,但能持续赢得信任的品牌,往往离不开长时间的潜心积淀与专业化打磨。北京鸿图政通教育虽于2024年1月22日正式注册成立
2026-02-02 19:30:00
海信发布璀璨大冻梨冰箱 以“真大冷冻”新标准破解行业用户痛点
鲁网2月2日讯1月31日,海信正式推出全新产品——海信璀璨大冻梨冰箱。这款被定义为“行业大冷冻冰箱开创者”的产品,旨在系统性解决中国家庭在食材冷冻存储中长期面临的容积不足
2026-02-02 14:17:00
深挖用户痛点:海信璀璨大冻梨冰箱背后的“冻力”革命与创新哲学
鲁网2月2日讯中国家庭的冷冻室正面临一场普遍的“存储危机”:食材堆积导致存取不便;大量囤货时中心温度难以下降;化冻后的肉类口感干柴
2026-02-02 14:18:00
产业一线|每天翻开200次,折叠屏手机能用多久?
中新经纬1月29日电 (李自曼)“目前柔性OLED(有机发光二极管,是一种显示技术,被誉为第三代显示技术)屏,已经可以广泛应用在内折
2026-02-02 14:41:00
日前,在2026年美国气象学会年会上,英伟达正式推出Earth-2开放模型系列——面向人工智能气象领域的全开放、加速型模型与工具套件
2026-02-02 14:52:00
2026年1月30日,全球服务机器人行业领导者科沃斯(603486.SH)发布了2025年度业绩预告。预计2025年净利润17—18亿元
2026-02-02 14:53:00
AI赋能精准破局,绵阳开启高校毕业生高质量就业新路径
“以前写简历总抓不住重点,面试应答也缺乏逻辑。参加集训营后,我用AI工具精准生成了针对性简历和面试话术,还制作了个性化职业照和个人介绍短片
2026-02-02 14:54:00
没有什么比开业更优惠!三联家电章丘世茂店盛大试营业,全场5折起!
鲁网2月2日讯没有什么比开业更优惠!正值年货节消费旺季,三联家电作为国补以旧换新指定参与卖场,对个人消费者购买1级能效或水效标准的冰箱
2026-02-02 15:27:00
近日,多家媒体报道的“凌晨点外卖次数过多银行卡被风控”事件,让银行客户权益、风控安全之间的平衡问题再次受到关注。不少网友分享了类似经历
2026-02-02 16:27:00
AI OPC专区产业服务平台正式上线,助力无锡打造AI创新高地
近日,“智序·新征程—AI起航·预见未来”无锡市人工智能行业协会年度生态大会在无锡国际会议中心隆重举行。大会汇聚政府领导
2026-02-02 15:58:00
多彩贵州网讯 今年以来,都匀市税务局依托黔南州云税匀办税费集约中心持续拓展“线上主动服务”的应用场景,不断推动税费服务从“解答问题”向“解决问题”深刻转变
2026-02-02 16:10:00
零中断、零感知切换——泰安联通肥城分公司高效完成远端机房撤并实现降本增效与网络升级双突破
鲁网2月2日讯近日,在肥城城区的两个角落——交通局沿街6楼机房与上海世纪城基站,泰安联通肥城分公司组织网络综合支撑网格的10名技术骨干
2026-02-02 11:23:00
邮储银行精准滴灌 临沂商城春潮涌动
鲁网2月2日讯 (记者 吴艳萍 通讯员 李洁)新春将至,年味渐浓,作为全国规模最大的市场集群之一,临沂小商品城处处涌动着蓬勃生机与繁忙气息
2026-02-02 11:23:00