• 我的订阅
  • 社会

算法为什么知道“你想看什么”?

类别:社会 发布时间:2024-12-07 20:32:00 来源:缘之心

今天,算法推荐已经无处不在:广告、短剧、小说、音乐乃至新闻、资讯……它已经与搜索引擎并肩,成为人们获取网络信息的主要方式之一。在这种境况下,理解算法推荐,对于理解今天的媒介环境至关重要。

那么,什么是推荐?人们最熟悉的推荐方式是人对人的推荐:一个人向另一个人推荐某物,认为对方“用得上”“会喜欢”;或者是一个人请求另一个人为自己推荐某物,认为对方“经验丰富”“眼光好”。这种推荐背后往往存在一个预设:一个人和另一个人可以就“喜好”“需求”达成共识。这种共识基于人与人的相互理解。

算法推荐不需要这种“理解”。简单来说,算法是一台“匹配”机器,能够按照一定的程序和编码,把人和相关信息“匹配”起来。算法工程师们需要考虑的是,如何让一个人恰好遇到他想遇到的信息?这其实是一个“控制论”问题:“让两个东西在同一个时空相遇。”美国数学家诺伯特·维纳在提出控制论时,正是要想办法让战争中的炮弹和敌军飞机在同一时空相遇(他将炮手和炮台、驾驶员和飞机整体视为两个复杂系统)。今天的算法推荐,也正是要对巨量的用户和信息进行“匹配”,令双方恰当地“相遇”。

用户观看由算法个性化推荐的短视频。光明图片/IC PHOTO

要实现这个目标,就需让算法具有把握“人想要什么”的能力。在人和物之间建立某种关于“偏好”“需求”的关联。人们想出的办法是利用相似性原理。1997年,电子购物先驱亚马逊首次在商业上采用算法推荐,根据用户的购买记录推荐相似商品,取得相当不错的效果。这项技术被称为“协同过滤”,“协同”指它需要用户的参与合作(如购买、打分、评价等行为),而“过滤”即系统筛选。2003年,亚马逊发表了相关论文,标志着这个算法开始被广泛应用。直至今日,“协同过滤”仍然是当下最经典、最常用的推荐算法。

此外,随着大数据技术的成熟,人们还可以做到将人的偏好和需求数字化。这里出现了一种名为“用户画像”的商业手段。一方面,人们可以用统计学的方式获得大众的信息,并进行分类和提炼,为之打上不同的标签(年龄、性别、学历等),勾勒出围绕在某种偏好/需求周围的用户形象;另一方面,人们也可以为小说、影视、音乐、短剧、游戏、广告等文化产品打上相应的标签(类型、情绪、流行元素等),记录产品的内容、功能或特征。此时,如果双方的标签具有统计意义上的高相关度,就可以尝试匹配。

对于这种匹配的结果,用户还可以在另一端反馈:点击“喜欢”是正反馈,以增加相似的推荐;点击“不感兴趣”则是负反馈,以减少相似的推荐。而用户的其他行为,甚至是无意识行为——比如在一个信息停留的时长、观看次数、是否分享、是否和人聊天时提及——也都会被各种传感设备和记录设备捕捉、整理,同样会作为反馈传递给算法,影响下一次计算过程的标签权重。

基于算法技术的人工智能满足了用户多样化文艺需求。新华社发

早期的协同过滤大多是“基于物品的协同过滤”。在此基础上,2010年以来人们还发展出了“基于用户的协同过滤”。这是一个令“猜你喜欢”成功运作的机制,其核心是:“和你相似的人,也会喜欢你喜欢的东西”,即所谓的“物以类聚,人以群分”。比如,如果系统发现位于某个地区、常购买某类物品、喜欢听某人的歌、有某种程度学历的女性大都喜欢看某个类型的“霸道总裁”。那么,当系统下一次遇到一位符合条件的女性,即便她此前从不看任何“霸道总裁”,也会为她推荐,而且成功的概率很大。通过这种方式,算法能够在个体的“意料之外”推荐其偏好的内容,实现某种“个性化定制”的效果。但实际上,算法并不关心一个人的“个性”,它关心的反而是人与人之间的“共性”,并对新加入的成员进行偏好预判。这也带来新的忧虑,当预判高度准确时,人们依然会担心自己是否处在只有自我、没有他者的“茧房效应”中。

在一个更宏观的尺度上,算法推荐服从模型的数学和统计学特性。一个重要的特征是幂律分布。幂律分布是一条向下的、拖着长长尾巴的曲线,描述了在自然世界或人类社会中,“只有少数事务具有极大影响力,而大多数事务具有较小的影响力”的现象。这个世界上绝大多数大样本量模型都服从幂律分布,包括但不限于城市人口、地震强度、生物体积、太阳耀斑等,网络流量也不例外。

今天,人们已经察觉网络流量分布的不平等,将它们总结为“二八定律”,即粉丝数排在前20%的“大V”(拥有高粉丝量的用户)掌握80%的流量,后80%的中小用户只占20%流量的现象。但在另一边,幂律分布也带来“长尾定律”,它反映了另一种现象:分布中,存在大量影响力极小的样本,但总数加起来后仍非常可观。这意味着无论是多么小众的领域和作品,都会有相应的用户,不应该被忽略。这就是幂律分布两个最重要的数学特性。因此,要丰富推送内容,打破“二八定律”,让更多“长尾”被看到,商业公司除了要调整经营策略,还需要投入额外的算法改进机制。

当下,协同过滤和大数据、深度学习、人工智能等进一步配合,已经令算法推荐大抵呈现为一个黑箱,远远超出人类可理解的范畴。但可以想象,通过人类的调试和修改,这项技术也将更加先进,变得更加灵活多样、富于变化,适应各种各样的人类需求。我们有理由期待一个更好的、分配机制更公平友好的未来:彼时,“物以类聚,人以群分”将变得更加“丝滑”和生动,人们也能克服既有的茧房效应和流量至上,生活在更丰富的信息环境中。

(作者:王鑫,系山东大学文学院助理研究员)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-07 23:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...5月22日电 据网信中国微信公众号消息,“清朗·网络平台算法典型问题治理”专项行动开展以来,针对网民反映强烈的算法推荐加热低俗信息、加剧“信息茧房”、加重观点极化等问题风险,
2025-05-22 10:20:00
...现状,探讨了提升网络新闻传播质量的路径。研究发现,算法推荐、同质化传播等因素影响着网络新闻声音的多样性;信息过载使公众不可避免地依赖信息过滤机制。为此,要从技术、制度、媒体、
2024-06-15 05:24:00
...深圳大学深圳城市传播创新研究中心发布《短视频用户的算法实践与“破茧”报告》。《报告》显示,与一些人担忧“信息茧房”形成对比,近八成受访用户认为短视频平台算法推荐的内容是多样化
2025-11-14 11:28:00
...:人民日报杨鑫宇前不久,《关于开展“清朗·网络平台算法典型问题治理”专项行动的通知》正式发布,对同质化推送营造“信息茧房”、利用算法实施大数据“杀熟”等问题“亮剑”,明确提出
2024-12-12 06:06:00
热度算法的陷阱
在推荐系统中,热度算法有着相对重要的意义,通过热度算法,平台可以为用户提供更有偏向性的内容,增添内容的曝光度,也一定程度上助推平台价值的提升。那么,你了解热度算法的内涵与具体应用
2023-03-19 12:00:00
抖音上线安全与信任中心:首次公开推荐算法原理
...信任中心”网站上线。据悉,该网站面向社会公开了抖音算法原理、社区规范、治理体系和用户服务机制,这是抖音首次公开推荐算法原理,介绍了其推荐算法如何预估用户行为概率,并如何通过多
2025-03-31 07:08:00
...费者在一些售票APP评论区留言“喊贵”,期望以此来影响算法推送,降低相关商品和服务的价格,引发热议。如此反向“驯化”大数据,是否可行尚未可知,但它真切反映出消费者对“大数据杀
2025-02-13 05:47:00
微美全息开发基于大数据分析模型的智能旅游推荐系统
...。数据挖掘和机器学习:该模型利用数据挖掘和机器学习算法对气候数据进行分析,以了解目的地的气候趋势和适宜旅游的时间。这些算法还可以根据历史数据预测未来的天气情况,为旅行者提供参
2023-08-10 17:00:00
...刻不在记录着你的只言片语……这些都不是巧合,而是“算法”计算的结果。因为“计算”,用户获取信息成本大幅降低,网络服务更加精准高效。然而,越来越多用户担心被“算计”,日益关注“
2024-02-05 23:13:00
更多关于社会的资讯:
近日,一场突如其来的意外,让黔南州贵定县沿山镇的一个家庭陷入紧张与焦虑。4岁7个月的男孩杨阳(化名)在家玩耍时不慎被热水烫伤
2026-01-11 21:21:00
“死了么”爆火,付费软件排行榜一!开发者最新回应
1月8日,苹果应用商店一款名为“死了么”的App受到关注。截至发稿时,该款App在苹果付费软件排行榜位列第一。据介绍,该应用是为独居人群打造的轻量化安全工具
2026-01-11 21:48:00
春节9天假期 2026年春运将于2月2日启动
2026年春运将于2月2日正式启动。1月9日,省公安厅召开新闻发布会,通报春运交通安保工作安排。今年春节将迎来近年来最长9天假期
2026-01-11 21:49:00
廊坊一小微建筑企业偷税后又欠税近16万元
据信用中国(河北廊坊)官网消息,近日,廊坊市普帆建筑工程有限公司因2023年全年偷税被国家税务总局廊坊市税务局第二稽查局依法处以罚款137
2026-01-11 21:52:00
万米高空紧急施救 吉大二院医生诠释医者仁心
近日,在长春飞往三亚的航班上,一名老年乘客突发晕厥陷入生命危急状态。危急时刻,搭乘该航班的吉林大学第二医院妇产科医生谭文溪迅速挺身而出
2026-01-11 20:22:00
义务产的“哭哭马”火了!被缝反的次品玩偶为何成了爆款?
现实版塞翁失马焉知非福,一只“缝反了嘴”的马年玩偶竟然成为全网催单的“哭哭马”。1月10日,相关话题冲上了热搜第一。近日
2026-01-11 22:07:00
1月11日,北大医院太原医院传来消息,医院乳腺外科顺利完成首台机器人辅助下乳腺癌重建手术。这标志着北大医院太原医院乳腺疾病诊疗迈入精准智能的“机器人时代”
2026-01-11 18:10:00
冬日暖阳,温情相伴。1月9日,上马街二社区组织网格员深入文杏苑、光华苑、武警宿舍等小区,开展“银龄守护”暖心走访活动,将关怀与服务送至高龄
2026-01-11 18:10:00
忻州小伙赵哲来到太原,想在当地开一家小饭店创业,但连续半个月未能找到合适的店铺。1月10日,网格员凭借“人熟、地熟”的优势
2026-01-11 18:11:00
高层空调机位的百叶窗在强风中突然弹开,来回晃动,随时有坠落风险。1月10日,网格员在巡查中发现这一险情,迅速联系物业和住户
2026-01-11 18:41:00
凡人善举|敬业奉献何小虎:在非精密环境中实现产品精密加工
一个普通人的努力,能给国家和社会带来多大的贡献和影响?1986年底出生的何小虎,用15年时间不仅从“小徒弟”成长为“老师傅”
2026-01-11 18:37:00
规范小区公共收益管理!河南发文
大河网讯 小区收益多少,业主心中得有底。为进一步规范住宅小区公共收益管理,近日,省住房和城乡建设厅印发《河南省住宅小区公共收益管理办法(试行)》(以下简称《办法》)
2026-01-11 17:26:00
一年23封感谢信 点赞社区“家”温度
(图为社区收到的部分感谢信)“我是西机路65号院的居民,想夸一夸小张……”1月11日,一位七旬老人将一封感谢信送到玉园南社区
2026-01-11 18:11:00
租客搬走后,空置房屋发生漏水,影响到楼下邻居。1月10日,网格员接到求助后辗转联系到房东,及时入户处置。事后社区提醒,房屋空置期间务必关闭水
2026-01-11 18:41:00
骗贷团伙成员李某得知曹某生活窘迫主动询问曹某是否有意办理贷款并承诺只要签个字就能到手100万元曹某可以拿到其中的三成面对高额回报曹某心动了……为助力小微企业发展
2026-01-11 14:29:00