YouTube订阅打法2.0:算法与平台合力,迷思与忧思并存

2020-01-14 10:30:58于海丽

2016 年:机器学习

在这一年,YouTube公布了白皮书,解释了深度神经网络和机器学习在算法中的作用机制。此外,该论文还拆解了YouTube对视频进行排序、推荐的各项指标,分别为:观看次数(视频的点击量);观看时间;用户在某频道观看了多少视频;用户近期如何观看此主题视频;用户的搜索记录;用户的观看历史;用户的人口统计学信息与地理位置。

YouTube不断升级算法,本意是为了优化内容生态以促进平台的可持续发展,但同时也传播了虚假新闻、仇恨言论等有害内容。平台也在不断调整,例如: 2017 年,调整算法以改善弹出的新闻视频质量; 2019 年,YouTube宣布不再推荐可能会伤害或误导用户的内容。

YouTube算法如何运作

目前YouTube算法指标主要包含以下几项:

是否观看:体现为点击量高的热门内容;

观看时长:观看时间较长的频道和视频往往更容易被推荐;

登录时长:观众花在平台上的时间,在观看某些视频后是否选择看更多视频;

内容评分:点赞、踩赞、分享,“不感兴趣”按钮的点击;

“观看速度”(view velocity):在视频发布后立即观看视频的订阅者数量。视频的观看速度越高,排名就越高。在对视频进行排名时,YouTube也会考虑视频发布者拥有的活跃订阅者的数量。

算法的主要任务有二:第一,帮助用户找到他们想看的视频;第二,提高用户的长期参与度和满意度。因此,“弄清用户喜欢什么”是YouTube算法的要义所在。

如何弄清用户的喜好?YouTube在 2016 年发布的算法白皮书打开了这一黑箱。白皮书显示,在机器学习的模型结构中,有两个网络在起作用:

漏斗式的模型结构,来源:《YouTube推荐机制的深度学习网络》, 2016 年

候选网络(The candidate generation network):记录用户的活动历史(搜索记录、观看行为、人口统计学信息),输出与之相契合的几百个视频作为可能推荐给用户的候选。

排序网络(the ranking network):排序阶段更多是面向“场景”,记录用户点击视频的地点、时间、操作,相比候选网络,这一步纳入模型的指标更细致,例如,用户最近的一次搜索词、上一次观看的同一主题下的视频数量、上一次观看同主题视频的时间、用户所使用的语言等等。在为每个视频打上更详细的标签的基础上,依照标准给候选网络中的视频打分,从而确定最终的推荐结果。