2022-06-08

分享一篇关于YouTube视频推荐系统的文章

YouTube油管是根据什么推荐视频的?视频推荐系统是如何运作的?不知道大家在做youtube流量优化的时候,有没有想过这类问题。

所以今天图帕先生跟大家分享一篇由油管工程研发副总裁发表的文章,一起来看看油管是怎样把视频推荐给受众的,也能更好地知道,自己运营的重点放在哪里,也能从高层的口中知道,想用油管频道盈利不要触碰哪些内容。

中午用来下饭应该还行把~

Let's get started!

本文作者:YouTube 工程研发副总裁 Cristos Goodrow

原文:

当 YouTube 推荐系统发挥理想成效时,能为全球数十亿使用者提供合适的内容,让他们透过独特的体验获得灵感、知识和娱乐。就我而言,这个系统可以协助我找到各种演讲和影片,以了解当今科技所涉及的伦理议题,或是重温小时候看过的南加大美式足球赛事的精彩片段。

对我的大女儿而言,她可以从 Vlogbrothers 影片中找到欢乐及同好。至于我的大儿子,推荐系统让他能透过 3Blue1Brown 的动画教学影片充分理解线性代数,而休息时间则可以观看 KSI 的影片。

从我家人的使用体验来看,几乎每一部影片都有各自的受众群,而推荐系统的任务就是要找到这群受众。我们不妨想像一下,如果没有图书馆员的协助,要在一座庞大的图书馆中寻找一本书,会有多么困难。YouTube 大量的观看次数来自推荐系统,它的成效甚至超越频道订阅和搜索功能

我参与 YouTube 推荐系统的建构工作已有十多年的时间,对于这套系统如今已成为 YouTube 所有使用者体验中不可或缺的一部分,我感到十分骄傲。但是推荐系统的运作原理往往被视为神秘的黑箱作业。我们希望一般大众都能够了解这套系统,因此我要为大家说明这套系统的运作方式、演进历程,以及为何我们将提供理想的推荐内容视为优先要务。

什么是推荐系统?

我们在建构推荐系统时,秉持的原则就是协助使用者找到他们想观看且对他们而言具有价值的影片。

推荐系统主要在两个位置运作:使用者的首页和"即将播放"面板。首页是你开启 YouTube 时第一个看到的画面,其中会显示个性化推荐内容、订阅项目,以及最新动态和信息等。而在观看影片时,系统会根据你目前观看的影片,以及我们认为你可能感兴趣的内容,推荐建议内容在"即将播放"面板当中。

早在 2008 年,我们就开始著手建构推荐系统,但当时提供的体验和现在截然不同。举例而言,假设你最常观看烹饪类别的影片,但首页只因为最新推出的运动和音乐影片观看次数最高就向你推荐这些影片的话,是不是很令人失望?这就是 YouTube 早期的做法。

系统会根据影片的受欢迎程度决定排名,建立一个庞大的"发烧影片"页面。观看过这些被推荐影片的使用者并不多,绝大多数 YouTube 观看次数都是由平台以外的搜索或他人分享的连结而来。

如今,我们的系统会从数十亿部影片中,完全根据你的兴趣量身打造出推荐内容。举例来说,因为我观看了一场 USC 美式足球经典赛事的精华片段,系统便帮我找出当年其他运动赛事的精华片段,而如果没有推荐系统,我绝对不会知道有这些影片可看。和其他平台不同的是,相较于透过使用者本身的社群网路找到推荐内容,精确预测使用者想观看的影片,才是 YouTube 推荐系统成功的关键。

为了做到这一点,首先我们掌握了每个使用者在观看影片时都有自己独特的习惯。然后,系统会将你的观看习惯与类似使用者比较,并根据这项信息推荐其他你可能想看的内容。

因此,如果你喜欢某部网球影片,而系统注意到其他喜爱同一部网球影片的使用者同时也喜欢爵士乐影片,可能就会向你推荐爵士乐影片,即使你从未观看任何的爵士乐相关影片 (针对新闻与信息等类别的影片,系统会采取不同的做法,稍后会进一步说明)。

几年前,系统向我的大女儿推荐 Tyler Oakley 的影片,因为这是当时许多观看 Vlogbrothers 的使用者也会观看的内容。结果她成为 Tyler Oakley 的忠实粉丝,我们还带她去参加粉丝见面会。

使用者可自行暂停、编辑或删除自己的 YouTube 搜索资料

当然我们也知道,并非所有人都愿意随时与我们分享这项信息。因此我们设计了控制选项,让使用者决定要提供多少资料。这表示你随时都可以暂停、编辑或删除自己的 YouTube 搜索和观看记录。

系统如何提供个性化的推荐内容

为了提供这类个性化推荐内容,推荐系统并不会"照本宣科"以固定方式运作,而是会参考超过800亿笔我们称为信号的信息,每日从中学习,不断进化。也因为如此,要实现更高的透明度并非只是列出推荐系统采用的公式这么简单,而是要充分了解反馈至系统的所有资料。系统将透过综合考量下列几项信号,以得知你可能会满意的内容:影片的点击次数、观看时间、问卷调查的答复、喜欢和不喜欢的人数。

  • 点击次数:影片点击次数是颇具参考价值的指标,因为点击越多代表越受欢迎。毕竟,谁会点选自己不想观看的内容?

不过,我们在 2011 年发现事实并非如此,因为点选一部影片不代表你确实看过这部影片。

举例来说,假设你正在搜索去年温布顿网球赛的精华片段。你边捲动页面边浏览,然后看中其中一部影片,缩图是比赛场景,标题也有提到赛事,但点进去才发现这是某个人在自己房间内谈论比赛的影片。之后你又点选了系统在"即将播放"面板中推荐的影片,结果发现又是另一位球迷在谈论比赛。你一次又一次地点选这些影片,最后系统终于向你推荐你想要观看的影片内容。这就是我们在 2012 年加入"观看时间"的原因。

  • 观看时间:指得是你看过哪些影片以及持续观看多长的时间,透过这项个性化信号信息,可以让系统知道你最可能想观看什么样的内容。所以如果有网球迷观看了 20 分钟的温布顿网球赛精华片段,以及短短几秒钟的赛事分析影片,我们就可以放心假设他们更想要花时间观看那些比赛的精华片段。

当我们首次将观看时间纳入推荐系统之后,观看次数的数据立即下滑了 20%。但是我们相信,为受众提供更多价值是更重要的。尽管如此,并非所有观看时间都具有相同的信息价值。

有时我会随机播放几部影片直到深夜,但其实我大可利用这些时间在 YouTube 上学习新的语言,或跟著创作者一起精进我的厨艺。我们不希望受众对花在观看影片上的时间感到后悔,所以我们必须更加努力,设法评估使用者在 YouTube 上投入时间所获得的价值为何。

  • 问卷调查答复:为实际确认受众对于观看的内容是否满意,我们会评估所谓的"有价值的观看时间 (valued watchtime)",也就是确认使用者认为观看影片所花费的时间是否具有价值。

我们会在使用者问卷调查中请你为观看过的影片评定一到五颗星的分数,并将你的答案做为参考指标,借此衡量你对内容的满意度,进而评估有价值的观看时间。如果影片只获得一或两颗星,我们会询问为何给出偏低的分数;同样地,如果影片获得四或五颗星,我们也会询问你原因,是因为这部影片具有启发性或重大意义?而系统在计算有价值的观看时间时,只会纳入获得四或五颗星的高评价影片。

当然并非所有使用者都愿意为看过的影片填写问卷。所幸我们已根据实际获得的答复,训练出一个机器学习模型,用以预测所有人对问卷调查的可能答复。为测试预测结果的准确度,我们刻意不将部分问卷调查的答复加入训练程序,以持续监控系统是否能密切追踪实际的答复。

  • 分享次数、喜欢和不喜欢的人数:如果使用者分享了影片或表示喜欢,就代表满意度可能较高。我们的系统会根据这项信息,尝试预测你表示喜欢或分享其他相关影片的可能性。如果你对某部影片表示不喜欢,或许这就是你对这部影片不感兴趣的信号。

不过就像推荐内容一样,每个信号的重要性都取决于你。如果你会分享所有看过的影片,包括那些你给一或两颗星的影片在内,系统在推荐内容时,就知道不必过于加重计算你所分享的影片。基于以上考量,我们的系统并不会依循特定公式运作,而是会随著你的观看习惯动态调整推荐机制。

秉持负责的态度提供推荐内容

点击次数、观看次数、观看时间、使用者问卷调查、分享次数、喜欢和不喜欢的人数等信号信息,在产生音乐和娱乐类别的推荐内容时非常实用,而这些正是大多数使用者前来 YouTube 观看的内容。.............

原文转载:http://fashion.shaoqun.com/a/1045299.html


in china:http://www.ikjzd.com/w/2777
家乐福官网:http://m.ikjzd.com/w/3404
飞特物流:http://m.ikjzd.com/w/2273
运去哪:http://m.ikjzd.com/w/2278
老链接的回光返照之术——从0单再次破百!(已验证):https://m.ikjzd.com/articles/160289
为什么要做CE认证?:https://m.ikjzd.com/articles/160302
提升供应链能力,沃尔玛推出新一代履行中心模型:https://m.ikjzd.com/articles/160251

No comments:

Post a Comment