「深度解读」抖音算法机制

「深度解读」抖音算法机制

现在任何只要关联抖音系列的文案,都会涉及到算法机制的话题。但是对于新手来说像极了“无字天书”只能给有缘人观看,信息碎片不完整。看完又有一种似懂非懂的感觉,实操却还是抛在一边。今天这篇文章会由浅到深的介绍整个算法机制。过滤掉无用的信息,只展现与视频制作强关系的内容,满满干货请耐心阅读。

算法机制初体验

什么是算法机制

算法机制好比“植物生长规律”,你可以通过"改造种子,肥料,种植环境"等外来因素去影响他的生产结果,比如缩短生长周期量产等。但是却改变不了他生长环节,种子→萌发→结果环节还是一样一环不能少。

为什么了解算法机制

那么我们学习算法机制的目的,并不是忽略作品的质量问题,去通过外力去揠苗助长。这不是我的本意,我的目的要学会做一个懂得触发机制的人去让内容符合算法。作品好比种子,植物能不能量产以及结果品质好不好取决的是种子,非肥料,非土壤。我们需要根据算法机制去调整作品细节,让作品能触发机制后快速上升最大化。

带有算法机制下的场景变化

在这里不得不说“头条系",如今“头条系”产品已经成为自媒体用户最活跃并体量庞大的巨头平台。他的特色就是“以用户为中心”,只推送你喜欢的内容,从初期适应用户需求到精确满足用户需求的目标,从而实现内容定制化。

如果你被一个娱乐类型的文章或者视频所吸引并点击阅读,之后你的内容主页就可能被定制成了娱乐类型。而在外后的过程中机器算法,会不断细分采集并记录你的行为标签,从而让你喜欢看的内容越来越精准,可能最后细化到只给你推送”某个明星“的相关新闻或者视频。

算法机制下的内容定制,等于为用户找一个“懂你的另一半”。

抖音算法的原型

上图就是整个算法机制的样子,其实真正的原型远远不止这些,仅仅只是把前端的原型画了出来,而我们了解这些就已经足够了。

整个流程总共分三部分:给内容贴标签,给人物贴标,按照标签智能个性化推送。

给内容贴标签

那么头条系的内容标签库会如何打呢?

内容类目

下图为2015年今日头条透露出来的一份数据报告,表达是男性与女性关心的主要内容类目

基因算法

这个标签类目算是头条系的母类目,那么作为头条系的“孩子“抖音,必然遗传了头条系“爸爸”原始基因并在细化非常多的小标签,比如娱乐,可以细化到"XX明星结婚”的标签。

给人物贴标签

用户画像

平台会根据用户在使用App的习惯进行分析行为路径,再进行贴标签,再继续优化标签。这个过程都是实时的机器算法。

那么这个采集的方法:就是个人资料的填写,关键词搜索的记录,浏览的比较多的类目视频,点赞视频数据,评论数据,通讯录的圈子关系等。

通过不断的标签优化升级后,呈现出来标签用户,我们也称之为用户画像,参考下图

数据共享

先看看头条系的产品(部分热门)

头条系会打通所有平台的数据库,看看你在每个平台的“偏爱标签”并记录下来。

头条系为了“以用户为中心”,背后靠的是大数据支撑

智能标签推送

模拟场景

这次用了陪伴大家整个童年的老朋友”小明“作为我们第一人称,尝试模拟初次遇见《今日头条》后转玩《抖音》会出现的场景。

预览顺序:

当小明第一次玩《今日头条》后,平台算法对小明平时每个预览的内容都进行贴标签。最终得出了属于小明在《今日头条》这个平台的标签画像

当小明通过《今日头条》账号登录《抖音》后,数据共享会吧这个头条账号的标签画像同步到抖音平台,并进行原平台的标签画像匹配标签视频内容,智能推荐给小明

在小明玩抖音的过程中,平台算法会多次实时统计小明有转赞评行为的其他新标签视频。

最后不断智能优化标签画像,最重呈现出新的标签画像,如下图

优化后同时匹配新标签同类视频推送给小明,最重完成了头条系的算法机制运行路径。这个过程是AI算法,会实时计算,升级,优化标签,而且永无止境,实现“用户为中心”定制化内容推送。


抖音的推荐机制

上面对头条系的推荐机制整个框架有个大概的介绍,接下来介绍是关于抖音热门强相关的作品推荐机制解读

推荐模式原理图

上传的作品内容皆为抖音审核员所见,具体排列顺序依照:账号资料完善度,账号认证情况,推荐基数,视频播放量,点赞数,评论数,分享数量,发布时间,@抖音小助手等进行权重计分,高得分视频排序越越靠前优先审核。且视频内容为随机分配给抖音审核员。
推荐基数
根据实际浏览人数,时长,点赞比例,评论比例等设置的一个基础值。

整个环节简化拆解为几个步骤

流量分桶

先把你的视频检测标签,如果作品被机器贴上标签那么就会分桶到对应标签的流量洼地。如果标签模糊无法贴标签,那么就会零散推荐,无法进行精准推送

流量分桶是什么样子的?

头条系关于流量分桶的图解

送量测试

这张图如果是自媒体老玩家是非常熟悉的,如果你是新手也没关系,我自绘一张“大白话”版本的流量图解

这是头条A/B Test实验系统的基本原理。

  • 首先对上传的作品进行机器审核;
  • 为通过的视频贴上标签并申请流量推送;
  • 抖音会对实时在线用户进行流量分桶,每桶按照总用户量10%分配进行实验推送;
  • 分配的视频流量再进行分配实验组,每个实验组按照5%比例分配,并为用户贴上相近标签
  • 把作品送量测试给首个实验组用户,根据用户反馈(CPA)“转 评 赞 完播率” 计算作品基数
  • 达到通过推荐基数,继续把作品推送下一个分配实验组进行测试;
  • 通过首个实验组的基数测试后,作品将进入人为审核是否继续送量测试;

抖音数据算法反馈

那么如何通过播放量自查作品进入哪个实验组?我把作品从上传到热门优质池状态这个路径划分为3个阶段,并用播放量作为对标的方法。

启动阶段

小于1000播放量,这个时候1000播放量就是你的作品的种子用户,那么这个时候作品的黄金3秒,精彩前置等手段保证初始种子用户留存从而进入下个阶段;

小爆阶段

通过多个实验组的送量测试后,作品进入高展状态1万到10万播放量,这个时候作品影响数据的细节,包含用户引导,开发式问题留给大家去评论,激发二次沟通意愿。如果你的作品依然通过小爆炸阶段以后,你的作品将会进入到优质池状态,我称它为王者流量池,它是一个大爆炸的阶段;

大爆炸阶段

进入到这个阶段,你的作品已经进入优质池状态,已经上热门了。抖音会给你100万以上的播放量,这样子的播放量到底有多少转化为你的粉丝,就是你自己功底的一个累积的过程了。

抖音数据影响关键

用户反馈(CPA)数据

  • 完播率:不仅仅是视频的播放完成率,还有用户多次播放的数据,重复播放次数也会加入基数分值;
  • 点赞率:用户的点赞数量,和播放数的占比,影响推荐,点赞是源自用户对内容的认可,犒赏,收藏的表达方式;
  • 评论率:不仅包含用户评论数量,还包含用户查看评论数量,评论点赞数量;
  • 转发率:不同渠道的转发,包含是否在评论里面@好友;
  • 粉丝量:包含现有粉丝量,新增关注粉丝量及去关粉丝量,几种分值算法;
  • 进入主页:通过作品进入用户主页也有加分,预览其他作品数量及次数,还额外关系账号权重;
  • 查看音乐:通过作品查看音乐也会有基数,以及背景音乐是否原生;

这里面的基数分值权重是直接影响作品权重,很多人不会分享这里面的细节。今天我们大无私分享。

看到上面的基数分值的方法有没有发现一个特别有趣的点?

其实15秒的视频权重一般情况下会大于60秒视频的权重,也就是做新手账号与大号在同个起跑线的同时,新手号作品基数分值会比大号更高,因为很多60秒的作品在完播率这块就加分很少,15秒一瞬而过反而导致观众会意犹未尽重复观看,那么15秒作品=完播率+重复播放率

作品影响数据的关键点

  • 拍摄与剪辑

(正确指标)画面清晰流畅,匹配字幕,调色符合内容:如美食(暖色调),背景干净唯美,声音清晰悦耳;

(错误指标) 画面模糊,分辨率低(非绝对,手机原生拍摄也是可以通过)。声音含糊不清,色调让人产生不舒服的感觉,背景杂乱,分散注意力。一般出现这些现象的作品,那它可能已经在人工审核环节被PASS,无法进入下个阶段的推送。

影响上热门关键因素

  • 审核不通过因素

推荐机制全过程

从上传→审核→识别→推荐,如果推荐数据指标高于基数分值视为正,作品将会继续推荐。如果推荐的基数反馈低于基数则为负那么将停止推荐。这就是整个推荐机制的全过程。

热度强相关的转化率

上图表达了关于转化比强关系的要素,那么转化率直接影响的是作品热度。

让内容更贴近算法

上面内容对于作品的基数分值针对哪些会有关联进行介绍,那么在推荐机制中对于内容的标签关联的计算方式是怎么样的?了解内容标签匹配过程,能让我们往后对于自己的作品的用户垂直度能做到更细微的调整,让算法更好的收录自己的作品并进行多次的推荐。

  • 分类

Step.1 短视频A进入推荐系统后,系统根据上传设定的分类“体验”将其放置体育分类池中;

  • 标题

Step.2 系统抓取短视频A标题《姚明大动作,男篮设两队两主帅》中的关键词,“姚明”。“男篮”;

  • 用户垂直精准度,标题+封面

Step.3 系统匹配用户数据中标有“姚明” “男篮” 所对应“体育”“篮球”“男篮”等标签的用户,小量级试探推荐,观察用户是否感兴趣观看并有良性反馈;

  • 用户垂直精准度

Step.4 继而扩大量级推荐,并根据“姚明”,“男篮”关联更多关键词及标签用户,如“NBA","CBA","奥尼尔”等.......

抖音推荐逻辑的3个关键词

  • 基础流量:标题,封面,分类标签,用户垂直精准度影响;
  • 叠加推荐:对用户垂直精致度,有没有足够了解;
  • 时间效应:账号翻红的可能性,旧的内容给到新的用户;

整篇文章针对当下抖音的算法机制由浅到深,由大到小的介绍,主要目的是让抖音的内容生产者能深刻了解抖音的算法框架,对于自己的作品的细节能进行调整,让作品自触发算法更好的上热门。后面我们会教大家如何更好的玩好这个机制,解锁各路热门视频的套路。

文章首发:《TOP 达人》

下篇预告:《抖音功能背后的秘密》

编辑于 2019-03-27

文章被以下专栏收录