内容平台的中心化与去中心化分发(一)

内容平台的中心化与去中心化分发(一)

最近工作有了一些调整,业务方向发生了一些变化,从做社区变成了做内容平台。也花了一段时间思考新业务上的一些东西。内容比较多我将分成几部分来写。


  • 什么是分发

社区产品也好,内容平台产品也好,用户在这里的主场景都是获取和交换一些信息。我把这类产品统一归类为内容型产品,与之对应的是工具型产品,用户在工具型产品里主场景是获得某种服务获使用产品提供的某种能力。

对于内容型产品来说,如何对内容进行分发是最重要的课题。

从模型上来讲:平台上拥有一些可被消费的内容,我们暂且不管这些内容是如何得到的,总之有一些内容,这些内容构成集合A,同时平台上拥有一些进行内容消费的用户,这些用户构成了集合B。这里需要引入公理:

公理 1 任意一个用户对于集合A中各元素的偏好值不全部相等。

公理 2 任意一个用户对于集合A中各元素的偏好值不全为非正数。

上述两条公理的意思是,一个用户不可能对平台上的全部内容一样喜欢。总是有一些内容是他更喜欢的,更适合他的,更应该被他消费的。如果这个用户是 1 ,我们称这些内容构成的集合为C1。如果将C1、C2……构成一个集合D,那么从A到D的映射,就是内容分发。

换句话说,那些被偏爱的内容从出现在平台上到被对应的用户消费的过程,就叫做内容分发,也叫流量分发。后文将统一采用流量分发的说法。


  • 如何评判分发

平台方会构建一些方法来完成流量分发,衡量这个方法优劣的至少包含两个指标:

  1. 信息的分发效率
  2. 信噪比

分发效率的意思是,一个用户找到他所偏爱的内容所需要的时间复杂度和操作复杂度。我们希望用户能够非常快速且便捷的找到他所偏爱的内容。

信噪比的意思是,用户最终看到的内容中,是他偏爱的内容量与不是他偏爱的内容量的比值。我们希望用户能够在尽可能少的看到他不偏爱的内容的前提下,看到尽可能多的他偏爱的内容。

依照这些方法,平台方通常可以构造出一个分发网络,而衡量这个网络优劣的还至少包含两个指标:

  1. 网络的健壮性
  2. 网络的生命力

网络的健壮性的意思是,整个网络在抵抗一些扰动和破坏时的抵抗能力。我们希望网络能够对来自内外部的干扰,比如垃圾信息、或者一些内容生产源的突然消失等有比较好的抵抗力,在发生这些情况时,网络不会崩塌,体验不会有致命的影响。

网络的生命力的意思是,整个网络对于新产生的内容源的保护程度。我们希望网络能够使新产生的内容源正常的生长,而不是因为他是后产生的就必然死亡,这样平台上才会有源源不断的新内容源补充进来。

这里举个例子:

对于百度贴吧(我们抽象成没有搜索的单个贴吧)来说,他的内容流量分发方法包括:回帖置顶、加精、管理团队设置的条件。贴吧的生产型用户是生产源。在贴吧的实际使用过程中我们可以清楚的感知到,越在列表靠前的帖子,越容易被曝光。因此,这个分发网络的样子是一串从大到小的节点,每个节点上连接着一些用户,其中越大的节点链接的用户越多,且节点链接用户数的衰减是指数型;用户之间没有连接。

这个网络的生命力是极强的,通常一个完全新的用户发表的帖子一定会被曝光,如果足够优质产生了高频的互动,或者被吧主加精,贴子将会持续获得高额流量。因此贴吧对于优质的新用户是友好的。这样的后果是,健壮性一般,对于反垃圾来说比较依靠管理团队的能力,这也是为s有爆吧的存在,你听说过爆谁公众号么?另外一方面,由于流量是跟着曝光位走的,曝光位本身不会流失,所以即使贴吧里的一些内容生产者离开了,贴吧也不会立即死亡。

不过这个分发网络的分发效率是很低的同时信噪比很低,用户最先看到内容是出现在贴吧第一页第一屏的内容,这部分内容对于贴吧的全部用户来说是平等的,很难仅仅靠这些内容就命中每一个用户的合适内容。用户在寻找到他的合适内容的方法几乎是:依次逐篇的浏览。此方法效率极低。之所以说是几乎,是因为机制中的回帖置顶能力,微弱的利用了其他用户对内容的筛选,因为越多人互动的帖子越会长期占据高曝光位,我们可以认为越多人愿意互动的内容,越适合其他人阅读。这里有个前提:用户在不同内容之间的分布是正态的。大多数的用户口味是一致的。



  • 什么是中心化分发和去中心化分发

讲到这终于该点题了。首先我们来定义什么是中心化分发,什么是去中心化分发

在前文中提到的分发方法中:

如果是由平台方或者极少数人组成的特殊群体来决定所有流量的走向,这种分发方法叫做中心化分发;例如传统门户网站。

相应的,如果不是由平台方或者极少数人组成的特殊群体来决定所有流量的走向,这样的分发方法叫做去中心化分发;例如上文提到的百度贴吧。

其中,如果完全由每个个体决定所有流量的走向,叫做完全去中心化分发。例如百度搜索。


从结果上看,通常中心化的分发是千人一面的,有些去中心化分发也是千人一面的,也有些去中心化分发是千人千面的。

显然,中心化的分发必然会有的一个问题就是信噪比低 ,因为相同内容很难同时满足没一个人。

当然,中心化的分发也有个明显的优势,对于被这部分内容命中了的用户来说,系统的分发效率极高,因为内容直接就被放在脸上了。同时,对于平台方来说,对流量有极强的控制能力,平台想让流量流向哪些内容都可以做到。

中心化分发的方法构成的分发网络通常是星型结构的,即所有用户构成的散点全部连接到同一个中心。中心节点是唯一的流量枢纽。这种网络缺点明显:

  1. 对新产生的内容源极不友好,内容源必须跟平台方进行合作才能使用中心节点的流量分发能力获取流量,除此之外别无他法,多努力都不行。而对新产生的内容源不友好长期的结果是内容源逐渐减少,而用户最终是追随内容的,因此会导致平台流量的流失。
  2. 健壮性极差,一旦中心节点出现故障,整个系统瘫痪。外部的干扰和破坏都可以定向的指向中心节点。

中心化分发的另一个常见结果是:头部现象明显。一个比较典型的例子是,常见的直播平台。平台通过置顶、首页推荐等方式为主播导流,风险就是头部主播的流失对平台放极大。可以想想,如果淘宝平台90%的交易发生在一家店铺,这对于淘宝来说绝对不是一件好事。


下期预告:移动互联网两种常见的去中心化分发方式:社交化分发和兴趣推荐

编辑于 2016-12-27

文章被以下专栏收录