私宅
首发于私宅
民间版知乎分析报告第二期——赞同背后的秘密

民间版知乎分析报告第二期——赞同背后的秘密

5个月前那份首次民间版知乎用户分析报告受欢迎的热烈程度曾令我小吃了一惊。除了赞叹之外,也引起了许多人对知乎数据分析的好奇与探索。

过了这么久,越来越多的人开始追问「第二期什么时候出」?

但我不愿重复上次的框架、照葫芦画瓢地刷刷数据、攒出份毫无新意的第二期报告来骗几个赞。


所以,我心目中的第二期一定要换个思路,多谈谈之前没提到的方面,在数据中挖掘出更多的价值。


为了这个目标,我从去年12月就开始花大力气从知乎搜集数据,光是抓取的时间跨度就长达半月,剩下的时间则是对几千万上亿条数据翻来覆去地进行分析比对,这一折腾就到了2015年。



那么,就请享受这桌以「赞同」为核心的数据大餐吧。



  • 概况

抓取数据的日期从2014年12月14日到12月30日,共17天时间。这么大的跨度可能会造成一些数据对比不太准确的现象,好在我们重视的是整体趋势,个例没那么大影响。

(后面所有数字和分析均来源于这段时间,可能与最新数据略有差别,请注意)


所覆盖的总用户数达到了4,875,267人,比知乎官方最新发布的1000万少了一半。我相信以这次的扫描力度,剩下的500多万用户里基本不可能有几个热门存在,绝大多数都是三零或赞同很低的用户了。

这个数字也比8月中旬的第一次统计增加了39%。



其他数据及同比情况如下:


总提问数:1,826,294个(+32.21%)


总答案数:6,705,275个(+32.37%)

其中包含了专栏文章数:22,672篇(+7.46%)

总赞同数:62,807,475次(+50.05%)

总关注数:69,367,762人次(+33.57%)

整体增长趋势见下:


其中总赞同数增长幅度超过其他几项,说明用户的活跃度比起之前有不小提升,至少更乐于阅读和点赞了。

而专栏文章的数字则反映了这项始终处于内测中的产品并没有随主站一起高速增长,其原因到底是运营策略问题还是本身质量不如人意,还需要进一步分析,在此就不细讲了。



另外,根据统计,全知乎的人在这4年多的时间里共写下了11亿9095万6003字,上传了88万6280张图片。

为我们亲手打造的知识海洋鼓掌。



  • 高赞答案分布


前一次分析报告中最令人印象深刻的结论恐怕就是知乎用户关注和赞同的集中化程度之高了吧。但之前说的是用户,对于答案和赞同而言,情况又如何呢?


提到赞同数,在我印象中去年刚来知乎不久时,「破千赞」还是一件略显稀罕、值得大书特书的事。而如今随着知乎人数翻番数倍,一个引爆话题的热门答案可以在几小时内升到两千、三千乃至更高的赞同数。而「破万」这个曾经可望不可即的目标,也并不是十分罕见的现象了。

那么,就把如今知乎上6,705,275个答案的赞同分布情况列出来看看吧:

可见答案赞同数的集中度依然是相当高的(破百者不到1.4%,破千者仅有0.135%左右),甚至比用户本人的赞同还要集中——这很容易理解:因为每人的总赞同数是各个答案累计起来的,只要多写,也能积攒出可观的数字;但单个答案拿下高票还是需要实力、技巧和运气的。


从右边两列的人数和人均答案也可以看出,赞同越高的区间内就越难同时占有复数个席位,而万赞以上更是只有极少人才有资格染指一次,更别提两三个以上了。



(知乎拥有破10000、5000、2000、1000等数量赞同答案的用户都有哪些?谁最多?进入看知乎----用户动态,把滚动条拉到右边,点「高票答案数量」下的每一列进行排序就知道了,效果如下)



  • 字数与赞同数的关系


自从知乎开放时起,就一直有人抱怨知乎「变水了」,抱怨许多一句话抖机灵也能动辄得到上千赞同。那么知乎是否真的水了?是否长篇干货变少或无人问津了?

这是知乎所有赞同数为10~1000之间的答案分布图,注意,本图并非汇总统计,而是以类似热力图的形式把几十万个答案都堆了上去,每个半透明圆点表示一个答案:

(横轴为赞同数,纵轴为字数)

结果少数长篇大论占据了上面的空间,把绝大部分答案都压在了底下,那怎么能看得更清楚些呢?

解决方法是把字数坐标轴改成不均匀的对数形式,也就是数字越大,同等距离表示的数字范围也越大:

那么图表就变成了这个样子:


现在看得就比较清楚了,赞同数达到几百上千的时候,字数的总体趋势一直是增加的,而且幅度不低。

虽然这里也有很多百十字的答案存在,但密度已经远远不如左边的低赞区了。

中间那条黑色的趋势线代表了字数的整体走向,在赞同接近1000时,平均字数也已经达到一两千,其中抖机灵短答案尽管不在少数,但并没有影响到整体趋势。

(别看这条线很平直,那是因为对数坐标轴的原因,如果按正常来算,平均值增加了一倍还多)



那么,赞同超过1000的热门答案们又如何呢?见下图:

跟刚才一样,答案都堆在底角,那我们把横纵坐标轴一起对数展开(为便于观看,横纵分别选择了不同底数,请注意):

现在可以清晰地看出这些热门答案的总体字数趋势仍然随着赞同上升而不断增加,从上千处的1000多直到破万之后的三千、四千。



但是,我们刚才说的一直是平均数,如果仔细观察图形就会发现,圆点的分布并不完全集中在那条趋势线附近,反而在短答案区域(字数低于100)有另一条较稀疏的触手顽固地盘踞着。

这说明什么呢?说明高赞同短答案尽管无法影响大势,却也绝不是可忽视的存在。

当然,我们强调过无数次,「长」不等于干货,也有空洞无物的长文;「短」也未必是纯抖机灵,也有一针见血的真理。

数字无法描述知乎的全部,依靠自身直觉更容易引发偏见,只有两者结合才能了解一个完整的知乎。



最后可能有人注意到了一个位置最高的浅蓝色圆点,那是一篇长达99,495字的专栏文章。是谁的?不妨自己去找找。



  • 时间轴

我们再换个角度来佐证一下「知乎是否越来越水」的疑问,也就是从时间维度进行观察。

把所有的答案按发表月份汇总,从2010年到2014年底,看看平均字数有什么变化:

看图可知,知乎只在早期(2011年)和2013年春天开放注册后有过很明显的平均字数下降现象。早期因为用户太少,出现波动属于正常;开放注册后确实有变水的情况发生,但很快就恢复了之前的水平,此后的一年多时间里,知乎数次快速扩张,但每月新发表答案的平均字数都在170~200之间,并没有再度出现严重下降。



有人可能会质疑:平均值不能代表事实,是否大量短答案和少量长答案互相抵消了呢?

那么就针对「字数>100」和「字数>1000」这两个范围分别来做一次单独统计:


看图即知,100字曲线也在2011年和2013年出现了两次低谷,之后占比确实一直有所下滑,从35%降到30后略有反弹,今后走势如何还很难估计;

但1000字曲线则几乎一直在上升,从早期的1%逐步升到今天的3.5%上下,并且有保持稳定的趋势。


随时间推移,答案也越来越多了,但大家更爱赞短答案还是长答案呢?

我们再把这两个范围内的答案所获赞同占总赞同的比例统计起来:

趋势变得更明显了:两条曲线的大方向始终是一路走高,2013年6月之后尤其如此。

到了今天,100字以上的答案掠走了赞同总数的80%;而1000字以上答案虽然总数不到4%,所有人点下的赞同却有40%落在它们头上。

现在还能轻易说知乎变水了吗?



股市中选择各行业有代表性的股票价格计算出指数,可以反映出股市的整体走势。

那么我们定期选择知乎的热门用户并统计他们的一些指标数据,也能反映出整个知乎的一些情况。

这里选择了「看知乎」所统计的从2014到2015年每月初知乎总赞同数排名前1000的用户,统计他们的总回答、赞同和关注数并做成图表:

之所以把回答数单独列在一张图里,是因为它和另外两者差了两个数量级,不容易对比,单独列出反而更直观。


从图中能看出的趋势有这么几点:

  1. 三个指标的增长都比较平滑,从年初到年尾没有过于明显的增幅变动;
  2. 回答的增长速度相当慢(月均1.08%),而赞同和关注数基本以同步趋势在上升(月均分别为11.09%和10.88%,是回答的10倍);
  3. 唯一稍有不同的波动出现在2014年6月,这个时间之后关注增长率出现了微跌,同时赞同增长率有小幅上升,有趣的是回答数反而下降了,当然原因不会是真的下降,而是赞同前1000名中换了人导致的;
    这说明什么呢?一个猜测就是知乎「新人换旧人」的高峰出现在这段时间里,因为对于新人而言关注数上涨得远比赞同数要慢,不少靠单个或几个高票答案一路上升的新人冲进了Top1000,以至于将关注的涨幅拉了下来,甚至回答数还出现了负增长。
    这样的猜想可能略显草率,但目前缺乏更详细的历史数据,更权威的结论大概只有知乎官方能做出了。



  • 平均赞同与最高票答案

刚才我们看到了一年之间知乎排名Top1000的用户们在答案数和赞同数增幅上的巨大差异。

2014年初,平均每个答案还能拿到24.67个赞同,到了2015年,这个数字翻了三倍,达到了76.70——假设答案平均水准不变的话,成为大牛的难度也低到了之前的三分之一。

难怪有人觉得现在大牛有点泛滥,或许标准该提高点了,比如以前最低一万赞同,现在起码三万往上,低于标准的只能叫小牛——扯远了。


那么,现在全体知乎用户的「平均赞同」,或者叫「赞答比」到底通货膨胀到了什么地步呢?

这里就是所有写过答案的790716人中所获得平均赞同数的分布情况:

其中约有接近一半的人写了答案却没有赞同,而另一半则平均每个答案的赞同不到10,平均赞同过百过千的也是极少数了。



不过我们刚刚才说过一件事,就是平均值不能代表事实。如果两个人都是每个答案平均100赞,其中一个人的每个答案都在80~120之间,另一个人大部分答案是个位数,只有一个冲上5000,拉高了平均值,那么,这两者谁更强?

虽不能一概而论,但通常来说是前者。如果某人真的写出了一个有干货的高票答案,一般情况下的发展是这样的:

除赞同外还带来大量的关注、许多人开始挖掘他的旧答案、本人也受到激励而会继续不断写出新的干货,进而逐步升级成拥有一大批高票答案的大牛……

但如果这个高赞答案并没带来一系列后续良性循环,那很可能它就是个纯抖机灵,或讲了个热门故事,无法复制最初的成功。



既然我们提到了最高票答案,那就把前面平均赞同数各个范围中最高票答案占比的情况分析一下:


图表乍看不是很好理解,解释一下:

每一列代表了平均赞同数落在这个范围内的用户们,而每种颜色表示了某人最高票答案的赞同数所占总赞同数的比例。最底下的蓝色说明这些人的答案质量相对平均,因为最高票只占了20%不到;而上面的颜色则代表这里集中了一批只靠单个答案暂露头角的人。



从图中可以得出如下结论:

  1. 平均每个答案赞同小于等于1的群体尽管数量庞大,但落在这个区间的人最高票占比明显比后面偏高。究其原因,恐怕要么是太热爱灌水,要么答案数量很少且赞同大多为个位数导致比较分散吧;
  2. 观察后面的四个区间,可以看出相同的走势:两极化。也就是最高票占比80%以上和20%以下的两个区间人数都在明显上升,反而是落在中间的群体变小了;
    为什么会这样?结论应该和前面散点图那里类似:平均赞同越高,这个群体越活跃的就是两种人:靠单个答案冲榜的,以及真正做到平均质量始终很高的。其余的人往往会因为一批低票答案拉低了平均值,掉到下一档去了。



最高票答案与整体赞同之间的关系是个很有意思的数字,除了和平均赞同做交叉分析之外,还可以用另外几种方法挖掘出它的更多价值:

例如,和用户的总赞同数放在一起进行对比。

我们把赞同超过100的所有人划分成更细的区间,包括100、200、500、1000、2000、5000、10000(很像钞票面额吧),然后把最高票答案所占比例列出:

(黑色粗线是各区间内最高票答案所占的总比例)

这次的趋势十分明显:随着总赞同数的升高,拥有多个高票答案的人占比越来越多,特别是到了万赞以上时,近九成的人没有哪个答案能占据自己过半的总票数,而靠单个高票答案就当上大牛的也越来越少了。



  • 点赞者


韩乔生老师惊奇地发现本届世界杯的进球数和失球数一样多,我也有个惊奇的发现:知乎的赞同数和被赞同数也是一样多的(如果没有匿名的话)。

不过,既然赞同数分布如此集中,那么他们为别人点的赞同数量呢?


这回总算在知乎看到一个不以指数级别迅速缩减的数字了。

除了近半用户从未给别人点过赞同之外,只点过10个赞以下的也占了30%,这部分可视为「参与性不强」的用户群;

不过再向上数就会发现,100~1000这个范围内的人反而比10~100来得多,大概能说明知乎带给用户的参与感和粘性还是很不错的——如果你乐于每天来这里,时不时写个答案或点个赞,那么很容易就越过10~100的界限,某天忽然就会发现自己已经赞同过了几百个答案。



那么问题就来了,乐于给他人点赞的人,大多是纯读者呢?还是同样拥有更多赞同的大牛们?

我们再布置一次散点图,横轴是自己得赞数,纵轴是给他人点赞数,并且刻度都以对数形式表示:

……看起来有些不爽,因为对数坐标轴下的个位数部分会拉得很开,感觉像进入了三维空间。

那我们索性切掉这部分,然后再加几条辅助线便于后续分析:

这样看起来顺眼些了。


中间的黑线是一条斜率为1的分割线,位于它左上方的都是给人点赞多于自己得到的那部分用户,右下角则是所得多于给别人点的那些。

统计结果是:

后两者加起来,不到前者的十分之一。可见知乎毕竟还是个读者远多于作者的地方。



不过,如果把两者数量都限定在10以上,也就是为别人点赞超过10个,自己也收到了10个以上的赞同。情况就变得平衡多了:

差距已经小于2:1了。换句话说就是只要在知乎参与得稍微深入些,就不会总是像个纯读者,而是开始乐于写答案并得到他人的赞同。



前面那幅「赞同-被赞同」散点图的右上角还有两个有色矩形区域,其中较大的一个是「赞和被赞都大于100」,范围内的人数为26,521;另一个则代表两者都大于1000,包含了1,483这些人都可以算是等级不同的知乎高级玩家了。

另外,还有13位赞同和被赞均破万的铁杆大牛。



仔细看图表右上角,找到那个离黑线很近但略低一点,但比所有其他赞同过万者位置都高的浅色圆点了吗?

那是黄继新,他在过去的四年里一共赞同了33,546个答案。

但这也不是知乎最高纪录,对顶级的点赞狂魔而言,这个数字达到了不可思议的49,038次!而且仅用了一年多的时间,也就是说每天都要点100多个赞同。这次又是谁?继续猜猜看吧。



  • 脑残粉


前些天的「谁是我的脑残粉?我的偶像又是谁?」其实是基于本次抓取的大量数据,针对各人之间的赞同关系进行汇总而做出的一个余兴产物,目的是娱乐而非分析。如果要认真分析的话还会得出更有趣的结论。


首先是对赞同关系的汇总:

这悬殊的差距简直没法画出图表来,每行之间都有一到两个数量级的差距。任何两人之间最常见的点赞关系就是只点一个,此外再无往来,这种行为占了所有人的91.87%;另有7.9%的行为更亲密些,可能多点几次但不超过10个;再多的话,那就是一种只占千分之二的稀有行为了。


在这些稀有行为中,首屈一指的是某位顶级脑残粉,TA为对方所有1272个答案中的1214个点了赞同;

第二名也不遑多让,赞了1068个答案中的994个;

再往后翻几名的话,值得注意的是这么一位:TA给649个答案中的537个点了赞同,而且,还没有关注对方(这是何等的暗恋)。

剩下的就不逐个拿出来讲了,大家发掘出来的可能更有意思。

另外,除了单方面的关系之外,还有一种情况就是两人惺惺相惜,互相赞赏对方的答案,比如在个人主页右侧看到的这种内容:

如果把所有人都排出来比较一次,就能找出全知乎关系最亲密的那些人了。Top100好基友一览表(以两人互相赞同数之积排名)

如果你混迹知乎很久,在里面可能会看到许许多多熟悉的名字,以及出场时经常形影不离的二人组合。他们每隔一段时间就卿卿我我一次,以为除了双方自己之外没人能发现事情的真相。




  • 传播者


知乎的赞同行为最大的意义是什么?不仅仅是对回答者表达自己的态度,更重要的是将这个态度传播出去。传播得越广、答案推送到越多人的时间线上,被阅读、被赞同、被继续传播的可能性才越高。

鉴于知乎存在大量的三零、无关注或极少关注的用户,他们的点赞行为并没有传播能力,只能在问题页面改变一下答案的排序,只有少量拥有粉丝群的用户能作为传播节点从而为答案带来更大的影响力。

那么我们可以合理猜测,一个答案的赞同数,实际上应该与赞同者中的大V中V小V数量有一定的关联性。


事实果真如此吗?

我们先从赞同数较低但数量众多的答案入手:

(横轴是答案赞同数,纵轴是所有点赞者中关注大于某值的人数,黑线是线性回归的趋势线)

从图中看来,规律其实并不明显,因为人数不可能超越赞同数,所以蓝点只能出在右下部分。而无论是针对关注大于10还是大于100的用户,都很难从几乎铺满画面的蓝色中找出很明显的集中趋势来。

左上角的两个数字分别是线性回归的标准偏差以及根据平均值修正过的偏差比率。0.3953代表什么?就是所有散点距离中间那条黑色趋势线的离散程度。数字越大,代表越分散。

上面的图约为40%,下面一张就有80%了,已经分散到了几乎难以用一条直线描述趋势的程度。



那么是不是说明「赞同数和赞同者粉丝数」没什么直接关系呢?未必,我们不妨再换一些更热门的答案来,比如赞同数为100到1000之间的:

现在的规律比之前明显多了,对于关注数大于10和100的用户而言,人数随答案赞同数一起上升的趋势变得更加集中。

少数答案的位置远高于其他,这是正常现象,原因不外乎是专业型答案读起来有门槛,不会被大批普通读者追捧,或者是较早期的答案未被后人挖掘,而当时的点赞者今天已经变成了大V所致。

而「大V含量」稍低的那些答案,有的是情感向或抖机灵,导致大量爱凑热闹的读者点赞,而相当一部分专业向的用户不愿意推荐这种答案;另有一种可能,就是雇了僵尸粉,把赞同数推上了虚高的位置……


买粉买赞的问题我们放在后面讲,接下来再看看赞同超过1000的热门答案:


趋势变得更为集中,看起来对于知乎的答案而言,赞同数和赞同者身份确实是有一定关联的。尽管不能妄下断言,比如说几千赞同的点赞者中必有几个大V之类,但这种规律让少量「大V含量」较低的答案开始变得有些刺眼起来。

让人不禁想问:你们是怎么靠一堆几乎没有粉丝可言的传播者搞出成千上万个赞的?



既然我们有了初步结论,那么,接下来该向一种破坏社区秩序的行为开刀了。



  • 僵尸粉特征初步分析


如今的知乎已经是中文网络中影响力很大的社区。有眼球就有利益,所以各种营销手段也纷纷上马,有软文、有广告、有公关,有各种利益相关和私货。

我之前也谈过营销和利益关系的问题,总结起来其实就是:如果答案本身提供的有效价值越高,大家对其中包含的营销成分就越宽容;反之,如果答案本身毫无诚意、纯粹为了自我宣传,内容有错漏甚至有意误导,那招人厌恶就是自作自受的结果了。

而其中最为恶劣的,则是那些原本没人理会,却买僵尸粉点赞的行为。它把原本紧密关联的答案质量与赞同数的关系彻底割裂开来。尤其是对于一些热门问题,写一个隐藏了利益相关且有误导性的答案,买些僵尸粉点赞推到前端,很容易造成不明真相的群众轻信,甚至主动参与传播。



我研究僵尸赞已经半年多了,起初是偶然发现,后来发现了不少规律,比如起名策略、互相关注的方式等等,但苦于举报了一个还会冒出两三个,还有几十上百个隐藏在凭一人之力难以觉察的角落里。

但这次数据分析工作给我带来了许多帮助,特别是很多靠双眼和键鼠要花上十几分钟才能确认的事实,在数据库中会以一秒钟几百个的速度现出原形。

这里当然不可能把所有买赞嫌疑的答案都列出来,只是列出几种最典型的情形和案例,以及我采取的破解方法



1、毫无理由的大量匿名用户点赞,这种简直是任何人都一望即知,而且匿名赞也毫无传播能力,除了给自己一个稍微好看的数字之外,不知道还有什么作用。例如:

(看你的点赞列表,还不明白为什么吗?)

2、接下来这种比纯匿名稍好一点,起码都是带名字的,遇到普通人就糊弄过去了。但是这些望之不似活人且规律极其明显的ID,只要多看几次就很容易发现马脚:


况且用程序一扫更是彻底曝光:它的344个赞同者中,有342个赞同为零,330个关注为零,所有人的关注者加起来才20个。



3、这个比前一个更有迷惑性,关键就在于点赞者并不是三零用户了,而是一些看起来没那么有规律的名字(字数不等、中英混杂),而且许多人是有几十上百个粉丝并写过几个回答的:

那么,这种僵尸粉是怎么被发现的呢?

结论很简单:他们的关注者,要么是三零用户,要么就是一批僵尸之间互相关注。因为僵尸粉没法吸引到真正的活人粉(当然也不排除少数看到女性头像就关注的人),所以他们的关注者中重复率极高。

以上面的答案为例,它有525个赞同者,所有人的关注数之和高达65517,但是只计算其中不重复者的话还剩多少?455个!

这要不是僵尸小圈子,我现在就把键盘吃了。


不过,这种行为纯靠人力是难以证实的,只有在大规模数据挖掘之下才会无所遁形。



4、接下来还有另外一种更隐蔽,甚至难以察觉的行为:就是前面说过的参与热门问题,然后先买粉点赞,试图引起更多人的注意。然后就会趁机得到一些赞同,如果赞同者中还有大V,那这个答案就会顺理成章地洗白,以后的点赞者组成就和正常答案十分相似了。


比如这个答案,无论你怎么看,也是一个正常的破千赞答案,点赞者也没有什么问题。

但是,把滚动条拉到最底下,看看它最早的赞同者们:

这些人有什么特点?前100人的总赞同数之和为0,总关注数超过10的只有9个人。

也就是说,这是一个典型的「靠僵尸粉在热门答案里刷存在感,然后洗白成高票答案」的行为(后会无期的电影问题短时间内关注者上万,2000多个答案,是当时的热点)。


此类行为的数量其实相当多,从几百到上万都有,甚至包括一些声名远播的热门回答,只是常人实在难以察觉而已。



平心而论,能靠这种方式红起来的,未必不是有价值的东西,甚至有人可能会为之辩解,或批评知乎的机制让好答案无法被人发掘出来。

但这和自忖聪明不读书而考试作弊的人一样:你觉得自己有实力,却又靠破坏规矩来上位,这会让那些同样有实力却因公平竞争被你踩下的人怎么想?


以上就是我所总结出的一些常见僵尸点赞行为。通过对海量数据的挖掘分析,符合这些特征的答案多达千余,辅以人工验证(也就是我自己点开一个个看)之后确认的也有数百个,其余的大多没有精力细看了。而为这些答案点赞的僵尸粉足有五六千,有的是三零用户,有的分散在互相关注的数十个小团体中。

现在我知道淘宝上那些销量不低的知乎点赞服务都卖到哪里去了。



不过,聪明的僵尸粉会做一些更像正常人的事情,比如随意写一些无意义的答案然后被自己人点赞,比如关注些大V名人,比如给一些热门答案点赞……所以我也很纠结轻率地、不加验证地发布统计结果是否会误伤好人。

正是基于这种考虑,「判断僵尸粉」仍然是个远未完成的工作。我还需要再进一步改进算法、整理名单并交给知乎官方进行处理。然后把自动筛选僵尸变成一项高效、精准、自动化的工作,而且最好由官方主导进行。


因为现在知乎僵尸点赞的影响尽管还不像前些年的微博那么大,但如果不重视的话,它对社区秩序及公信力的破坏很可能是十分严重甚至致命的。



  • 结语

徜徉在数字海洋中是种难以言喻的奇妙感觉,既能挖到耀眼的奇珍异宝,也容易一不留神被暗流吞噬。比如为了改进僵尸粉搜索和统计答案点赞者构成的算法而殚精竭虑;而动辄几个上亿级的数据表做多级关联把我那台孱弱的服务器拖垮了好几次……

在此感谢所有在本文构思、抓取、分析期间提供帮助的、激发灵感的、讨论细节的、时常催稿的朋友们,没了你们的话,这东西不仅会拖更久,而且内容丰富程度上要打不少折扣。


如果对这次分析报告的内容、思路还有哪些建议或批评,欢迎前来交流。

我最希望的不是得到几个赞同,而是激发更多人对于数据分析以及对于知乎的兴趣。如果日后官方和普通用户都开始关注知乎这座数据宝库、并且时常挖掘出干货与趣闻的话,那就是最让我欣慰的事了。

【完】

编辑于 2018-03-07

文章被以下专栏收录