数据冰山
首发于数据冰山
汽车论坛“水军”初探

汽车论坛“水军”初探

越来越神秘的水军

随着信息技术的发展,互联网已经成为购车者进行购车决策的重要信息渠道,只要在百度搜索框输入某某车型,就会出来一堆文章,这类文章大部分会告诉你:在某几款汽车之中,XX车不仅外观优美,其他方面也特别出色...亦或是老司机告诉你选什么车...

这类文章虽然铺天盖地,但杀伤力却有限:人民群众被各种各样的营销手段洗脑多年之后,已经不再单纯。买车是大事,一般人会选择逛汽车论坛,充分参考各方意见后,再做决定。

可是,去汽车论坛就能避开水军了吗?很可惜,并不会。如今的水军组织越来越神秘、话术也越来越高明。真实身份也越来越难以辨别,有时分不清是意见领袖(大V),汽车专家还是水军

以最近将举办的上海车展为例,各车厂即将发布的新车自然是重头戏,而各论坛的“水军”也毫不示弱,让我们来看看“水军”是如何起舞

为了给广大车友一些信息,我尝试分析了2016年主流汽车论坛(汽车之家等)共2亿4千万条帖子,下面请随我一探究竟。


寻找典型水军

这2亿4千万条帖子,涉及82个汽车品牌、768款车。应该去哪个论坛找典型水军呢?

最直观的想法便是先看看哪些汽车论坛最热闹,水军数量也估计会相对较多吧!

2016年,火爆网络的“国产最美SUV”博越在汽车论坛也成为了明星。博越论坛全年一共有4百多万条帖子,在所有汽车论坛中排名第一。但是单凭这一点,就去博越论坛分析水军,显然有失公允。何况博越是2016年上市的新车,受到更多的关注也很正常。怎么办?

这时候,就需要一点点生活经历了:我以前逛sg论坛(知道sg论坛的请自觉打赏)的时候发现,人民群众的眼睛是雪亮的,一个论坛中出现了水军,论坛原住民往往会出来指认。就像下面这样:

也就是说,我虽然无法直接知道哪个论坛的水军多,却可以观察每个论坛对水军的反应。根据这个策略,我统计了各汽车论坛发言中出现“水军”两个字的次数。结果如下:

有了这个图,我决定把目光聚焦到2016年的汽车之家博越论坛,寻找典型水军。

2016年,一共有230,531名用户在汽车之家博越论坛发过言(主贴+回复)。下图是用户年发言数箱线图:75%的用户发言数不超过7次,但用户平均发言数却高达16.8次——也就是说,有少部分用户非常活跃,极有可能是水军

箱线图顶端那个孤单(傲视群雄)的点,是博越论坛的一名大V。

2016年,这名大V在博越论坛发帖60次(其中精华帖55篇),回复16,663次,一共写了31万字(注:《红楼梦》全文73万字)。大多数帖子都在讲述他的自驾游经历,图文并茂,展示了大量博越的美照。看起来很像一个热爱生活、喜欢旅行、对博越用情至深的车主。

我们不妨再深入的做一些调查。

2016年10月26号这一天。这名大V早上8点就醒了,赖床的时候登入博越论坛,回复了一些昨天遗留的帖子便起床吃早餐了。早上9点进入工作模式,上午的效率比较高,10点~11点一个小时之内就发出了150多条主贴+回复(平均每分钟2.5个)。中午12点吃饭,短暂休息之后,13点~17点继续活跃在博越论坛。下午18点吃饭之后仍活跃在博越论坛,直到晚上22点。

2016年10月26号,星期三,是工作日。所以在论坛宣传博越,很可能就是这名网友的工作。

日复一日,这名网友对博越的爱会消失殆尽吗?答案是:会!

下图一展示了2016年1月~2017年3月,这名网友在博越论坛的每月发言数。从图中可以看出,大V每月发言数的波动特别大,在活跃的4个月份,平均每月要发言4000次以上;而在其他的月份,却一句话也不说,2017年以后,这名大V已经彻底不上博越论坛了。

比起写精华帖的大V们,“汽车专家”对论坛车友的影响可能更大。因为人们买东西(如:汽车、电脑、手机)的时候,往往会有2~3件既相似又各具特色的同价位商品可供选择。你最终选择了A商品,可能不是因为A商品多好,而是B\C两件商品在某些方面特别差。“汽车专家”熟悉博越竞品车型的种种缺点,往往在用户做最终决策时,给与致命一击。

网友小蒙(化名)就是一位这样的“汽车专家”。2016年,小蒙的足迹遍布25个汽车论坛,也就是说,他至少对25款车感兴趣。下图展示了小蒙最感兴趣的10款车,数字代表发言次数。

下面来看看他说了些什么。

小蒙2016年在博越论坛发言4000多次,我把他在博越论坛的全部言论,切词之后统计词频,用文字云的形式展示给大家。从图中可以明显看出网友小蒙的两大特点:

第一:竞品挂嘴边。除了博越,他还经常把哈弗H6、传祺GS4、长安CS75等竞品车型作对比

第二:博学。基本上把汽车的方方面面说了个遍:动力、舒适性、性能、配置、内饰、底盘等等。

艺高人胆大,网友小蒙曾预言博越上市后短期订单超过8W,并强调自己“很少失误”。但是,我有一位同事,花大量精力用HoltWinters和ARIMA两种时间序列模型算法做了一个汽车销量预测模型,也只能应用于销售期超过24个月的车型。博越是一辆新车,真不知道他是如何预测出8W这个数字的。

不过行行出状元,此人语言能力出色,巧舌如簧、能言善辩。我逛论坛的时候不禁感慨:汽车论坛里面小白用户众多,受到此人影响的人还真不少!


基于用户行为的人群识别

通过对典型水军的分析,梳理出水军的三大特征:

  1. 表达欲望强。水军想要输出信息,必须多发帖、发长贴。这里用年发言总字数来衡量。
  2. 或聒噪不止,或一言不发。水军接到任务后,会疯狂发帖;平常时期却一言不发。用月发言数标准差来衡量。(75%的用户,月发言数标准差小于1.38,而部分水军的标准差却高达几百上千)
  3. 走南闯北,在多个论坛谈笑风生。水军往往会在多个论坛发言,美化自己、丑化他人。用年(发言)论坛数来衡量。

如果根据三个特征建立坐标系,以博越论坛的23万用户的数据生成散点图,能否清晰找出“正常用户”和“水军”呢?

结果并不算很理想,X轴和Y轴都没有问题,但为什么Z轴(年发言论坛数)这么奇怪,会有人在700多个论坛发言?

擒贼先擒王。2016年,小明(化名)的网友在汽车之家781个论坛发过言。仔细查看之后,发现他翻来覆去就只说几句话,比如“欣赏佳作”四个字,一年就刷11469条。所以,这种用户很可能是“机器人”。

所以我们进一步把博越论坛的用户分为三类:普通用户、机器人、水军。先对数据进行标准化,然后使用k-means聚类算法,得到结果如下图:

230,531名用户分为以下三类:

  1. 黑色:正常用户224330名,共发言3286383条。
  2. 蓝色:机器人6080名。共发言152711条。
  3. 红色:水军121名。共发言437054条。

121名“水军”,居然贡献了11.28%的论坛发言量,大V和“汽车专家”们的影响力可见一斑!

说来也巧,今天刷微博的时候,正好看到了吉利官方发布的这样一条微博:

看来吉利汽车的营销推广工作确实做的不错。当然这次只是针对吉利博越做的研究,是行业普遍现象还是个例,有待进一步研究。

得用户者得天下,如何抢占用户心智,在用户心智中创建认知,从而带来销量的提升。其他汽车品牌商们,你们学到了吗?

---------------------------------------------------------------------------------------------------------------------------

声明:本文意在从数据角度来找寻判别水军之道,这本身也是一个比较大的课题,本文仅做了有限的工作,后续会不断去完善模型。所有用户id均做了匿名化处理,如有冒犯之处,敬请谅解。

文:@何求知

可视化支持:wentu.io

更多文章关注:数据冰山-知乎专栏

文章被以下专栏收录