数据冰山
首发于数据冰山
另眼相看数据

另眼相看数据

背景:从可见光到X光

商业世界观测核心数据的方式总是每隔几年一进化,这些迭代逆时间长河往回看都显得简单粗鄙,然而在当时当刻都又是跳脱时空惯性。以互联网为例:

  • 在开局不久的MySpace时代,无论是创业团队还是投资人,最关注的是注册用户数,现在回想起来如此粗暴,但是在那个靠猫叫联网的时代,考虑让多少用户喝上第一口奶确实是最重要的。
  • 到了Facebook主导的社交时代,扎克伯克创新地使用日活跃用户(DAU)作为其“北极星”指标,整个公司聚焦在用户体验和留存,这部分也诠释了Facebook为何能很快替代MySpace而一骑绝尘。
  • 到了移动互联网时代,随着越来越多的公司喊出Mobile First或者All-in App,北极星指标逐渐转移成App DAU。这个时代中Facebook曾一度死守H5,差点阴沟里翻船,依靠凶猛收购Instagram和What's App两个爆款App才挽回颓势,拉出第二条曲线
  • 随后移动互联网普及,手机和App占领地理的每一个角落和夺取用户的每一分时间,App DAU这个指标又繁衍出单个用户时长和单个DAU变现能力两个子指标

发展到现在,企业界和投资界都开始重度依赖DAU、卸载率以及用户时长来评价各个App及其母公司的发展潜力,于是大家都开始或多或少购买几家数据公司的相关服务。但是无论作为行业运营者还是投资人的视角,这些数据逐渐遇到如下问题:

  • 因为数据源大部分来自于运营商,数据源本身的稳定性和一致性挑战很大,造成误差较大。特别是在最近几年的严峻形势下,不少日活过百万的App,DAU误差在100%以上不是梦
  • 卸载率等指标即使在内部也需要严格定义,才具可比性,比如:第几日留存,新增还是活跃,含不含特殊版本等。更别说第三方数据以及各种狡猾的作弊手段,比如:当年一些平台卖流量给游戏厂商,知道次日留存率是核心指标,就会集中在晚上11点之后导流,这样用户更有可能在12点之后还活跃并被算入第二天活跃,从而拉高留存率
  • DAU等指标的预测性较弱,在因果轮回之间,越来越是结果。同时受到著名的春节红包、人造节日等运营活动影响,对公司竞争力的解释力越来越弱。

简单说,人类从可见光观察世界,已经发展到X光到电磁波,不断繁衍出看世界的“另眼”。商业世界同理,也需要不断升级。


方法:三个一,归一化+一对一

结合以上两者的考虑,常思考如何升级数据观测体系,初步思路如下:

  • 通过归一化尽量保证数据的一致性和可比性,不单单纠结于定义不清的DAU或卸载率
  • 考虑两个App之间的相互竞争优势,作为更前置更有预测性的指标。借鉴了当年做quantitative trading的一些知识,利用pair trading尽量屏蔽外界噪音,只考虑两只股票之间强弱的相互走势,通过long-short策略去交易。

针对 App A/B,考虑两个维度的指标:

  • A对B的竞争优势,通过同时安装A和B的用户最后选择谁来量化,越大于1证明A越强,反之则是B越强,这比较纯粹地考验App A和B的粘性和竞争力,隔离了推广等外部因素
  • A和B的新增能力,通过同一时期的安装来量化,越大于1证明A越强,反之则是B越强,这考验App A和B的获客能力,结合自然增长和市场推广

结合以上两个指标,最终绘制两种不同呈现形式的图表:

  • 左图是根据时间变化的矢量图,如果数据点在右上角则A完虐B,如果在左下角则B完虐A
  • 右图是沿着时间轴展现两个维度的指标


案例:理论实际初步验证

通过这个新的数据体系考虑各种案例,解释能力均较强,现简单列举如下。

案例1,新闻综合,头条 vs. 百度,头条 vs. 腾讯新闻

从今年数据看,竞争优势和新增能力这两个维度,头条都完虐百度,但是从趋势看,百度正在逐步改善,左图也显示:经过一系列曲折的演进,百度在两个维度都获得更有利的位置。

比较特别的是,2月份左右,百度的新增能力陡增,主要是和春节红包活动有关。但是这种优势随着节日过去又逐渐丢失,半衰期很短。

在竞争优势维度,头条对腾讯新闻的领先优势明显且差距越拉越大,但是在新增能力上逐渐被腾讯新闻反超且拉开差距。这和腾讯新闻的拼爹模式以及内部一系列整合释放出协同能力有关。

案例2,购物,拼多多 vs. 淘宝

拼多多在竞争优势上远落后于淘宝,体验方面仍存在较大差距,但却在大幅改善。而在新增能力上,拼多多一直远远领先:一方面是因为其社交推广和微信保驾护航有关;另一方面也因为淘宝的渗透已经足够,所以新增较弱。同时拼多多的新增能力较之淘宝,在10月底和11月初发生断崖式下跌,和微信针对拼多多和趣头条的10/28打击诱导分享的新政有关。

案例3,短视频,快手 vs. 抖音

自带社区性质的快手,比抖音更具竞争优势,不过这个竞争优势在年中经历过一阵下滑,在年底又逐渐恢复。快手在新增能力逊于抖音,但通过春节红包和极速版等一系列猛操作,正在逐渐和抖音追平。


下一步

方法论形成后,下一步的拓展在于:

  • 增加数据的细分维度,从地域到各种画像属性,人群一细分就会有更多更细致的观察和假设验证。比如可以看20-30岁的二线城市男性,使用拼多多和淘宝的情况,观测拼多多上探一二线城市人群的进展。
  • 增加预测性指标。比如对于一个App来说,一般是安装竞品然后卸载该app,最后App DAU降低而最终影响收入。目前的数据展现的是第二步,考虑根据第一步的情况做些预测。

期待将这套体系做成观测App和公司发展的另一只大眼。


感谢WJT和WGH等同学在方法论、技术和方法论上面的诸多帮助。

最后是彩蛋,关于用数据当X光,你怎么看?欢迎在评论区提出问题、挖掘细节、分享不同视角。冰山君会选择优质评论,寄发【数据冰山】贴心周边。


...更多回答请看何明科的主页

...更多文章请到数据冰山 - 知乎专栏

编辑于 2019-12-11

文章被以下专栏收录