金融研究,数据挖掘与星球大战

金融研究,数据挖掘与星球大战

许多发表在金融学顶级期刊的研究扬言:市场存在各种各样的异象(anomaly)。利用这些因子配置资产能获得超额收益,回归出来星星管够。不过,张橹等三位学者5月9日贴出的工作论文用1967-2014年的数据,复制了447个此类因子的研究,发现有286个复制不出来。如果使用严格一些的标准,还能在5%水平上显著的就只剩67个了。


流动性(trading friction))因子是重灾区,即使按比较宽松的标准,102个中,能复制出来的也只有7个。无形资产(intangible)部分,103个中只有26个能复制出来。剩下的四类是动量(momentum)、价值成长(value-versus-growth)、投资(investment)、营利性(profitability),分别包含57、68、38、79个数量的因子,能复制出来的分别有37、31、27、33个,复制成功率分别是65%、46%、71%、42%。



此外,即使是那些仍然保持显著的因子,在复制研究中能达到的超额收益水平也明显降低。引入q因子模型之后,还能保持5%水平以上显著的就只剩下46个了。t值能够保持大于3的因子只剩下11个。说实话,搞到这个程度,个人感觉Novy-Marx(2014)找出来的那几个变量说不定更有助于资产管理:抬头看看行星的轨迹,再闻一闻曼哈顿街区的空气。太阳上的黑子牵动你我的命运,总统的党派,才是金融市场最大的歧异。



导致这种问题的原因是什么?第一个可能的因素就是为了星星而挖掘数据(p-hacking、cherry-picking、kitchen sink,等等)。顶级期刊不接受不显著的结果,所以遇到星星不够多的回归,就直接扔掉;或者跑很多很多组回归,然后挑一组最完美无瑕的。第二个因素是金融学期刊一般不发表复制研究,学者没有激励去监督。第三个因素是用的数据太单调,全是美国数据。如果一个东西真是规律,那就应该用各国数据都跑一下。



这一问题可能不止于市场异象这一块。原文三位作者提到的这几个问题,在经济学和金融学中都存在。在这些默默领域耕耘的研究生和本科生,可能有许多都经历过文章结果复制不出来的困惑。不过,尽管这些努力可能并不讨好,还是有学者一直在尝试复制或检验。三位作者列举了近二十年来这方面的许多努力。总之,纯粹的数据挖掘,已经不是经济学了,解释应该要有理论支撑。另外一个启示就是:市场看起来还是蛮有效的。



参考文献:Novy-Marx R. Predicting anomaly performance with politics, the weather, global warming, sunspots, and the stars[J]. Journal of Financial Economics, 2014, 112(2): 137-146.



Hou, Kewei, Xue, Chen, Zhang, Lu. Replicating anomalies[J]. 下载地址摸这里

「真诚赞赏,手留余香」
2 人赞赏
潘登
王森
文章被以下专栏收录
22 条评论
评论已关闭
推荐阅读
track image