浅谈风控策略规则开发与挖掘

乌蒙山仔

校招入中建国企，后转行干过业务，目前深耕互联网数据分析领域。

浅谈风控策略规则开发与挖掘

关键词：风控策略、规则制定、规则挖掘、规则开发、反欺诈

一、风控规则制定原则

风控系统里的规则一般有哪些？

风控系统，本质上是一堆规则（rules）的集合。那这些规则，一般包括哪些呢？

首先说下，风控规则的制定原则：

1）监管层面原则：国家监管规定的事不能干，国家监管规定的客群不能放；

2）公司层面制定的原则：boss说不能放的客群也不能放；

3）风控层面原则：业务经验、专家经验、数据分析制定、boss拍脑袋原则

二、风控规则分类

那具体些，风控的规则，一般包括哪些，如下：

三、这些规则怎么来的？

通过以上的总结，我们知道了规则怎么来的。像监管政策规则类，以及公司boss要求类规则，我们直接制定并上线就好。作为一个策略分析，或者数据人员来说，我们可有所作为的规则一般有2大类，1类是我们业务经验足够丰富时，可凭经验制定一些风控规则；2类是我们除了凭借经验设置规则外，我们也可以靠通过数据分析的结果设置规则。通过数据分析后设置规则，这是一个策略人员，或者数据分析人员，日常工作的一大模块，一大重点。接下来，我们看看，通过数据分析开发规则时，需要考虑的重点，关注的核心指标有哪些。

四、风控规则挖掘：平时制定这些规则时需要考虑什么？

1）准确率（P值）。首先我们可以定义target，如按fpd30、spd30、tpd30、fstpd30来定义好坏客户，最后看badrate、m1+%、m3+%等指标的区分度。

2）召回率（R值）。因为我们制定一条规则，肯定有命中，有误杀，我们在保证第一点的准确率在规定阈值的前提下，想办法提高规则的对坏客户的召回率。比如，我们的样本是10000，好客户样本8500，灰色客户样本1000，坏客户样本500，我们规则在保证准确率的同时，尽量提高召回率R值，意思就是，虽然准确率很高（50%），但是如果召回率很低，比如我们500各坏样本，才召回5个，召回率1%，这条规则也不是一条好的规则。

3）稳定性（PSI）。一个思路是计算psi。另一个简单常用的思路是：我们可以利用历史已有数据，假设该条规则已部署在系统，分析历史每个月的拒绝情况、拒绝率，可以大概评估一下规则的稳定性。

一个简单的例子：

如上图，我们可以基于决策树的结果去设置2条规则：

规则1）：满足var_a＞39笔的客群，badrate高达57.4%，则拒绝；

规则2）：满足var_b≤506.5分且 var_c＞0.5的客群，badrate高达42.5%，则拒绝。

例子解析：

该例子中，badrate即是我们的规则的准确率（P值）；

那召回率（R值）如何体现呢，我们可以在训练决策树时，通过设定制定参数max_depth 、min_samples_split 、min_samples_leaf来达到提高召回率的目的，本例中参数的设置为（max_depth = 3,min_samples_split = 1000,min_samples_leaf = 100）。

稳定性，可以看以下2个指标，一个是bad_pct，一个是m3+_pct，预估这规则a上线后还算稳定。