首发于乌蒙山仔
浅谈风控策略规则开发与挖掘

浅谈风控策略规则开发与挖掘

浅谈风控策略规则开发与挖掘

关键词:风控策略、规则制定、规则挖掘、规则开发、反欺诈

一、风控规则制定原则

风控系统里的规则一般有哪些?

风控系统,本质上是一堆规则(rules)的集合。那这些规则,一般包括哪些呢?

首先说下,风控规则的制定原则:

1)监管层面原则:国家监管规定的事不能干,国家监管规定的客群不能放;

2)公司层面制定的原则:boss说不能放的客群也不能放;

3)风控层面原则:业务经验、专家经验、数据分析制定、boss拍脑袋原则

二、风控规则分类

那具体些,风控的规则,一般包括哪些,如下:

风控规则分类

三、这些规则怎么来的?

通过以上的总结,我们知道了规则怎么来的。像监管政策规则类,以及公司boss要求类规则,我们直接制定并上线就好。作为一个策略分析,或者数据人员来说,我们可有所作为的规则一般有2大类,1类是我们业务经验足够丰富时,可凭经验制定一些风控规则;2类是我们除了凭借经验设置规则外,我们也可以靠通过数据分析的结果设置规则。通过数据分析后设置规则,这是一个策略人员,或者数据分析人员,日常工作的一大模块,一大重点。接下来,我们看看,通过数据分析开发规则时,需要考虑的重点,关注的核心指标有哪些。

四、风控规则挖掘:平时制定这些规则时需要考虑什么?

1)准确率(P值)。首先我们可以定义target,如按fpd30、spd30、tpd30、fstpd30来定义好坏客户,最后看badrate、m1+%、m3+%等指标的区分度。

2)召回率(R值)。因为我们制定一条规则,肯定有命中,有误杀,我们在保证第一点的准确率在规定阈值的前提下,想办法提高规则的对坏客户的召回率。比如,我们的样本是10000,好客户样本8500,灰色客户样本1000,坏客户样本500,我们规则在保证准确率的同时,尽量提高召回率R值,意思就是,虽然准确率很高(50%),但是如果召回率很低,比如我们500各坏样本,才召回5个,召回率1%,这条规则也不是一条好的规则。

3)稳定性(PSI)。一个思路是计算psi。另一个简单常用的思路是:我们可以利用历史已有数据,假设该条规则已部署在系统,分析历史每个月的拒绝情况、拒绝率,可以大概评估一下规则的稳定性。

一个简单的例子:

决策分类树


决策回归树

如上图,我们可以基于决策树的结果去设置2条规则:

规则1):满足var_a>39笔的客群,badrate高达57.4%,则拒绝;

规则2):满足var_b≤506.5分 且 var_c>0.5的客群,badrate高达42.5%,则拒绝。

例子解析:

该例子中,badrate即是我们的规则的准确率(P值);

那召回率(R值)如何体现呢,我们可以在训练决策树时,通过设定制定参数max_depth 、min_samples_split 、min_samples_leaf来达到提高召回率的目的,本例中参数的设置为(max_depth = 3,min_samples_split = 1000,min_samples_leaf = 100)。

稳定性,可以看以下2个指标,一个是bad_pct,一个是m3+_pct,预估这规则a上线后还算稳定。

规则稳定性评估

五、规则上线后需要监控什么?

1)拒绝量、拒绝率。规则上线后,我们要定期对规则的拒绝量、拒绝率进行监控。规则刚上线时,我们可每日监控规则昨日的触发情况,规则上线一段时间待规则稳定后,我们可以按周、按月来监控规则的触发情况。

六、规则监控发现异常,我们怎么解决?

如果监控发现规则拒绝量、拒绝率出现了异常,我们怎么去定位问题

1)短期内,第1,看是否是我们规则制定的数据分析过程出现问题;第2,看是否是规则的上线部署有问题,如新规则前置了,或者部署人员部署规则时取数取错了等等。

2)长期的话,规则出现失效,拒绝率降低,可能是客群的原因,可再次复盘,重新调整规则看是否要下线,或者调整规则的阈值。拒绝率升高的话,也有可能是客群的原因,比如客群变差了,或者近期有什么大的事件发生影响了申请的客群。

最后,请各位路过大佬批评指正。

编辑于 2019-09-25 22:11