App List深度挖掘(第二弹):从23个维度全面拆解印尼现金贷风险画像上一次我们聊了“借贷类App安装数量”这个单一特征,发现它能有效预测逾期。但说实话,只用一个维度去判断风险,就像只用一把尺子量遍天下——够用,但不精准。这一次,我们做了一次系统性的“大扫除”。我们把App List拆解成了4大类、23个细分特征:App类型:合法贷款、非法贷款、赌博、色情、反催收、银行、数字钱包…足足16种文本形态:纯数字App、纯字母App、含特殊字符、加密包名、带版本号……然后逐一验证每个特征对逾期风险的区分能力。结果发现:有些特征的效果,比我们想象的还要“炸裂”。经过对几十万订单的回溯验证(老客+新客),我们筛选出了区分度最高、梯度最明显的几个特征,供大家参考:这是最直观的特征。我们按用户安装的合法贷款App数量分箱(如0个、1个、2个、3-4个、5-6个、≥7个),结果非常清晰:这个规律在老客和新客身上几乎一致。所以,如果你的用户手机里装了7个以上的合规现金贷App,大概率是在“以贷养贷”,风险极高。2. 非法贷款app总量(如未经OJK注册的高利贷/蝌蚪贷等)非法贷款App在我们数据库里占比不高,但只要装了1个及以上,逾期率就是大盘的3~4倍。为什么?因为这类App通常利率极高、催收手段恶劣,用户一旦借了,就会陷入“借新还旧”的死循环,最终无力偿还。这是一个“一票否决”级的强规则。印尼虽然明令禁止在线赌博,但相关App依然不少。我们发现:赌徒的资金链断裂风险远高于普通人,这个特征建议直接用于拒绝或降额。这类App通常教用户“如何赖账”“如何屏蔽催收电话”。数据显示,只要装了1个此类App,逾期率就是大盘的2倍以上。这是一个非常直接的“坏账前兆”信号。5. 银行app & 数字钱包app(意外发现)你可能觉得:装了银行App或DANA、OVO这类数字钱包的用户,应该是比较优质的吧?不一定。装了银行App:初期表现确实略优于大盘,但一旦安装数量超过5个(比如同时开了多家银行账户),逾期率反而上升——可能意味着用户四处开户、申请信用卡,负债高企。装了数字钱包:整体风险和大盘持平,没有显著区分度。这个特征暂时不作为核心规则。6. 视频会议app(Zoom、Google Meet等)这个特征很有意思。我们原本以为和工作相关,但分析发现,装了多个视频会议App的用户,逾期率略低于大盘。可能是正常上班族、收入相对稳定。这是一个反向指标,可以考虑给这类用户提额。很多反欺诈同行忽略了这个维度。我们提取了App包名的文本特征,发现异常的命名方式往往预示着风险。1. 纯数字app总量(包名全为数字,如“123456789”)这类App极有可能是马甲包(同一开发者批量生成、用于导流或欺诈)。分析显示:正常App的包名通常是“com.company.name”这种结构,纯字母但符合域名的还算正常。但如果是随机字母组合(如“abcdefg”),则嫌疑很大。数据表明,纯字母App超过一定阈值后,逾期率显著提升。3. 含特殊字符app总量(如“com.cash@loan#”)特殊字符(@、#、$、_ 等)在正规包名中很少见。我们统计发现:安装≥3个含特殊字符的App,逾期率是大盘的2.8倍。原因:这些往往是黑客工具、破解软件或灰色产业App。4. 纯特殊字符app总量(如“!@#$”)这种极少见,但只要出现,基本可以判定为恶意软件。由于样本量小,我们暂未纳入正式规则,但作为人工审核的强提醒。5. 加密app总量(包名看起来像hash值)同样,这类App通常是设备篡改工具或虚拟环境。数据有限,但风险信号明显。四、统计分布维度:装得越多不一定越安全1. app总量(用户安装的所有App数量)你是不是觉得:App装得越多,说明用户越正常?不一定。我们按总安装数量分箱:数量越多,超过一定数量逾期率就会达到大盘的1.5-2倍为什么?因为正常用户不会装几百个App。只有设备农场、刷量工作室、或者手机被多人共用才会出现这种情况。建议对App总量超过150的用户加强人工审核。这个指标我们原本寄予厚望,但实际效果一般。非系统App占比的高低和逾期率没有稳定的单调关系——可能是印尼用户的手机本来就预装很多系统App。暂时不作为核心规则。这是我们本次挖掘的亮点。我们发现,很多用户在授信(申请额度)和提现(实际借钱)两个时间点,手机里的App列表会发生明显变化。典型行为:
为什么? 用户可能认为:授信通过后,平台不会再查。或者他故意卸载了高风险App,企图“洗白”自己。
我们对比了授信时刻和提现时刻的:
借贷类App数量变化
赌博类App数量变化
纯数字/特殊字符App数量变化
发现:如果提现时App总数比授信时减少超过20%,且减少的主要是高危类型,那么该用户的逾期率是大盘的2~3倍。
这个特征非常适合做提现时的二次风控——即使授信通过了,提现前再扫一次,一旦发现异常,直接拦截。
六、我们是怎么做分析的?
分箱:对特征值(如合法贷款App数量)按照预设的边界(如 [0,1,2,4,7,10000])切分成多个区间。
计算每个区间的逾期率:分别统计1M10、1M30、2M30的订单逾期率和金额逾期率。
计算提升度(Lift):区间逾期率 ÷ 整体大盘逾期率。Lift>1表示该区间风险更高。
输出结果表:包含有表现量、逾期量、逾期率、Lift等。
我们遍历了23个特征,每个都输出一张类似下表的分析结果(数据已脱敏处理)
梯度越明显、lift越高,说明特征越有效。
七、策略落地建议
基于以上发现,我们已经在风控系统中新增/强化了以下规则(脱敏版):
同时注意:不要单一规则“一刀切”,建议结合用户的历史还款表现、设备指纹等综合判断。比如一个老客还款10次都正常,某次突然装了赌博App,可以先预警观察,而不是直接拒绝。
八、写在最后
App List是一座宝藏,但挖矿需要系统性的方法。这次我们从一个特征扩展到23个维度,找到了更多强有效的风险信号。合法贷款不一定安全,纯数字包名往往是雷,授信提现时的“变脸”更是危险信号。
当然,这些规则需要持续监控和迭代。黑产也在进化,今天有效的特征,明天可能就被绕过。但只要我们保持对数据的敏感和挖掘的深度,就能始终跑在风险前面。
如果你也在做印尼现金贷的风控,欢迎留言交流。我们下期再见!