简介:本文简明扼要地介绍了申请评分模型中拒绝推断(RI)的基本概念、重要性、方法及实际应用,帮助读者理解这一复杂技术,并提供可操作的建议。
在信贷风控领域,申请评分模型(A卡)是评估借款人信用风险的关键工具。然而,传统模型往往仅基于接受贷款申请的样本构建,忽略了大量被拒绝的申请,这可能导致模型存在选择偏差。为了克服这一缺陷,拒绝推断(Reject Inference, RI)技术应运而生,成为提升模型准确性和稳定性的重要手段。
拒绝推断是一种针对非随机性缺失(MNAR)数据的处理技术,旨在推断被拒绝申请样本的潜在表现(如违约概率),从而将这些样本纳入评分模型,提高模型的全面性和准确性。
拒绝推断技术主要分为两大类:分配法和增强法。下面将详细介绍几种常用的方法。
1. 比例分配法(Proportional Allocation)
比例分配法是最简单的拒绝推断方法之一。该方法假设拒绝样本中的“坏”比率(如违约率)是接受样本的几倍(通常为2-5倍)。然后,根据这一比例随机将拒绝样本划分为“好”和“坏”两类,并纳入模型训练。
优点:操作简单,易于实现。
缺点:假设过于简化,可能无法准确反映拒绝样本的真实表现。
1. 简单扩展法(Simple Augmentation, Hard-cutoff)
简单扩展法首先使用接受样本训练一个基础模型(base_model),然后对拒绝样本进行评分。根据预设的截止值(cutoff value),将拒绝样本分为“好”和“坏”两类,并重新纳入模型训练。
优点:基于模型评分进行划分,相对客观。
缺点:截止值的设定依赖于经验,可能不够准确。
2. 模糊扩展法(Fuzzy Augmentation)
模糊扩展法在简单扩展法的基础上进行了改进。它不是简单地将拒绝样本划分为两类,而是为每个样本生成一个“好”和“坏”的复制,并赋予相应的权重。这些复制样本重新纳入模型训练,权重作为样本的重要性指标。
优点:考虑了拒绝样本的不确定性,更加灵活。
缺点:计算复杂度较高,需要更多的计算资源。
3. 分段扩展法(Parcelling)
分段扩展法结合了简单扩展法和比例分配法的思想。首先,将接受样本和拒绝样本的评分划分为多个分数段。然后,在每个分数段内,根据比例分配法将拒绝样本划分为“好”和“坏”两类。最后,将划分好的样本重新纳入模型训练。
优点:结合了局部比例分配和全局模型评分的优点,更加精细。
缺点:分数段的划分依赖于经验,需要谨慎处理。
在实际应用中,金融机构应根据自身业务特点和数据情况选择合适的拒绝推断方法。以下是一些建议:
拒绝推断技术是提升申请评分模型性能的重要手段。通过合理的方法选择和持续的迭代优化,可以构建更加准确、稳定的评分模型,为金融机构的信贷决策提供有力支持。希望本文能够帮助读者深入理解拒绝推断技术,并在实际工作中灵活应用。