深入理解申请评分模型中的拒绝推断（RI）技术

简介：本文简明扼要地介绍了申请评分模型中拒绝推断（RI）的基本概念、重要性、方法及实际应用，帮助读者理解这一复杂技术，并提供可操作的建议。

在信贷风控领域，申请评分模型（A卡）是评估借款人信用风险的关键工具。然而，传统模型往往仅基于接受贷款申请的样本构建，忽略了大量被拒绝的申请，这可能导致模型存在选择偏差。为了克服这一缺陷，拒绝推断（Reject Inference, RI）技术应运而生，成为提升模型准确性和稳定性的重要手段。

拒绝推断是一种针对非随机性缺失（MNAR）数据的处理技术，旨在推断被拒绝申请样本的潜在表现（如违约概率），从而将这些样本纳入评分模型，提高模型的全面性和准确性。

拒绝推断技术主要分为两大类：分配法和增强法。下面将详细介绍几种常用的方法。

1. 比例分配法（Proportional Allocation）

比例分配法是最简单的拒绝推断方法之一。该方法假设拒绝样本中的“坏”比率（如违约率）是接受样本的几倍（通常为2-5倍）。然后，根据这一比例随机将拒绝样本划分为“好”和“坏”两类，并纳入模型训练。

优点：操作简单，易于实现。

缺点：假设过于简化，可能无法准确反映拒绝样本的真实表现。

1. 简单扩展法（Simple Augmentation, Hard-cutoff）

简单扩展法首先使用接受样本训练一个基础模型（base_model），然后对拒绝样本进行评分。根据预设的截止值（cutoff value），将拒绝样本分为“好”和“坏”两类，并重新纳入模型训练。

优点：基于模型评分进行划分，相对客观。

缺点：截止值的设定依赖于经验，可能不够准确。

2. 模糊扩展法（Fuzzy Augmentation）

模糊扩展法在简单扩展法的基础上进行了改进。它不是简单地将拒绝样本划分为两类，而是为每个样本生成一个“好”和“坏”的复制，并赋予相应的权重。这些复制样本重新纳入模型训练，权重作为样本的重要性指标。

优点：考虑了拒绝样本的不确定性，更加灵活。

缺点：计算复杂度较高，需要更多的计算资源。

3. 分段扩展法（Parcelling）

分段扩展法结合了简单扩展法和比例分配法的思想。首先，将接受样本和拒绝样本的评分划分为多个分数段。然后，在每个分数段内，根据比例分配法将拒绝样本划分为“好”和“坏”两类。最后，将划分好的样本重新纳入模型训练。

优点：结合了局部比例分配和全局模型评分的优点，更加精细。

缺点：分数段的划分依赖于经验，需要谨慎处理。

在实际应用中，金融机构应根据自身业务特点和数据情况选择合适的拒绝推断方法。以下是一些建议：

拒绝推断技术是提升申请评分模型性能的重要手段。通过合理的方法选择和持续的迭代优化，可以构建更加准确、稳定的评分模型，为金融机构的信贷决策提供有力支持。希望本文能够帮助读者深入理解拒绝推断技术，并在实际工作中灵活应用。