随着表现期的增加,ks为什么会下降?
在一段时间内,共有5万人申请通过样本,并对不同的坏客户进行定义计算ks。
①坏客户被定义为fpd30 ,好客户47000,灰客户2000,坏客户1000。ks=0.35;
②坏客户被定义为mod530 ,好客户44000,灰客户4000,坏客户2000。ks=0.30.
问题1:房产证样本图片
这种现象是个例还是普遍存在?
问题2:房产证样本图片
若普遍存在,则表现期变长ks降低的原因是什么?
结论:房产证样本图片
不一定。
ks本质是样本分布之间的距离。在图1中的信用评分中,我们也会发现一个非常有趣的现象:最大化KS正负样本分布的凹槽位置恰到好处。这是因为KS值是两个累积分布之间的差异,图形解释是面积差异。在黑色边界的左侧,红色面积大于绿色面积,累积面积一直为正。在黑边界右侧,绿色面积大于红色面积,累积面积开始变负。因此,这个位置是止损点。
图1-fpd30 定义的原始好坏分布mob5ever30 的意思是前五期有30 天,所以fpd30 中的坏样本是mob5ever30 样本不好的子集,所以y从fpd30 到mob530 在变化过程中,坏样本增多,好样本减少。我们将讨论这种影响。
情况1:所有300分以下的好样本都变成了坏样本。假设这种情况的前提是模型识别第2、3、4、5期的坏人比绝对好(第1期)1-5未逾期至30 的人排到低分段,导致好坏样本分布变成图2,可见,ks变高。
图2-300分以下的好样本全部变成坏样本2:1000分以上的好样本变成坏样本。这种情况的假设前提是模型识别第2、3、4、5期坏人比绝对好(第1期)1-5没有逾期到30 的人排到高分段,导致好坏样本分布变成图3,可见,ks变低。
图3-因此,主要取决于1000分以上的好样本中的坏样本fpd30 定义的已有好样本中,标签为mob530 坏和好的分布是什么?这是用来制作模型的x,用于模型y所能决定。
毕业证样本网创作《随着表现期的增加,ks为什么?》发布不易,请尊重! 转转请注明出处:https://www.czyyhgd.com/189194.html