信用评分卡：逻辑回归

逻辑回归入门 - 你快乐吗？

几年前，我和妻子在英格兰和苏格兰度过了几个星期的假期。就在登上英国航空公司的飞机之前，一名空姐告诉我们，我们已升级为商务舱。快乐！度假真是一个美好的开始。一旦我们登上飞机，我们又获得了另一个诱人的提议，可以进一步升级到头等舱。然而，这一次，有一个问题 - 只有一个座位可用。当然，这是一种耻辱，我们无法接受这个提议。在提供头等舱优惠之前，商务舱座位非常棒 - 顺便说一下，所有免费升级。这是行为经济学家描述为相对论和锚定的情况 - 用简单的英语比较。锚定或比较是企业定价策略的根源，也是所有人类悲伤的根源。然而，最终度假心情接管了，我们彻底享受了商务舱。人类在适应最终情况方面非常擅长并享受它。在最困难的情况下，你会发现一些最快乐的面孔。以下是亨利米勒的一句话：“ 我没有钱，没有资源，没有希望。我是最幸福的人 “。人类的行为充满了异常 - 充满了谜题。以下是加强本论文的一个例子。

Lennon, McCartney, Harrison, 和 Best 是这个星球上最着名的乐队 - 甲壳虫乐队的成员。好的，我知道你发现了这个错误。到现在为止，你必须说出正确的名字：John Lennon，Paul McCartney，George Harrison和Ringo Starr，而不是Pete Best。实际上，Ringo Starr是Pete Best的替代品，Pete Best是甲壳虫乐队的原始常规鼓手。皮特一定是被摧毁了，看到他的伙伴们在落后的时候冉冉升起。错了，在Google上搜索他 - 他是所有人中最快乐的披头士乐队。现在这是违反直觉的，我想我们不知道是什么让我们开心。

正如在前一篇文章中所承诺的那样，在本文中，我将尝试使用逻辑回归来探索幸福 - 这种技术广泛用于记分卡开发。

Logistic回归 - 一个实验

我是一位彻底的经验主义者 - 支持基于事实的管理。因此，让我设计一个快速而肮脏的实验来生成数据来评估幸福感。我们的想法是确定影响我们整体幸福感的因素/变量。让我列出一个生活在城市中的工作成年人的代表性因素列表：

yUBjquy.jpg!web

现在，在上面的列表中加入一些其他因素，例如 - 善意的随机行为或对朋友的无计划访问。如您所见，上面的列表可以很容易地扩展（回想一下关于变量选择的文章 -文章3）。这是一个代表性的清单，您必须创建自己的清单，以找出影响您的幸福水平的因素。

实验的第二部分是 收集数据 。这就像维护日记只有这一个将在Microsoft Excel中。每天晚上睡觉之前，你可以评估你的一天，并填写电子表格中的数字以及当天的整体幸福水平（如下图所示）。

Bbm2Mr6.jpg!web

经过几年的数据收集，您将有足够的观察来创建模型 - 在这种情况下的逻辑回归模型。我们试图在上面的数据集中用其他列（C到I）模拟幸福感（B列）。如果我们在Y轴上绘制B并且在X轴上绘制C到I的加法组合（我们将其称为Z），它将看起来像下面所示的图。

I7FJZrZ.jpg!web

逻辑回归背后的想法是以这样的方式优化Z，使得我们在快乐和悲伤面孔之间得到最佳区分，如上图所示。这是一个曲线拟合问题，其中sigmoid函数（紫色曲线）作为函数的选择。

我建议在我们的模型中使用观察日期（A栏）;这可能会给季节带来有趣的影响。

银行和金融业的应用

这正是我们在分析记分卡（例如信用评分卡，行为评分卡，欺诈评分卡或购买倾向模型）的情况下所做的事情。用来替换快乐和悲伤的面孔

好的和坏的借款人
欺诈和真实案件
买家和非买家

对于相应的情况，你有模型。如果您记得上一篇文章4，我已经展示了一个简单的信用记分卡模型：信用评分=年龄+贷款与价值比率（LTV）+分期付款（EMI）与收入比率（IIR）

Sigmoid函数的直接转换将帮助我们得到线的上述等式。这是到达所需评分卡的最后一个链接。

信用评分卡中的变量转换

我喜欢电影Kill-Bill这两部分。在第一部分中，当Uma Thurman的角色去日本从传说中的剑士HattoriHanzō手中拿剑时，我很享受。在了解了她的动机之后，他同意为她做出最好的剑。然后电影导演昆汀·塔伦蒂诺（Quentin Tarantino）简要介绍了制作剑的过程。 HattoriHanzō将一块普通的铁片变成了神话般的剑 - 这真是一个工匠。这与分析师如何将S形函数转换为线性方程非常相似。不同之处在于，分析师使用数学工具而不是锤子，并不像HattoriHanzō那样具有传奇色彩。

拒绝推理

拒绝推断是信用或应用记分卡的一个显着方面，它与所有其他分类模型不同。对于应用记分卡，由于拒绝贷款缺乏绩效，开发样本存在偏差。拒绝推断是一种纠正这一缺点并消除样本偏差的方法。我们将在后面有关您的CANalytics的文章中详细讨论拒绝推断。

总结

现在我们已准备好评分卡，下一个任务是验证评分卡的预测能力。这正是我们将在下一篇文章中做的。再见。

参考资料

Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring – Naeem Siddiqi
Credit Scoring for Risk Managers: The Handbook for Lenders – Elizabeth Mays and Niall Lynas

作者：Roopam Upadhyay

原文链接：

http://ucanalytics.com/blogs/credit-scorecards-logistic-regression-part-5/

数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。平台的理念：人人投稿，知识共享；人人分析，洞见驱动；智慧聚合，普惠人人。您在数据人网平台，可以1）学习数据知识；2）创建数据博客；3）认识数据朋友；4）寻找数据工作；5）找到其它与数据相关的干货。我们努力坚持做原创，聚合和分享优质的省时的数据知识！我们都是数据人，数据是有价值的，坚定不移地实现从数据到商业价值的转换！

逻辑回归入门 - 你快乐吗？

Logistic回归 - 一个实验

银行和金融业的应用

信用评分卡中的变量转换

拒绝推理

总结

参考资料

原文链接：

Recommend

Go语言的那些坑 - RyuGou的博客

程序猿和程序媛的网恋（三） - 56899◎か

spring cloud 入门系列：总结 - JAVA开发老菜鸟

「堡垒之夜」国服 7月24日限量测试；免费领赛季勋章 - 7月24日限量测试开启，免费领...

宝宝：“我的内心已经是一团死灰了……”

找不到父母，7岁萌娃超强逻辑报警

虽然亚马逊业务越来越多但颠覆各个行业言过其实

UIViewController的瘦身计划（iOS架构思想篇） - 简书

大数据开发平台(Data Platform)在有赞的最佳实践

你真的了解Javascript执行顺序么？

About Joyk