--当机器学习遇见决策模型:贷款资格预审决策模型升级
在传统的IT体系里,组织内部使用诸如Excel、Tableau、PowerBI、帆软等商业智能BI或各种报表工具,分析历史数据为决策提供支持,它们不提供最终的决策方案,需要人根据专业知识和经验做出最终的决策,这就对人的洞察、判断以及专业知识能力也提出了很高的要求,虽然这些商业智能BI现在已经十分成熟、强大了,能呈现丰富且多维度的数据,支撑人做出决策的方方面面。但是在这一过程中数据分析与决策是分离的,它不能实现决策自动化和智能化,另外决策效率最大程度受人的因素影响,存在同样事项决策前后可能不一致、决策时效性滞后等问题,因为BI主要侧重于描述性分析和报告发生了什么?关注历史数据,如同汽车后视镜,告诉你已经走过的路。但是决策除了需要这些信息,最重要的诉求是能预测未来,并为决策提供可行的依据,甚至自动化的行动方案,这就是我们所说的决策智能DI,它整合诊断、预测和规范性分析为什么发生?将发生什么?该怎么做?然后自动化行动。就如同GPS导航+智驾系统,为你规划并执行通往目的地的最佳路线。决策智能DI由机器学习ML和数字化决策DMN组成,关于机器学习请阅读我们的博客《什么是机器学习算法?类型与示例》以及其他相关文章,机器学习ML是人工智能 (AI) 的一个子集,提供了一系列成熟算法,专注于创建从数据中学习并进行预测或决策的算法,而无需为每个任务进行详细编程。它们好比“菜谱的制作方法”,而你的数据集就是“做菜的原材料”,通过专门的算法库如:Scikit-Learn或专业工具如:KNIME就可以将你的数据集训练成标准的预测模型PMML文件,用来预测未来的结果,它可以被导入到Together规则引擎中被决策模型调用并无缝执行最终实现决策智能DI。我们现在在《贷款资格预审决策模型》(请阅读我们网站上的相关方案)的基础上,将预测模型引入,一起看看实现的过程和最终效果。我们知道银行等金融机构对申请人的贷款资格进行审核,除了“收支比判断”、“还贷比判断”、“信用评分评级”等固定因素来判断贷款人是否符合贷款条件,基于这些已知条件建模的决策模型虽然能判断申请人的还款能力,但是还是有很多未知因素会影响他们的还款能力,比如未来的收入情况,那怎么最大程度的避免这种违约风险发生呢?我们就可以引入机器学习模型预测贷款人未来的收入情况,从而强化审核模型能力,进一步降低违约风险发生的概率,使决策模型更加智能化。
我们选用KNIME分析平台,它可以连接你的各种数据源,对数据集进行清洗,拆分、合并,使用机器学习算法对数据集进训练,并生成标准的PMML预测模型文件。它是完全可视化的,无需编写代码,对业务管理人员十分友好。
在KNIME里我们建立了一个标准的工作流来实现对预测模型的训练,它分为“数据读取”、“数据划分”、“训练模型”、“应用模型”、“为模型评分”、“描述性统计”、“预测模型文件生成”、“可视化”等几个步骤。
数据集采用人口普查的公开数据,有32561条人员信息数据,其中有15个字段,这也是我们训练预测模型的重要参数。它们包括:年龄、工作类别、家庭年收入、教育程度、教育程度编号、婚姻状况、职业、关系、种族、性别、资本收益、资本损失、每周工作小时数、国籍、收入,其中收入是我们要预测的目标。
我们在“数据划分”步骤里随机抽取数据集中的80%的数据用于训练,20%用于测试,以保证预测模型的准确性,同时避免过拟合现象的发生。

在“训练模型”步骤里我们采用“决策树”的机器学习算法对数据集进行训练。然后通过“预测模型文件生成”步骤生成标准的PMML文件。
我们在“应用模型”步骤可以用已经生成预测模型对另外20%的数据集进行测试,对比人员收入对实际值和预测值以观察模型的准确性。

在“为模型评分”步骤可看到预测准确性结果,其中有83.725%准确性,还是非常高的。

至此我们已经通过KNIME完成了人员收入预测模型的训练,模型名称为income.pmml。下面我们将它引入到Together规则引擎决策模型中并调用它们。
在原来的贷款资格预审决策模型中将income.pmml预测模型导入。
在贷款资格预审决策模型中增加一个自定义函数“预测收入分组”。

编辑“预测收入分组”自定义函数,选择函数类型PMML,选择文件名称,模型算法类型,并按照数据集设置参数。
再增加一个收入预测的决策块选择调用的盒装表达式以调用刚才定义好的预测函数。
“收入预测”决策块的盒装表达式结构如下,通过“预测收入分组”函数的14个参数来调用其预测模型算法。

同时我们也按照这些参数维度改造一下原有决策模型的数据结构。

然后在最终“贷款资格预审”决策块的决策表中增加“收入预测”的条件列

至此我们完成了整个贷款资格预审的决策模型的改造,打开Together建模器的测试表单,输入测试数据并运行,模型执行并无缝输出了预测模型的机器学习算法值,模型命中了值即收入预测条件,输出了正确的结果,完全符合要求。
整个建模过程中是在全程可视化的环境中配置实现的,无需写一行代码,之所以能实现这样的效果是因为,Together规则引擎已经整合了机器学习ML运行时,因此可以将预测模型无缝的与决策模型建模成一体并同步运行,关于这方面的详细信息请阅读我们网站上的《AI解决方案》和其他产品介绍信息,Together规则引擎也支持将模型发布成独立的jar包,其中包含规则运行时和机器学习运行时,不依赖引擎本身。
通过本示例,我们展示了Together规则引擎如何实现决策的智能化、自动化的过程。Together是真正的决策智能DI引擎,它解决了传统BI工具只能分析历史数据,无法真正参与到组织内部决策链中的问题,同时解决了决策的时效性和业务逻辑一致性问题,因此具有划时代的意义。赶快联系我们,体验Together规则引擎强大功能吧,它将带你走进决策智能时代!