银行个人信用评估方法研究y,即“a1∧...∧am=>1∧...∧bm”。
(3)预测
把握分析对象发展的规律,对未来的趋势作出预见,其表示形式与分类同。
三、一种基于历史记录规则相似性的综合评估方法
由于国内银行业现有客户记录多数是不完整的,所以使用单一的方法进行评估未必能体现客户真实的信用历史状况。为了将数据挖掘技术和数理统计完全基于记录本身特征并与能够体现专家判断的评分很好地结合起来,本文提出一种基于关联规则的相似推荐方法,实现如下:
1.应用粗糙集理论对历史数据记录进行属性约简及规则提取
粗糙集理论是数据表简化和生成最小决策算法的有效方法,可以实现知识约简,发现属性表中的属性依赖,从而在信息不完全环境下进行知识发现,其定义如下:
s=
其中,s:信息系统(决策表)
u:论域
a:属性集合
f:uxa→v的映射
v:属性值域集合
采用决策偏好信息的挖掘方法(参见文献[3]),对s进行属性约简并提取规则,形成不同支持度s和信任度c决策规则集合dn{ф→ψ}(其中n代表提取的规则数量,可根据实际情况确定),且d是s不重复的子集,ф是条件属性,ψ是决策属性,ф、ψ∈a。
2.对测试记录与步骤1提取的规则进行相似性计算
相似性是某种关系强度的度量,可以通过数值比较来衡量(参见文献[4])。因为决策规则集合d不能完全覆盖所有测试记录属性值组合,而且决策表对象结构相同。测试集合sd中的任一组合(规则)dd对照d中dn进行相似性计算,得出sim1、sim2...sim
其中,b:归一化因子
(b=1/∑wi)
wi:属性i贡献因子
(体现数据特性或专家经验,也可通过多种赋权综合评价求得)
sd(dd,dn):已知dd发生,dn也在同一组发生的概率
3.多赋权综合评价
对上述步骤求得参照各个规则的支持度s、信任度c及相似性sim组成一个n个对象、xxxx指标的矩阵xn×3。
(1)运用变异系数法对x进行客观赋权
此时,第j个指标的权重就是这种加权方法是为了突出各指标的相对变化幅度,即变异程度。
(2)对x使用线性插值法进行规范化处理,得到规范化矩形zn×3,对其使用互补判断矩阵排序法求属性权重:
i=1运用综合赋权法将(1)、(2)两个权向量进行有机集成,得到综合权向量w=(w1,w2,......,wn)。传统的综合赋权有乘法合成归一化、线性加权组合法、基于earman等级相关系数综合赋权法等,也可采用基于灰色关联度的客观权重综合集成法。
最终求出测试记录对各个规则的评价值fi=∑wj×zij,(i=1,2,......,n),其中max(fi)就是与测试记录最相似的规则,可将其决策偏好作为测试记录的预期偏好。
四、结束语
基于历史记录规则相似性的综合评估方法以客观存在的记录规则为依据,更好地保留数据特征并结合专家经验,评估结果更加客观准确。