收藏本站
《重庆大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于软概率的分类器动态集成方法研究

冯晓东  
【摘要】:集成学习通过训练多个学习器来解决同一个问题,其泛化能力和稳定性往往要优于单一的学习器,因此受到广泛的关注。分类器集成方法,集成学习的主要研究方向,被广泛应用于解决经济管理、工程管理、医学诊断等领域的分类问题,如个人信用评估、企业财务危机预警、系统故障检测、医学诊断等。一个有效的分类器集成方法,能够帮助金融机构预测客户的违约率,降低财务风险;能够帮助工程管理人员尽早发现故障,及时制定维修计划;能够帮助医护人员进行智能判断,尽快制定治疗方案。随着经济的发展、自然环境的变化和科学技术的进步,人们对分类器集成方法的泛化能力和稳定性要求越来越高。本文在全面介绍分类器集成选择方法、分类器动态集成选择、分类器动态加权集成方法研究现状的基础上,分析已有研究存在的局限性,结合D-S证据理论、模糊软集合、马尔科夫链、软概率等理论,提出相应的解决方案,有效提高分类器集成方法的分类性能。主要研究内容包括三个方面:第一,基于模糊软集合和D-S证据理论的分类器集成选择方法研究。随着大数据时代的到来,用于训练基分类器的样本量越来越大,学习算法的计算和存储开销越来越大,为分类器集成方法的构建带来沉重的计算负担。为了解决该问题,分类器集成选择方法提供了一个新视角。构建这类方法的关键是选择标准和选择或搜索方法的确定,而以往的研究往往基于分类器的多样性或分类精确度构建选择标准,很少有学者同时考虑这两个因素。而且仅仅采用一种方法来度量分类器之间的差异性,很难捕获基分类器的多样性;同时仅仅采用精确度也很难衡量一个分类器的整体分类性能。因此,本文同时考虑多种多样性和分类性能度量指标,结合模糊软集合和D-S证据理论,从多准则决策的角度构建选择标准。最后,基于16个二分类数据集,与6个对比模型的分类结果进行对比分析,验证了该方法的有效性和优越性。第二,基于马尔科夫链的分类器动态加权集成方法研究。分类器融合方法的选择与构建,也是该领域的研究重点之一,而已有的融合方法可以分为两类:固定集成器和可训练的集成器。然而,这些融合方法都是静态的,它们在对待测样本进行集成分类时采用相同的融合规则,这将极大地降低分类器集成方法的泛化能力,无法适应环境的动态变化和时代的发展。虽然有一些分类器动态集成选择方法被提出,但其采用的融合方法仍然没有考虑分类器分类性能的变化规律。为了解决该问题,本文将分类器基于序列样本的分类性能变化看作是一个随机过程,并采用马尔科夫链进行建模,提出基于马尔科夫链的分类器动态加权集成方法。基于17个数据集,通过和12个对比模型的分类结果进行比较,验证了该方法解决二分类问题的有效性和优越性,同时验证了该方法在信用评估领域能够有效地降低错误分类成本,从而降低了金融机构的风险。第三,基于软概率的分类器动态集成方法研究。已有的分类器动态集成选择方法,往往基于分类器在验证集中的分类性能对其选择,而忽略了分类器在测试集中的分类行为。而且,针对分类器的选择和融合两个步骤需要分别选择不同的方法完成,而没有一个完整的方法或理论同时完成该两个步骤。软概率独特的运算过程能够同时包含以上两个步骤,同时分类器对待测样本的分类行为能够影响到分类器的选择与融合。因此,本文提出了基本的基于软概率的分类器动态集成方法,并基于10个信用数据集,具体介绍了该方法的应用步骤,并验证了该方法能够有效地降低信用风险。同时,结合第三章和第四章的研究内容,提出最终的基于软概率的分类器动态集成方法,并基于17个数据集,通过和14个对比模型的分类结果进行比较,验证了该方法解决二分类问题的有效性和优越性。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:F224

【参考文献】
中国期刊全文数据库 前10条
1 徐达宇;杨善林;罗贺;;基于广义模糊软集理论的云计算资源需求组合预测研究[J];中国管理科学;2015年05期
2 肖进;刘敦虎;顾新;汪寿阳;;银行客户信用评估动态分类器集成选择模型[J];管理科学学报;2015年03期
3 宋华明;程龙生;马义中;杨慧;;基于集成学习算法的多变量质量诊断研究[J];数理统计与管理;2014年06期
4 邵亚斌;张晓霞;徐永琳;;基于模糊软集和加权模糊软集的群决策方法[J];统计与决策;2014年19期
5 时建中;程龙生;牛俊磊;;基于RS-Bag分类器集成技术的上市公司财务危机预测[J];数理统计与管理;2013年05期
6 江红莉;何建敏;庄亚明;张岳峰;;基于直觉模糊集和证据理论的群决策方法[J];控制与决策;2012年05期
7 孙智勇;刘星;;模糊软集合理论在税收组合预测中的应用[J];系统工程理论与实践;2011年05期
8 常甜甜;赵玲玲;刘红卫;周水生;;多模式扰动模型动态加权SVM集成研究[J];计算机工程与应用;2011年06期
9 李文立;郭凯红;;D-S证据理论合成规则及冲突问题[J];系统工程理论与实践;2010年08期
10 郭英见;吴冲;;基于信息融合的商业银行信用风险评估模型研究[J];金融研究;2009年01期
【共引文献】
中国期刊全文数据库 前10条
1 李力;冯涛;;上市公司财务困境预测——基于ANFIS和马氏距离判别法的组合模型[J];财会月刊;2015年33期
2 李文艺;岳明道;汪材印;赵水英;;增量证据的融合方法研究[J];蚌埠学院学报;2015年05期
3 罗承昆;陈云翔;王超;项华春;;基于改进证据理论的区间直觉模糊群决策方法[J];计算机仿真;2015年10期
4 汪杨;赵梦翔;王刚;;基于方法集的企业数据治理综合评价[J];郑州航空工业管理学院学报;2015年05期
5 马景义;胡迪;孙枭枭;;不平衡数据处理的新方法——基于样本相似度的少数类合成法[J];数理统计与管理;2015年05期
6 宋晓宇;邱泽阳;徐欢;;基于指数平滑的无线Mesh网络改进信任模型[J];计算机应用与软件;2015年09期
7 胡嘉骥;李新德;王丰羽;;基于夹角余弦的证据组合方法[J];模式识别与人工智能;2015年09期
8 艾艺红;;基于模糊分类计算的投资风险评估数学模型[J];科技通报;2015年08期
9 谢姗;汪卢俊;;中期预算框架下我国财政收入预测研究[J];财贸研究;2015年04期
10 李菁;;基于直觉模糊格的不确定性证据分析[J];中国西部科技;2015年07期
【二级参考文献】
中国期刊全文数据库 前10条
1 熊海涛;吴俊杰;刘洪甫;刘鲁;;分类中的类重叠问题及其处理方法研究[J];管理科学学报;2013年04期
2 熊熊;姚传伟;张永杰;;中小企业联合担保贷款的计算实验金融分析[J];管理科学学报;2013年03期
3 姚潇;余乐安;;模糊近似支持向量机模型及其在信用风险评估中的应用[J];系统工程理论与实践;2012年03期
4 李胜;张培林;;基于GA-PLS和AdaBoost的故障诊断方法[J];数理统计与管理;2012年01期
5 李美娟;陈国宏;林志炳;;基于漂移度的组合预测方法研究[J];中国管理科学;2011年03期
6 庞清乐;刘新允;;基于蚁群神经网络的财务危机预警方法[J];数理统计与管理;2011年03期
7 孙智勇;刘星;;模糊软集合理论在税收组合预测中的应用[J];系统工程理论与实践;2011年05期
8 江一涛;张顺明;;基于Cox模型研究财务困境的行业差异性[J];数理统计与管理;2011年02期
9 孙海龙;姚卫星;;区间数排序方法评述[J];系统工程学报;2010年03期
10 应维云;蔺楠;谢雅雅;李秀;;用LDA Boosting算法进行客户流失预测[J];数理统计与管理;2010年03期
【相似文献】
中国期刊全文数据库 前10条
1 黎平;刘萍;张巡;范郁锋;;基于分类器的身份证号码识别研究[J];贵州科学;2018年01期
2 王忠民;王科;贺炎;;一种基于多分类器融合的人体运动行为识别模型[J];计算机科学;2016年12期
3 邹洪侠;陶硕;;一种代价敏感的三类分类器评估方法的研究与应用[J];通化师范学院学报;2017年08期
4 牛明昂;王强;崔希民;赵康年;柴鹏辉;;多分类器融合与单分类器影像分类比较研究[J];矿山测量;2016年04期
5 赵艺淞;王保云;黎晓路;王婷;;基于多分类器组合的城市不透水面提取研究[J];城市地理;2017年04期
6 何舒炜;;《垃圾分类器》[J];辅导员;2016年11期
7 李健苹;游中胜;;一种新的多分类器融合方法[J];西南师范大学学报(自然科学版);2014年01期
8 兰远东;曾树洪;;动态加权投票的多分类器聚合[J];现代计算机(专业版);2014年05期
9 林煜明;朱涛;王晓玲;周傲英;;面向用户观点分析的多分类器集成和优化技术[J];计算机学报;2013年08期
10 杜海莲;吕锋;辛涛;杜妮;;基于证据理论的优化集成分类器融合算法及应用[J];化工学报;2012年09期
中国重要会议论文全文数据库 前10条
1 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
2 刘希玉;徐志敏;段会川;;基于支持向量机的创新分类器[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
3 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 冯军;李夕海;祁树锋;;基于差异性度量的多分类器融合及其在核爆地震识别中的应用[A];国家安全地球物理丛书(七)——地球物理与核探测[C];2011年
5 夏俊士;杜培军;张伟;;遥感影像多分类器集成系统的设计与实现[A];中国测绘学会2010年学术年会论文集[C];2010年
6 于丽丽;丁德鑫;曲维光;陈小荷;石民;;基于多分类器集成的古代汉语词义消歧[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
8 胡茂福;侯整风;;一种高效流分类加速器的设计与实现[A];第四届中国智能计算大会论文集[C];2010年
9 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 权维俊;叶彩华;赵新平;郭文利;唐广;;专家分类器在京白梨农业气候区划中的应用[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年
中国重要报纸全文数据库 前4条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 南方日报记者 曹斯 徐林 实习生 谭钦允 张艳玲 通讯员 江澜;miRNA分类器:提早一年“揪出”肝癌[N];南方日报;2015年
3 记者 姜靖;能“社交”的机器人助理问世[N];科技日报;2016年
4 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
中国博士188bet全文数据库 前10条
1 冯晓东;基于软概率的分类器动态集成方法研究[D];重庆大学;2018年
2 孙宸;PolSAR图像大间隔学习分类器设计及应用[D];西安电子科技大学;2017年
3 于爱华;基于压缩感知人脸识别技术的研究[D];浙江工业大学;2017年
4 雷浩川;多分类器集成的遥感影像分类研究[D];中国地质大学(北京);2018年
5 陈木生;基于欠采样和不平衡集成分类的垃圾网页检测研究[D];南昌大学;2018年
6 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
7 王卫东;高维小样本数据的特征提取及分类器算法研究[D];南京理工大学;2007年
8 刘杰;乘员类型的自动识别及其在智能乘员约束系统中的应用[D];吉林大学;2007年
9 吴尉林;可移植的稳健口语理解方法研究[D];上海交通大学;2007年
10 章军;小生境粒子群优化算法及其在多分类器集成中的应用研究[D];中国科学技术大学;2007年
中国硕士188bet全文数据库 前10条
1 朱欣怡;离散属性贝叶斯网络分类器的研究[D];山东师范大学;2018年
2 郝振华;基于视频监控的室内智能火灾检测技术研究[D];长安大学;2018年
3 李小虎;连续属性贝叶斯网络分类器的学习与研究[D];山东师范大学;2018年
4 后方帅;基于单音的西洋乐器音色识别方法研究[D];山东大学;2018年
5 李经善;基于低秩分解的分类算法设计与实现[D];扬州大学;2018年
6 孙铭;基于多分类器的不完整数据的分类关键技术研究[D];哈尔滨工业大学;2018年
7 易子博;JavaScript恶意代码检测系统的防规避优化技术研究[D];国防科学技术大学;2016年
8 曹启云;基于生成对抗网络的恶意代码识别研究与应用[D];北京化工大学;2018年
9 赵寒枫;基于Ripper的增强分类方法及其应用研究[D];湖南大学;2018年
10 覃智全;Stacking集成分类器优化算法研究[D];国防科学技术大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026