收藏本站
《中国矿业大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的肿瘤基因表达谱数据分析方法研究

刘健  
【摘要】:近年来,国内外研究人员将机器学习理论和方法引入到生物信息学领域,通过对基因表达谱数据的综合分析来发现蕴含在生物学中的重要信息。本文针对肿瘤基因表达谱数据,以机器学习为理论基础,通过对特征基因选择、肿瘤分类和肿瘤聚类等问题展开研究与探索,提出了一系列基于机器学习的肿瘤基因表达谱数据分析方法。主要研究内容如下:1.基于深度学习及矩阵分解的肿瘤特征基因选择。首先,针对深度学习模型无法很好地进行肿瘤特征基因选择的问题,提出一种基于样本学习及深度稀疏滤波的肿瘤特征基因选择方法;其次,基于最优均值算法和分块优化理论,提出一种基于最优均值的分块鲁棒特征基因选择方法,并对TCGA中的融合数据进行分析;最后,利用散度矩阵将基因表达谱数据中已知类别标签引入无监督算法中,提出一种监督型惩罚矩阵分解算法,从而对特征基因进行选择。2.基于样本扩充及深度学习的肿瘤样本分类。针对深度学习模型在进行肿瘤基因表达谱数据分类时训练样本严重不足的问题,提出一种基于降噪自动编码器的样本扩充方法,以获得大量的辅助样本。进一步,针对肿瘤样本分类问题,将所提样本扩充方法分别与两种深度学习模型相结合,设计了基于样本扩充的栈式自动编码器和基于样本扩充的1维卷积神经网络。3.基于低秩子空间分割的肿瘤样本聚类。传统子空间分割方法依赖谱聚类进行肿瘤基因表达数据聚类,针对此问题,利用离散约束来直接学习子空间的样本标签,提出了两种基于离散约束的低秩子空间肿瘤样本聚类方法。首先,考虑肿瘤基因表达谱数据内部的流形结构,提出一种基于离散约束及超图正则化的低秩子空间聚类算法;其次,为了消除肿瘤数据中极端离群值对聚类结果的影响,使用封顶范数来提高算法的鲁棒性,提出基于离散约束及封顶范数的鲁棒低秩子空间聚类算法。4.基于双超图正则化主成分分析的肿瘤双聚类。同时考虑肿瘤数据中的样本流形结构和基因流形结构,分别构建样本超图和基因超图来获取数据的局部几何信息,并将双超图作为主成分分析的正则项进行样本聚类和基因聚类,提出基于双超图正则化主成分分析的双聚类算法。
【学位授予单位】:中国矿业大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:R730;TP181

【相似文献】
中国期刊全文数据库 前10条
1 豆玉凤;张国成;孙新;刘颖悦;王楠;黄娜;;基因表达谱技术:贵亦需有道[J];医学争鸣;2010年04期
2 潘海燕,朱军,韩丹夫;分析基因表达谱数据的新方法(英文)[J];浙江大学学报(农业与生命科学版);2004年05期
3 吴斌,黄信勇,王米渠,李常度;运用基因芯片研究骨关节炎虚寒证的基因表达谱述要[J];中医药学刊;2004年11期
4 韩光明,陈顺乐,沈南,王元;聚类分析在自身免疫病基因表达谱研究中的初步应用[J];中华检验医学杂志;2003年08期
5 孙德利,舒琦瑾;基因表达谱在中医药研究中的意义[J];中国中医药信息杂志;2002年01期
6 张渝;刘玉洁;郭丹妮;李惠敏;秦新民;;基于高通量测序的数字基因表达谱技术研究进展[J];北方园艺;2015年10期
7 刘先锋;卢学春;范利;高燕;马聪;罗芸;;奥美拉唑对人脐静脉内皮细胞全基因表达谱的影响及机制分析[J];南方医科大学学报;2012年04期
8 徐持华;张国良;夏颖;李玲;毕勇毅;;聚类分析在苯中毒患者肿瘤相关基因表达谱研究中的应用[J];数理医药学杂志;2006年02期
9 ;我国发现Ⅰ型糖尿病的多基因表达谱,有助于该病的预测[J];生物学教学;2014年09期
10 姜琳颖;余东海;石鑫;;基于加权极限学习机的肿瘤基因表达谱数据分类[J];东北大学学报(自然科学版);2017年06期
中国重要会议论文全文数据库 前10条
1 刘艳;李康;傅松滨;;基于小波分析理论的基因表达谱数据分析方法的研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
2 韦朝领;高香凤;江昌俊;;茶树对茶尺蠖取食诱导的基因表达谱差异初探[A];第四届海峡两岸茶业学术研讨会论文集[C];2006年
3 赵丽婷;郭长江;吴健全;杨继军;韦京豫;王宇平;高蔚娜;;槲皮素对大鼠肝脏基因表达谱的影响[A];中国营养学会特殊营养第七届学术会议会议资料汇编[C];2009年
4 张岩;张亮;周一鸣;安爽;果德安;周玉祥;曾令文;程京;;抗真菌物质与酵母细胞作用后全基因表达谱的聚类法分析[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
5 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第八届全国中西医结合血液病学术会议论文集[C];2007年
6 文志宁;张娟;张丽芳;蒋丽娜;李益洲;李梦龙;;癌症样本基因表达谱数据的解析与建模[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
7 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第三届海峡两岸中西医结合学术研讨会论文集[C];2005年
8 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2005年华东六省一市血液病学学术会议暨浙江省血液病学学术年会论文汇编[C];2005年
9 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];全国中西医结合血液病学术研讨会、浙江省中西医结合学会血液病专业委员会成立大会首次学术年会暨继续教育学习班论文汇编[C];2006年
10 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2006年浙江省血液病学学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 记者 张晔 通讯员 周伟;我学者发现多基因表达谱[N];科技日报;2014年
2 余志平;寻找遗传学线索 提高化疗效果[N];中国医药报;2003年
3 记者 衣晓峰 通讯员 李小莲;探寻“证”的基因表达谱[N];中国中医药报;2009年
4 王雪飞 吴志军;我国建立大规模人胎肝基因表达谱[N];健康报;2006年
5 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
6 赵绍华;给孩子减肥必须“饿一饿”[N];健康时报;2007年
7 小依;回首 只因骄傲[N];医药经济报;2001年
8 本报评论员;有一种私欲叫“不求功利”[N];科技日报;2018年
9 周艳萍;寻求肿瘤个体化治疗方案[N];健康报;2006年
10 本报记者 解悦;南京专家破译肥胖遗传基因“密码”[N];南京日报;2008年
中国博士188bet全文数据库 前10条
1 张菊红;自身免疫性内耳疾病相关的分子机制研究[D];山东大学;2018年
2 刘健;基于机器学习的肿瘤基因表达谱数据分析方法研究[D];中国矿业大学;2018年
3 杨希林;EMP1基因在头颈部鳞癌中的作用及机制研究[D];武汉大学;2016年
4 陈涛;基因表达谱的数据挖掘方法研究[D];西北工业大学;2016年
5 张宝刚;铜离子激发拟南芥免疫机制的研究[D];山东农业大学;2018年
6 王士奇;先天性肛门直肠畸形发病的基因网络调控机制研究[D];重庆医科大学;2016年
7 王全顺;白血病细胞WT1基因的表达机理[D];中国人民解放军军医进修学院;2004年
8 段瑞峰;Pten基因敲除小鼠转录上调新基因pdd87的功能研究及Pten缺失的胚胎成纤维细胞的蛋白质组分析[D];中国人民解放军军事医学科学院;2004年
9 张金强;两条新的肺癌转移相关基因的获取、鉴定与功能研究[D];中国人民解放军军事医学科学院;2004年
10 钱军;骨髓增生异常综合征患者的基因表达谱研究[D];苏州大学;2004年
中国硕士188bet全文数据库 前10条
1 张学扶;基于基因表达谱和蛋白质互作网络的癌症分类预测模型研究[D];湖南大学;2018年
2 赵更;基于基因和基因间互作的通路活性推断方法研究[D];温州大学;2018年
3 张志辉;髓系肿瘤中基因SCIN表达及启动子甲基化的临床意义[D];江苏大学;2018年
4 郭园园;基于互信息的信息基因选择算法研究[D];湘潭大学;2018年
5 姜露熙;灵芝细胞中参与灵芝酸生物合成细胞色素P450基因的筛选与分析[D];昆明理工大学;2018年
6 洪浩;基于度量学习的生物数据分析方法研究[D];国防科学技术大学;2017年
7 杜翠;基于基因表达谱的前列腺癌人种差异性的生物信息学研究[D];苏州大学;2018年
8 吴伟;基于基因表达谱数据的肿瘤分类研究[D];湖南大学;2016年
9 李耀;基于基因表达谱数据的癌症分类研究[D];湖南大学;2014年
10 孟亚洁;基于基因表达谱和DNA甲基化的癌症分类预测[D];湖南大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026