1。3 国内外研究现状和动态来-自~优+尔=论.文,网www.youerw.com +QQ752018766-
1。4 本文的主要工作
本文主要针对人类复杂疾病相关的长链非编码RNA(LncRNAs)的识别问题进行了研究。首先,在第一章,对计算生物学的背景、长链非编码RNA与人类复杂疾病的研究背景以及国内外研究现状和动态进行了简要的陈述。在第二章,基于下载的人类肝癌细胞中1375个长链非编码RNA的表达数据,首先通过聚类分析筛选出12个正常人的样本,我们再利用统计干扰分析的方法建立了长链非编码RNA(LncRNAs)识别的数学模型。并通过计算比对实验找寻可能与人类肝癌细胞发生发展相关的长链非编码RNA。在第三章,对该篇论文做了总结和展望。
2 人类肝癌细胞相关LncRNA识别的数学建模和方法
2。1 数据来源
本文从LncRNAtor( http://lncrnator。ewha。ac。kr/index。htm)数据库下载了人类肝细胞癌症的1375个LncRNAs的表达数据,其中包括25个正常样本个体的LncRNAs表达数据以及40个癌症样本个体的LncRNAs表达数据。
2。2基于统计干扰分析方法建立数学模型
在本课题中,我们利用统计干扰分析的方法来建立人类肝细胞癌症相关LncRNA识别的数学模型。该模型的建立需要参照样本组和干扰样本组。为了得到有效的参照样本组,我们首先通过Cluster聚类软件,将25个正常样本进行聚类分析,结果如图2。2。1所示,聚类结果分成了两类一组有12个数据另一组是13个。由于把同一类特征相近的样本作为参照样本时,样本组比较集中更加利于后面数据上的计算处理。最终,我们选取其中一类样本(12个)作为我们的参照样本组。