摘要核小体是真核生物染色体基本组织结构单元,它由 DNA 与组蛋白组成。核小体 随着细胞周期的变化,在细胞中的染色质上呈现出不同的状态。核小体对基因表达具 有重要影响。最新的研究表明,在真核生物中,核小体在基因的转录调控、DNA 的 复制与修复、DNA 的剪切拼接以及基因的表达调控等生命的基本过程扮演了重要的 角色。82331
自从人类基因组计划实施以来,科研人员检测出了大量的 DNA 序列,开启了人 类探索生命奥秘的新启元。但是在人类基因序列的性质以及功能的认识方面,目前的 科学研究仍比较滞后。基于此,通过机器学习算法预测基因序列功能变得越来越重要。 目前,出现了很多预测核小体位置的计算方法,但是这些方法没有考虑到 DNA 的结 构属性,导致了预测效果不理想。本文主要研究人类、线虫和果蝇三种生物的核小体 序列,通过对 DNA 序列的分析,综合了 DNA 结构属性,通过统计单核苷酸、二核 苷酸和伪核苷酸的频率并组合这些特征来预测核小体位置信息,在主要评价标准 Acc, Mcc 以及 AUC 等方面相较于其他分类器预测性能取得了一定程度的提高。
毕业论文关键词:生物信息学;核小体定位;支持向量机;特征组合
Abstract Nucleosome is the basic structure of eukaryotic chromosomes, which consists of DNA and histone octamer。 The eventful character in many biological processes are determined by the structure of nucleosome。 Nucleosome plays an eventful character in rule of gene expression, transfer of DNA genetic information , replication and transcription of chromatin and so on。
The researchers have detected a large number of DNA sequences since the Human Genome Project started, it means that we have entered the new time of exploring the secret of life already。 Nevertheless, in terms of understanding the functions of human genome sequences , current scientific research is still lagging behind。 Based on this, it has been more important that we use the way of machine learning to predict gene sequences in bioinformatics。 Many calculation methods which used to predict nucleosome positioning information have been made out already, but which not take the structural properties of DNA into account, which leads to a unsatisfactory prediction result。 The new method proposed in this article mainly talk about H。sapiens, C。elegans and D。melanogaster, analyses DNA sequences, takes the structural properties of DNA into account, and combines single nucleotide, dinucleotide and pseudo K-tuple nucleotide composition together to predict nucleosome positioning in the datasets of H。 sapiens, C。 elegans and D。 melanogaster。 The results abtained a higher exactitude and outperformed the other predictors in the main evaluation indexes of Acc, Mcc and AUC。
Keywords: bioinformatics; nucleosome position; SVM; feature combination
目 录
第一章 绪论。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 1
1。1 研究背景 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 1
1。2 国内外研究现状 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 3
1。3 论文主要工作 。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 4