毕业设计(论文)题目:基于统计特征的 DNA 序列甲基化识 别方法研究

一、毕业设计(论文)内容及要求(包括原始数据、技术要求、达 到的指标和应做的实验等)

通过统计的方法提取 DNA 序列的特征向量,根据特征向 量构建一个 DNA 序列样本甲基化位点检测的分类器,通过 Jackknife 进行交叉验证,通过 Sp、Sn、Acc 和 Mcc 等指标对 实验结果进行评价。主要内容:(1)对 DNA 甲基化位点数 据集上的样本抽取统计特征,(2)构建基于特征的分类器, 并确定分类器的参数;(3)对公共数据集采用所设计分类器, 进行交叉验证测试;(4)对公共数据集的实验结果进行评价 分析。78075

二、完成后应交的作业(包括各种说明书、图纸等) 1。 毕业设计论文

2。 源程序

3。 技术文档

4。 英文原文及译文主要参考资料(包括书刊名称、出版年月等):

[1] Zi L, Xuan X, Qiu WR, Chou KC (2015)。 iDNA‐Methyl: Identifying DNA methylation sites via pseudo trinucleotide composition。 Analytical Biochemistry 474: 69-77。

[2] W。 Chen, P。 Feng, H。 Ding, H。 Lin, and K。C。 Chou(2015), iRNA-Methyl: Identifying N6-methyladenosine sites using pseudo nucleotide composition, Analytical Biochemistry, vol。 490, pp。 26-33。

[3] K。 C。 Chou(2011), “Prediction of protein cellular attributes using pseudo-amino acid composition,” Proteins, vol。 43, no。 3, pp。 246-55, May 15。

[4] H。 Lin, E。 Z。 Deng, H。 Ding, W。 Chen, and K。 C。 Chou(2014), iPro54-PseKNC: a sequence-based predictor for identifying sigma-54 promoters in prokaryote with pseudo k-tuple nucleotide composition, Nucleic Acids Research, vol。 42, no。 21, pp。 12961-12972。论文网

[5] C。 Cortes, and V。 Vapnik, Support-vector networks。 Machine Learning, vol。 20, no。 3, pp。 273-297。

[6] S。 H。 Guo, E。 Z。 Deng, L。 Q。 Xu, H。 Ding, H。 Lin, W。 Chen, and

K。 C。 Chou(2014)。 iNuc-PseKNC: a sequence-based predictor for predicting nucleosome positioning in genomes with pseudo k-tuple nucleotide composition。 Bioinformatics, vol。 30, no。 11, pp。 1522-1529。

[7] Liu B, Liu F, Fang L, Wang X, Chou KC (2015)。 rep RNA: a web server for generating various feature vectors of RNA sequences。 Molecular Genetics & Genomics。

[8] Wei C, Peng‐Mian F, Hao L, Kuo‐Chen C (2013)。 iRSpot‐Pse DNC: identify recombination spots with pseudo dinucleotide composition。 Nucleic Acids Research 41: e68。

[9] Chou KC (2011)。 Some remarks on protein attribute prediction and pseudo amino acid composition。 J Theor Biol 273: 236‐247。

[10] 张燕平,查永亮,赵 姝,等。基于自相关系数和 Pse AAC 的蛋白质结构 类预测[J]。计算机科学与探索,2014,8(1):103-110

上一篇:泊松分布及泊松过程在金融保险中的应用任务书
下一篇:概率论中几个不等式的应用任务书

镇江市大气PM10和PM2.5比值...

江苏省城镇居民消费结构的统计任务书

基于对称正定矩阵一道习题的简单任务书

概率统计中的计算机随机...

EXCEL软件的统计功能应用任务书

单片机的点阵游戏机设计任务书

南京红桔20L盖注塑模具任务书

老年2型糖尿病患者运动疗...

安康汉江网讯

互联网教育”变革路径研究进展【7972字】

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

新課改下小學语文洧效阅...

麦秸秆还田和沼液灌溉对...

ASP.net+sqlserver企业设备管理系统设计与开发

张洁小说《无字》中的女性意识

网络语言“XX体”研究