毕业设计(论文)内容及要求(包括原始数据、技术要求、达到的指标和应做的实验等)
通过PseDNC方法提取RNA序列的特征向量,根据特征向量构建一个RNA序列样本甲基化位点检测的分类器,通过Jackknife进行交叉验证,通过Sp、Sn、ACC和MCC等指标对实验结果进行评价。主要内容:(1)对RNA甲基化位点数据集上的样本进行特征抽取,(2)构建SVM分类器,采用5/10重交叉验证确定SVM的参数;(3)对数据集采用SVM分类器进行交叉验证;
(4)对实验结果评价分析。83297
二、完成后应交的作业(包括各种说明书、图纸等)
1。毕业设计论文
2。源程序
3。技术文档
4。英文原文及译文
三、完成日期及进度
自3月21日起至6月26日止进度安排:
3。21-3。31:调研,收集资料,方案设计,系统分析,熟悉开发工具;
4。1-5。6: 系统详细设计与实现;论文网
5。7-5。20:系统性能测试;
5。21-5。29:系统优化;
5。30-6。26:撰写毕业设计论文,毕业设计答辩。
四、主要参考资料(包括书刊名称、出版年月等):
[1]ZiL,XuanX,QiuWR,ChouKC(2015)。iDNA‐Methyl:IdentifyingDNAmethylationsitesviapseudotrinucleotidecomposition。AnalyticalBiochemistry474:69-77。
[2]W。Chen,P。Feng,H。Ding,H。Lin,andK。C。Chou(2015),iRNA-Methyl:IdentifyingN6-methyladenosinesitesusingpseudonucleotidecomposition,AnalyticalBiochemistry,vol。490,pp。26-33。
[3]K。C。Chou(2011),“Predictionofproteincellularattributesusingpseudo-aminoacidcomposition,”Proteins,vol。43,no。3,pp。246-55,May15。
[4]H。Lin,E。Z。Deng,H。Ding,W。Chen,andK。C。Chou(2014),iPro54-PseKNC:asequence-basedpredictorforidentifyingsigma-54promotersinprokaryotewithpseudok-tuplenucleotidecomposition,NucleicAcidsResearch,vol。42,no。21,pp。12961-12972。
[5]C。Cortes,andV。Vapnik,Support-vectornetworks。MachineLearning,vol。
20,no。3,pp。273-297。
[6]S。H。Guo,E。Z。Deng,L。Q。Xu,H。Ding,H。Lin,W。Chen,andK。C。Chou(2014)。iNuc-PseKNC:asequence-basedpredictorforpredictingnucleosomepositioningingenomeswithpseudok-tuplenucleotidecomposition。Bioinformatics,vol。30,no。11,pp。1522-1529。
[7]LiuB,LiuF,FangL,WangX,ChouKC(2015)。repRNA:awebserverforgeneratingvariousfeaturevectorsofRNAsequences。MolecularGenetics&Genomics。
[8]LiuB,LiuF,WangX,ChenJ,FangL,etal。(2015)。PseinOne:awebserverforgeneratingvariousmodesofpseudocomponentsofDNA,RNA,andproteinsequences。NucleicAcidsResearch。
[9]WeiC,Peng‐MianF,HaoL,Kuo‐ChenC(2013)。iRSpot‐PseDNC:
identifyrecombinationspotswithpseudodinucleotidecomposition。NucleicAcidsResearch41:e68。
[10]ChouKC(2011)。Someremarksonproteinattributepredictionandpseudoaminoacidcomposition。JTheorBiol273:236‐247。
[11]张燕平,查永亮,赵姝,等。基于自相关系数和PseAAC的蛋白质结构类预测[J]。计算机科学与探索,2014,8(1):103-110