甲基化位点的知识在生物医学研究与实践药物开发过程中是非常重要的基础。近 年来,随着高通量 DNA 甲基化检测技术的出现以及 DNA 甲基化预测方法的不断改 进,使得 DNA 甲基化的生物信息学研究有了很大的发展。一系列具有较好精度的 DNA 甲基化预测工具不仅仅成为实验检测技术的补充,同时也反映了 DNA 甲基化本 身是有规律可寻的,这启发了专家们对于 DNA 甲基化内在机制和进一步提高甲基化 预测准确性的探索。78075
事实上,在过去的十年中,专家们在确定甲基化位点的进程中已经做了许多努力。 例如:基于支持向量机分类器(SVM),建立用于预测 DNA 序列甲基化状态的 CpG 方法“Methylator”[5],以及创建“MethCGI”预测器来预测人类大脑中的 CpG 岛的 甲基化状态[6]。而且用 MethCGI 对 MethDB 数据库中所包含的来自多个组织的甲基化 数据进行预测,已经得到了较好的预测精度(MethDB 是最早出现的整合多个文献中 DNA 甲基化数据的数据库,也是涵盖物种和组织最多的数据库)。还有 iDNA-Methyl 方法[1],目前所知的唯一的预测单个 CpG 双核苷酸甲基化状态的在线工具,采取支 持向量机(SVM)作为预测引擎,通过三核苷酸组成成分的方法和伪氨基酸组成成 分的方法以及数据集优化技术识别 DNA 甲基化位点,论文网
但传统的识别方法仍然存在许多问题,例如这些方法是低准确率且费时费力的, 并且只能适用于小规模的数据集;严重依赖于物理化学属性研究;并存在构建基准数 据集时,并未提出明确的可以删除冗余样本的截断程序,导致预测不能避免同源性偏 差而产生文献报道的成功率估计过高,以及没有考虑 DNA 序列内在的碱基顺序的信 息导致的预测能力有限等诸多问题。因此预测结果精度不高,仍存在很大的提升空间。
DNA序列甲基化识别方法国内外研究现状:http://www.youerw.com/yanjiu/lunwen_89888.html