水稻全基因组6mA修饰的功能分析(2)
时间:2018-07-04 20:52 来源:毕业论文 作者:毕业论文 点击:次
因为6mA修饰在真核生物的DNA分子上含量很低,所以需要更为灵敏的检测手段来识别6mA修饰。首先可以使用6mA抗体来特异的识别甲基化的DNA分子,然和结合高通量测序来和生物信息的分析手段来观察6mA修饰在全基因组的分布。但是抗体检测却无法识别DNA中6mA修饰和1mA修饰,因此准确性会受到限制。液相色谱串联质谱可以精确定量的识别低丰度的核苷酸修饰,但是也很容易受到细菌DNA分子的影响。 某些限制性核酸内切酶则可以特异性的识别非甲基化和甲基化的位点。例如DpnⅠ可以识别甲基化的5’-G6mATC-3’位点,而DpnⅡ则可以识别非甲基化的5’-GATC-3’位点,因此可以精确的检测6mA修饰。但是酶切法仅能识别特定的核苷酸序列[10],因此在使用上会受到一定的限制。单分子实时测序可以弥补上述方法的缺点。因为DNA分子的不同修饰会产生不同的动力学信号,所以单分子实时测序可以精准的测定核酸合成中的动力学信号[11]。但是单分子实时测序无法识别1mA和6mA修饰,所以它必须和液相色谱串联质谱联合使用才可以得到准确的结果。 6mA修饰可以影响转录因子与DNA的结合,或者直接改变DNA分子的三文结构来调控转录过程。目前已有研究证明在细菌中,6mA修饰能够调控基因转录[12,13]。所以可以推断在真核生物的基因组中,6mA修饰也许会有类似的功能。比如在哺乳动物和植物中,6mA修饰的DNA分子会降低转录因子的结合能力[14,15]。而在植物中,6mA修饰的靶向序列能够增强AGP1与DNA分子的结合[16]。 在果蝇中,6mA修饰被认为有助于促进转座因子的表达。6mA-IP-seq结果表明6mA富集在转座子区域,并且去甲基化酶Dmad的敲除会增加转座子的表达量[17]。由此可见,6mA修饰与基因表达存在相关关系,但是该机制是否在不同生物中具有普遍性及其他功能还有待进一步研究。 1材料与方法 1.1材料 1.1.1数据来源 水稻日本晴两周幼苗的叶子的ChIP-seq数据,水稻基因组数据Tigr7,水稻基因组RNA表达量数据。 1.1.2分析工具 本论文中所用到的分析工具均来源于南京农业大学生物信息中心,依托于生物信息学平台的服务器集群。其中所使用到的软件有:高通量测序数据质量控制及可视化软件FastQC;序列比对软件bowtie;Peak Calling过程所用软件MACS2;文件转换软件Samtools;测序reads可视化软件Integrative Genomics Viewer(IGV_2.3.91);以及脚本编写软件python和将分析结果绘制成图的R语言。 1.2方法 1.2.1测序质量的查看 通过FastQC来对所获得的二代测序数据进行质量控制,可视化观察,对测序片段的每一个碱基的质量进行检测,从而获得整体测序质量的分布情况,同时还可以对数据的名称,类型,reads数目,未通过的reads数目,reads读长及平均的GC含量进行统计。在FastQC运行的同时还可以过滤掉一些测序质量较差的reads,过滤后的结果可直接用于下一步的序列比对。FastQC运行结果为压缩的.html文件,需将文件解压缩并来浏览器中查阅。 1.2.2原始序列的比对 使用bowtie软件来将原始的fastq文件比对到水稻参考基因组上,并生成SAM文件,使用过程如下: 1)为水稻基因组构建索引: 使用实验室已构建好的索引文件。 2)序列比对: bowtie –chunkmbs 200 -X 500 -m 1 -p 16 -S ./Tigr7 -1 *_1.fq -2 *_2.fq output.sam --chunkmbs为搜索提供的内存,默认为64,如不修改成200会生成大量错误;-X为双末端测序的最大插入长度,默认为250,对于本测序数据需要改为500,否则会导致大部分的reads无法mapping到参考基因组上;-p为线程数,数值越大,程序运行越快;-S表示输出为.sam文件;Tigr7为参考基因组;输出的SAM文件需要提前创建,所得SAM文件可进一步用于下一步分析使用。 (责任编辑:qin) |