1.2.3富集区间的鉴定
使用MACS2来寻找测序片段的富集区域,即callpeak过程。使用方法如下:
macs2 callpeak -g 373245519 -t test.sam -c control.sam -n outfile
其中参数-g 373245519为水稻基因组;-t test.sam为实验组的SAM文件;-c control为对照组的SAM文件;-n outfile则指定输出文件地址及输出文件名。生成的文件可供下一步分析使用。
1.2.4将富集区间可视化
使用Integrative Genomics Viewer(IGV_2.3.91)可将测序reads片段在基因组上可视化观看,并以此来检查MACS2所生成的富基区间是否准确,在此过程中,使用到了以下软件方法:
samtools view -bS test.sam > test.bam
作用:将SAM文件转化成二进制的BAM文件
samtools sort test.bam test_sorted.bam
samtools index test_sorted.bam
之后便可生成相应的.bai文件,将.bai文件和相应的BAM文件放入同一文件夹即可在IGV中可视化打开。
1.2.5 6mA修饰与基因表达功能分析
通过MACS2获得的SAM文件和已有的水稻基因组RNA表达量数据,来对6mA修饰与基因表达的功能进行相关分析。首先将水稻基因分为两大类沉默基因和非沉默基因,之后将非沉默基因根据表达量分为五类,表达量从高到低有:Top 20%、21-40%、41-60%、61-80%、81-100%;以及沉默基因共优尔个区间。 水稻全基因组6mA修饰的功能分析(3):http://www.youerw.com/shengwu/lunwen_18826.html