2 材料与方法
2.1 序列检索和基因复制分析
利用cystatin蛋白已知结构域序列在RGAP比对搜索,在水稻的注释蛋白质库中寻找相似的蛋白序列,当E≤0.1的序列时则被认为是候选蛋白,再将候选蛋白的序列在Pfam中检测,若存在cystatin结构域,则认为该候选蛋白属于cystatin蛋白家族,若未能检测出来,则认为其不属于该家族。获取水稻cystatin基因信息后,从RGAP中下载每一条记录的基因序列、蛋白质序列、CDS序列,获得每一条记录的外显子数、蛋白质氨基酸数、转录方向。
Cystatin基因在染色体上的位置图通过MapChart软件绘制并手工编辑。通过Plant Genome Duplication Database(PGDD, http://chibba.agtec.uga.edu/duplication/index/locus)找cystatin基因的复制事件。
2.2 多序列对比和系统发育分析
获取水稻的cystatin蛋白家族的氨基酸序列后,将蛋白家族的氨基酸序列在MEGA5.1软件中进行多序列联配,采用邻接法构建系统发育树,bootstrap重抽样进行了1000次。
2.3 EST表达分析
水稻EST数据来源于Genbank的EST数据库。在RGAP中得到蛋白所对应的编码序列(CDS),对EST数据进行Blastn搜索,取匹配率大于95%、长度大于160bp且E≤0.1的结果作为对应的EST序列,对序列联配的结果和不同器官的分类来获取水稻cystatin基因家族的表达。