有研究表明,在大约3亿年前被子植物和裸子植物最近的共同祖先中已经存在MIKCC型MADS-box基因12类中的7类,分别为AG、AGL6、 AGL12、 DEF+ GLO、GGM 13,、SIMADSII和TM3基因。在大约2亿年前单子叶植物和双子叶植物的最近共同祖先中已经存在12个分支中的AGL2, AGL17和SQUA 3个分支,只有包括AGL15和FLC基因的2个亚组,除在芸薹属中还未见报道[10]。另外,MADS-box基因家族在现存的裸子植物和被子植物中有相似的复杂性[11]。
1。4 MADS转录因子家族的研究意义
近年来, 随着各种生物技术的发展以及基因组测序方法的进步,对MADS基因家族的研究更为深入,使用某个特定基因的全部基因组数据来进一步推测其功能越来越多。MADS转录因子除在植物营养生长(Carmona等1998;Kang和Hannapel 1995)、种子和种皮发育 (Buchner和Boutin 1998)、根的形成(Heck等1995)、胚形态建成(王光清等1997)、花的发育 (Becker和Theißen 2003)、信号转导(Messenguy和Dubois 2003)等方面发挥作用外, 在果实发育和成熟中发挥重要作用。有关MADS-box转录因子对果实发育和成熟的作用的报道目前主要集中在拟南芥、番茄、香蕉、矮牵牛、金鱼草、桃、水稻、菠萝、葡萄等物种上(刘菊华等2010)。本文主要以拟南芥这种植物为代表,研究其MADS基因家族的全基因组测序。
2 材料与方法
2。1 植物MADS转录因子的分类与鉴定
2。1。1 植物MADS基因家族的分类论文网
目前来看,根据转录因子的结构特征可将MADS基因家族分为两类:无论哪一类,它们都具有最主要的结构特点,即它们的结构域中都十分保守,都可识别CArG基序,从而调控下游基因的有效表达。正如上文中所提到的,MADS-box基因在如今已知的的真菌、植物、动物中分为两大类:I型 MADS-box基因(Type I)和 II型 MADS-box基因(Type II)。植物界中,我们发现Type I型和Type II型的基因的区别主要是 MADS结构域不同。 I型MADS结构域主要是MADS SRT型, II型MADS结构域主要是MADS MEF2型。Type II型包括M、I、K、C区域,故又称为MIKC区,在此之后,MIKC基因型的MADS-box在经过一次基因复制,又分化形成MIKC*型和MIKCC两种亚型,而MIKC*型和MIKCC两种亚型的MADS-box基因的区别又在于 I区序列结构的不同。
而Type I型不包括K区域,II型的MADS域比I型的MADS域更保守[12]。
MIKCC还可分为许多亚组,在植物生长和发育过程中,其功能及作用机理也是更为明确的一个类型[11, 13]。在拟南芥中MADS-box基因分为5大类, Mα、Mβ、Mγ、Mδ、MIKC型基因。其中,Mα、Mβ、Mγ属于I型 MADS-box基因,Mδ、MIKC型分别属于II型MADS-box基因[14]。
根据对MADS基因的分类又可以进一步讨论其结构特征,上文中提到过MIKC型MADS-box基因具有多内含子基因结构,如拟南芥、水稻、葡萄等,而内含子的位置、长度具有一定的保守性。大部分MIKC型MADS-box基因具有7个外显子以及6 个内含子,也有的MADS-box基因有8个外显,7个内含子。 在拟南芥,MADS- box基因家族的内含子表现为非常明显的双峰分布,其中,MIKC型MADS-box基因含有多个内含子,Type I型 MADS-box基因通常没有或只有1个内含子。水稻基因组 MADS-box基因的内含子也是明显的双峰分布,MIKC型MADS-box基因含有多个内含子,Type I型 MADS-box基因没有内含子。这种分布可以解释为缺失或获得内含子的趋势不同或Type I型的MADS-box基因的祖先的转录起始点的不同[15]。
2。1。2 植物MADS家族转录因子的鉴定
我们从植物TFDB数据库中下载我们所需物种的MADS转录因子超家族序列(http://planttfdb。cbi。edu。cn/) [16],得到了所需物种的基因序列以后就开始对这些具有MADS转录因子的结构域进行鉴定。首先,我们利用Blastp程序在所有的植物基因中筛选出具有MADS基因的部分,其次,会在Pfam (http://pfam。sanger。 ac。uk/)[17, 18]的数据库中检索出MADS基因家族特征性蛋白结构域。然后,再在SMART(http://smart。embl-heidelberg。de/)[19]在线程序中,保留那些不含MADS基因的蛋白结构域。最后,我们直接在拟南芥的基因组网站中下载的已经注释好的拟南芥的全部基因序列,从而可以获取拟南芥的42个MADS转录因子。在获取到的拟南芥的42个MADS转录因子中我们会列举出它的基因号、染色体位置、蛋白大小、分子量、等电点等信息。