基于以上几点,拟南芥是遗传研究中重要的模式生物,被科学家誉为“植物中的果蝇”,所以对其进行MADS基因家族的全基因组测序显得很有必要。
1。1 转录因子概念
转录因子,是一种特别的蛋白质,包括转录激活因子和转录阻遏因子。这类调节蛋白能识别并结合转录起始位点的上有序列或远端增强子元件,通过DNA-蛋白质相互作用而调节转录活性,并决定不同基因的时间、空间特异性表达[1]。转录因子能调控植物对外界环境的反应,如高盐、干旱、高温、低温等不良条件,在植物生长发育以及代谢调控过程中都起着重要作用。它们通过自身特有的高度保守的结构域与DNA或其他蛋白质相互作用, 转录因子一般包括四种[2]:DNA结合域、转录调控域、寡聚化位点和核定位信号区。其中MADS转录因子是一种在真菌、动物、植物等真核生物中广泛存在的具有调控作用的反式作用元件,其N端含有一段由60个左右的氨基酸残基组成的保守序列,通过结合相应的顺式作用元件参与调控下游基因的表达,在植物的结构和功能方面具有重要作用。
MADS-box分布十分广泛并且发挥的作用也很重要,在酵母细胞中参与信号应答反应;在植物中与花、根、茎、叶等器官发育有关,并且可以调节花的生长开放时间,此外在植物生长发育的各个阶段也发挥了重要作用,MADS-box存在于类似于拟南芥这样的双子叶植物中,如葡萄、金鱼草等,也存在于如水稻、玉米、高粱这样的单子叶植物中;在动物中参与心肌发育。
迄今为止,对MADS-box 基因了解较为深入的是其在花中的作用。最为著名的是 ABC模型,它是根据模式植物金鱼草和拟南芥的研究而提出来[3],随着研究的不断深入,提出了ABCDE模型来解释花发育的调控过程。ABCDE模型认为:A和E类基因调控萼片;A、B和E类基因共同调控花瓣;B、C和E类基因共同调控雄蕊;C和E类基因调控心皮; D和E类基因调控胚珠[4-6]。在拟南芥中,A类基因包括APETALA1(AP1);B类基因包括PISTILATA(PI)和AP3;C类基因包括AGAMOUS(AG);D类基因包括SEEDSTICK/ AGAMOUS-LINE11(STK/AGL11);E类基因包括SEPALLATA(SEP1、SEP2、SEP3和SEP4)。
1。2 MADS转录因子的结构特征
一般情况下,多个相似的内含子和外显子构成了MADS-box结构,基本上MADS是由M、I、K、C四个区域构成。MADS-box结构域分布在 MADS-box蛋白因子的N末端或者是临近N末端处,是由大约有60个氨基酸残基组成的高度保守结构序列,具有CArG-box(5’-CC(A/T)6 GG-3’的结构),因此可以与特异的DNA结合[7]。其中I区域是由位于M区域和K区域的非保守序列组成,包含30个左右的亲水性的氨基酸残基,C端含正电荷,有助于识别DNA结合区形成复合体。由保守序列构成的K区域是MADS-box的特征性区域,由于该区域是由易形成类似于角蛋白的螺旋结构的70个左右的氨基酸残基构成,所以会导致二聚化作用的发生。而C区目前为止由于序列和长度变化性大的原因,其功能尚不清楚,可能与复合体的形成以及调节转录活性有关。
1。3 MADS转录因子的起源与进化
研究表明,大约在10亿年前,形成Type I型MADS-box和Type II型MADS-box是由于分化形成真菌、植物、动物的共同拥有的祖先MADS-box的一次复制。由于在所有的 MADS-box基因中只有植物中的II型基因具有K结构域,因此推测K结构域的演变发生在形成I型和II型MADS-box基因两大分支的复制之后[8]。研究表明,I型 MADS-box基因比II型 MADS-box 基因进化速度快,出生死亡率高。这可能是因为 I型 MADS-box基因的重要功能少,表达水平很低 ,所以功能限制少,基因重复的频率高,与II型 MADS-box基因相比,I型 MADS-box基因的选择纯度低[9]。