水稻和拟南芥BRD结构域非典型激酶家族的生物信息学分析(2)_毕业论文

毕业论文移动版

毕业论文 > 生物论文 >

水稻和拟南芥BRD结构域非典型激酶家族的生物信息学分析(2)

水稻(Oryza sativa)是禾本科作物,单子叶,有24条染色体,性喜温湿。水稻是重要的粮食作物,同时也是单子叶植物功能基因组学研究的模式生物。拟南芥(Arabidopsis thaliana)是双子叶模式生物。目前,植物中的BRD基因及其功能还不明确。本研究采用生物信息学法对水稻和拟南芥基因组中的BRD基因进行了系统鉴定,通过基因复制事件和系统发育分析研究了其进化历史与机制,采用EST和芯片数据分析了其在不同组织器官中的表达模式。这些结果提供了水稻和拟南芥BRD基因家族的重要信息,为进一步功能研究奠定基础。

2  材料与方法

2.1  序列检索和复制事件分析

为了鉴定水稻基因组中的BRD基因,采用BRD结构域一致性序列在水稻基因组注释数据库中(http://rice.plantbiology.msu.edu/analyses_search_blast.shtml)进行Blastp搜索,选取E<0.1的序列作为候选蛋白。在Pfam(http://pfam.xfam.org/search)数据库对候选蛋白进行验证,若存在BRD结构域,则认为该候选蛋白属于BRD家族,并下载其序列。基因的基本信息如外显子数、转录方向等从RGAP网站获取。以基因编码序列在KOME网站(http://cdna01.dna.affrc.go.jp/cDNA/ )比对搜索,获得其cDNA登陆号。以BRD结构域一致性序列在TAIR(http://www.arabidopsis.org/)数据库比对搜索,鉴定拟南芥基因组中的BRD基因并下载其序列。文献综述

OsBRD基因在染色体上的位置图通过MapChart软件绘制并手工编辑。AtBRD基因在染色体上的位置则用拟南芥网站主页(http://www.arabidopsis.org/)进行下载。

2.2  蛋白质等电点和亚细胞定位预测

采用ProParam软件(http://web.expasy.org/protparam/)预测蛋白质等电点,利用WoLF PSORT网站(http://wolfpsort.org/)进行蛋白质亚细胞定位分析。

2.3  多序列对比和系统发育分析

在得到水稻和拟南芥BRD蛋白的氨基酸序列后,利用MEGA5.1软件进行多序列比对,采用邻接法(Neighbor-Joining method)构建系统发育树,bootstrap重抽样进行了1000次。

2.4  表达分析

利用OsBRD基因的CDS序列在NCBI EST数据库进行Blastn搜索,获得组织器官表达模式信息。通过检索RiceGE Gene Expression Atlas(http://signal.salk.edu/cgi-bin/RiceGE)数据库获得OsBRD基因表达的芯片数据。

3  结果与分析

3.1  水稻和拟南芥中的BRD基因

通过BLASTP比对搜索,共鉴定出水稻基因组中14个BRD基因,并下载其序列和基本信息列于表1。根据它们在染色体上的位置,系统命名为OsBRD1~OsBRD14。这14个基因外显子数从1到13不等,编码蛋白质的长度分布广泛。最短的蛋白质为OsBRD2,仅含有238个氨基酸,而最长的则为OsBRD3,拥有624个氨基酸。亚细胞定位分析表明,有2个蛋白分布在叶绿体内,1个蛋白分布在细胞质中,6个蛋白分布在细胞核中,1个蛋白属于过氧化物酶体。有7个OsBRD基因为正向转录,7个OsBRD基因为反向转录。

通过BLASTP比对搜索,共鉴定出拟南芥基因组中15个BRD基因(表2)。根据它们在染色体上的位置,系统命名为AtBRD1~AtBRD15。这15个基因外显子数从4个到13个不等,说明它们均不是起源于逆转录转座事件。编码蛋白质的长度分布广泛,最短的蛋白质为AtBRD6,仅含有386个氨基酸,而最长的则为AtBRD14,拥有1061个氨基酸。亚细胞定位分析表明,有4个蛋白在细胞核中,8个蛋白属于脂膜,3个在线粒体中。有4个AtBRD基因为正向转录,11个AtBRD基因为反向转录。来.自/优尔论|文-网www.youerw.com/

3.2  植物BRD基因染色体分布和复制事件

为研究水稻BRD基因的染色体分布,通过基因组检索确定了其在染色体上的位置(图1)。14个水稻BRD基因分布于9条染色体上,其中3号、9号和10号染色体只有一个基因分布,其余染色体均含有两个基因。拟南芥BRD基因分布于4条染色体上,其中5号染色体含有6个基因,1号染色体含有5个基因,3号染色体含有3个基因,2号染色体含有1个基因。基因复制分析表明,有一对水稻BRD基因(OsBRD6和OsBRD7)起源于串联重复事件,没有拟南芥BRD基因起源于串联重复事件。 (责任编辑:qin)