2 内容与方法
2。1 数据来源
本实验主要通过查阅国际生物技术信息数据库(NCBI)(https://www。ncbi。nlm。nih。gov/)中的Gene Expression Omnibus(GEO)板块(http://www。ncbi。nlm。nih。gov/geo/)对目前小麦转录组数据进行统计分析(图1,图2)。
图1 国际生物技术信息数据库(NCBI)
图2 国际生物技术信息数据库(NCBI)中Gene Expression Omnibus(GEO)板块
2。2 查询过程文献综述
目前,关于小麦种子转录组芯片数据共包含1个平台下的2个实验数据和37个样品信息。GEO(http://www。ncbi。nlm。nih。gov/geo/)的数据存储可以分为四个层面,分别为GPL-Platform、GSE-Series、GSM-Sample和GDS-Dataset,其中GPL-Platform描述实验平台的信息,对芯片平台而言,描述芯片类型及芯片上的探针数据等信息;GSE-Series包含一系列的样本(GSM),据此可以得知多个相关样本的所有基因的表达量等信息;GSM-Sample描述单个芯片实验的杂交数据,据此可知特定样本与芯片杂交之后测得的mRNA表达量或SNP等位基因型等信息;GDS-Dataset由GEO 职员根据GSM编纂组合起来的条目,与 GSE 类似,同样描述了多个相关样本的所有基因的表达量等信息[9],如在NCBI网站上公布的小麦芯片平台编号GPL3802,通过该编号可以在已有数据库NCBI的GEO板块中找到该芯片的具体信息