2。材料与方法
2。1数据来源
在QSAR研究中,数据的可靠性非常关键,只有保证数据的可靠,模型才有意义,一般要求要求样本数目不少于十个。同时,样本要尽可能的丰富,多样化。在QSAR研究中,数据的获得主要有两个来源:(1)发表的期刊杂志(2)各大数据库。在化学领域,常用的数据库有:
(1)化学信息系统(CIS)
美国NIH/EPA化学信息系统(CIS)是包括范围最为广泛的一个系统[16,17],多个子库系统由化合物的结构及系统命名检索系统SANSS所衔接,即SANSS是CIS之枢纽。
(2)剑桥结构数据库(CSD)
CSD中记录所包含每一个记录由参考编码所识别,同时每一个记录由3个数据段组成:BBI(文献目录)、CONN(联接度)和数值型数据DATA。CSD允许脱机查询BIB或CONN片断,之后再检索相关的DATA。CSD还允许进一步对之分析处理,以进行结构的显示等。
(3)环境化学的数据和信息网[18]
ECDNI是欧洲共同体的一个下属组织所建造的有关环境化学物质的数据库。ECDNI运行在哥本哈根的数据中心的主中心(Data一CnertalneHostCenrte),可通过信息联网进行联机检索。库中有化合物60000个,其中20000个为剧毒化合物。来`自+优-尔^论:文,网www.youerw.com +QQ752018766-
除了上面介绍的一些数据库以外,其它重要的数据库还包括ACS(American Chemical Society, 美国化学学会)期刊数据库[19],ACS的期刊被ISI的Journal Citation Report(JCR)评为“化学领域中被引用次数最多之化学期刊”;Elsevier Science 期刊数据库[20],出版的期是世界公认的高品位学术期刊,且大多数为核心期刊,被世界上许多著名的二次文献数据库所收录。国内的重要的数据库还包括中国期刊全文数据库(CJPD)[21]、万方数据资源系统[22]、综合性文献数据库:维普资讯[23]等。
本研究的全部数据来源于2016年前各个已发表的期刊,其中包括PAH,alkylated-PAHs,PCBs,PBDEs,organochlorine pesticides,alkyl benzenes,alkyl phenols,aliphatic hydrocarbons,这些化合物的名称、CAS号、logKpew实验值列于表2。1—表2。9[10。24-40]。