摘 要本文在分子图邻接矩阵和可变的原子价连接性指数( )的基础上,提出了计算 的新方法,构建了可变的分子连接性指数 用于预测不饱和链烃的沸点。首先从文献和物化手册收集169个不饱和链烃的沸点,应用Matlab程序计算了其中10个拓扑指数,同时使用统计分析软件SPSS,采用逐步回归算法对变量进行优化筛选,最终得到2个最优描述符。可知当a =0.64, b =0.10,通过最佳子变量集合法,从 获得了一个良好的预测有机化合物的沸点的参数模型(R=0.9981)。结果表明该方法比文献方法更能准确地估测不饱和链烃的沸点。69865
毕业论文关键词:沸点 不饱和链烃 可变的分子连接性指数 拓扑研究 优化
Topological research on the boiling point of unsaturated chain hydrocarbon
Abstract For predicting the boiling point of organic compounds, a variable molecular connectivity index which were based on adjacency matrix of molecular graphs and the atomic valence connectivity index δi’ were proposed. First, the boiling point values of 169 unsaturated chain hydrocarbons are collected from the literature and the handbook, the ten topological indices are calculated by Matlab program. Simultaneously, by using statistical analysis software SPSS, the present application widespread stepwise regression algorithm, and the best subsets regression analysis method, two most superior descriptors can be obtained finally. When a=0.64, b=0.10, a good two-parameter model can be constructed from mχ’ by using the best subsets regression analysis method for the standard entropy of organic compounds. The results show that the current method is more effective than literature methods for estimating the boiling point of an unsaturated chain hydrocarbon.
Key words: boiling point unsaturated chain hydrocarbon connectivity index topological research optimization
目 录
摘 要 I
Abstract II
目 录 III
1绪论 1
2 修正的分子连接性指数 3
3 数据集的选择 5
4多元线性回归分析 6
4.1 不饱和烃沸点QSPR模型 6
4.2 单烯烃沸点QSPR模型 11
4.3 单炔烃沸点QSPR模型 14
5 结果与讨论 17
5.1 相关性R和a,b的关系图 17
5.2新建的分子连接性指数 18
6 结论 21
参考文献 22
致谢 24
1绪论
有机物是生命的重要组成部分,也是维持生命新陈代谢不可或缺的物质,与人们的生活息息相关,而对于有机化学的不断深入研究和发展,将会对人类的健康文明和生态文明带来巨大的改变。
沸点作为有机物最基本的物理化学性质之一,具有凝聚态的性能,并且对于物质其它的理化性质,如蒸发热、临界温度等都有很强的相关性。我们可以通过实验测定大部分化合物的沸点,然而对于尚未能够合成或者难于测量的化合物,就不得不先对其沸点进行预测或者估算。论文网
众所周知,对于有机化合物来说,它们的沸点与其分子结构的关系密切。上世纪70年代,QSPR/ QSAR技术应运而生,由最初的为了满足药物设计的需要,逐渐渗透到其他的各个领域中,比如农学、生理学、环境学等。探索出准确描述分子结构的参数是定量结构一性质相关(QSPR)研究取得成功的关键,而只有将物质的结构数值化才能使结构与性能的定量关系实现。因此,拓扑指数便被提了出来。拓扑指数中包含着大量的分子结构信息,通过拓扑指数,我们可以粗略的预测分子的化学环境。迄今为止,据文献记载和报道,人们已经发现的拓扑指数大约有200多种。1947 年,第一个拓扑指数Wiener指数[1]诞生,自此开辟了拓扑指数的辉煌道路。其后Randic连接性指数[2]、Kier-Hall指数[3]、Hosoya指数[4]、Balaban 指数[5]、Estrad指数[6]等应用而生,其中最著名的是Randic连接性指数和Kier-Hall指数。这些经典的连接性指数多以有机物为研究对象,根据化合物的分子结构来描述和预测它们的理化性质和相关的生物活性。但是这些指数由于局限于某一特定的QSPR模型,所以并不能有效的预测有机物分子的性质。我们知道有机物分子的结构是极其复杂的,并且与性质之间有着一定的内在关系,所以我们需要借助计算机进行精密的计算并且能准确预测分子的性质,这就使得化学与计算机网络相互关联,产出了化学信息学。通过Haunch和Free-Wilson的不懈研究,产生了2D的QSPR研究方法[7],随后,人们逐渐认识了化合物的空间结构,学会运用3D和一些新的拓扑参数来研究定量构效关系[8]。