冯长君、沐来龙等人用边价连接性指数[12]对有机化合物的标准熵进行估算,取得较好的结果,优于Thinh等人用基团加和法对有机化合物的熵值的估算值。如今报道的拓扑指数已有上百种,其中绝大多数使用的是以分子图的邻接矩阵 、距离矩阵的方法。这些拓扑指数可用于表现分子的大小 、形状及支化情况。本文不仅采用可变的分子连接性指数对有机化合物的标准熵进行拓扑分享,并在此基础上引入矫正参数,还将有机物按类别详细分类建立新的计算公式,以便获得有机物标准熵的最佳估算值获得优于文献的结果。
1分子连接性指数
分子价连接性指数 是由Kier、Hall等人在分子隐氢图邻接矩阵的基础上衍生出来的分子描述符,根据不同有机物分子的大小、分支、不饱和度、杂原子以及成环的个数等结构特征,把一个分子划分成不同的子图,再把各子图的结构碎片加权计数,计算分子连接指数的值,它的核心概念是价电子描述符δiv。式(1)(2)(3)是一般的分子连接性指数公式
式中 是价电子数, hi 是与原子i成键的氢原子数, 是原子i的电子数。
式中 为分子连接性指数的指数的阶, 是同种分子碎片的数目, 是简单原子点价, 是分子碎片的类型。
1.1 可变的分子连接性指数
研究发现 并不能反映一个原子的不同的化学环境为此,我们根据不同分子的结构特征,提出了一个新 的计算公式:
式中 是价电子数, hi 是与原子i成键的氢原子数, 是原子i的电子数, 代表原子价轨道电负性,其中2.551是碳原子sp3杂化的值。在共轭体系中π电子往往游离于所有原子之间。所以参数a 和b是可变的,它们的最优值可以由最优化方式得出。对于饱和烃,xi = 2.551,所以δi’ = δiv。
当用 取代 时,得到可变的连接性指数 [6]:
m是分子连接性指数的阶,y是可变参数,我们用MATLAB计算了a、b、y不同取值时684个有机化合物的mχ’ (正指数)、 mχ” (逆指数)值。
2 数据集的选择
为了获得一个有较好预测能力而且稳定的模型,本文选择了各种类型的有机化合物其中167个卤代烃,54个芳香烃,158个烷烃与环烷烃,55个醇酚醚,79个烯烃,41个炔烃,47个含N有机物,83个含S有机物。这些有机物的标准熵数据来源于物理化学手册及相关参考文献[9-10]。来!自~优尔论-文|网www.youerw.com
3 参数a、b、y的优化
本文找出经典的几种有机物的类别进行分类优化,以得到更为优秀的模型。
(1)167卤代烃的优化。首先寻找构建预测有机物标准熵的3元回归模型 、 、 的最优值。通过运算初步确定 、 、 的取值范围为[1.7,1.9],[0.6,1.2]和[0.22,0.30]。将 、 、 取不同值时所得的连接性指数mχ’、 mχ”,通过matlab的最佳子变量集合法回归获得3参数模型,通过比较不同模型对有机物标准熵预测值的相关性R值,最终确定 、 、 参数的最优值为1.8、0.8和0.27。
图1. 167个卤代烃当a=1.7时,b、y的优化结果
图2. 167个卤代烃当a=1.8时,b、y的优化结果
图3. 167个卤代烃当a=1.9时,b、y的优化结果
(2)54个芳香烃的优化,首先寻找构建预测有机物标准熵的3元回归模型 、 、 的最优值。通过运算初步确定 、 、 的取值范围为[4.4,4.8],[0.2.,0.6]和[0.29,0.33]。将 、 、 取不同值时所得的连接性指数mχ’、 mχ”,并且使用matlab的最佳子变量集合法获得3参数模型,通过比较不同模型对有机物标准熵预测值的相关性R值,最终确定 、 、 参数的最优值为4.5、0.4和0.32。