b)排列
排列的目的在于控制不同随机变量样本之间的相关性,在排列过程中先形成一个K×N阶的顺序矩阵L,该矩阵的每一行的元素值代表初始抽样矩阵X对应行的元素应该排列的位置[12]。X的元素排列后形成最终的抽样矩阵,最简单的排列为随机排列,另外还有改进排列技术例如Cholesky分解、rank Gram-Schmidt算法等。
2。2拉丁超立方重要抽样法
基于拉丁超立方抽样理论,为了考虑随机变量概率分布的尾部特性,本文采用拉丁超立方重要抽样法,在对随机变量分层后,不再抽取中点,而是对分层后的区间进一步分区间,然后根据随机变量的概率密度函数计算出对子区间进一步分区间所形成的各个边界的概率密度值,选取概率密度值最大的点作为样本点,进而对所抽出的样本进行排序以满足相关性的要求。抽样流程图如图2-2所示。
图2-2 拉丁超立方重要抽样法抽样流程图
与传统拉丁超立方抽样法相比,本文所采用的拉丁超立方重要抽样法在分层后选择了概率密度值最大的点作为该层的样本点,进一步提高了样本的有效性且选择方法具有普适性。为了验证拉丁超立方重要抽样法的优点,选择服从双参数的威布尔分布的随机变量,形状参数为2。7,尺度参数为0。15,其理论的期望值为0。1334,理论的标准差为0。0533,比较n为不同值的拉丁超立方重要抽样法及传统拉丁超立方抽样法在抽1000个样本时的时间、期望值误差百分数及标准差误差百分数。
表21不同抽样方法时间及精度对比
抽样方法 抽样时间(s) 期望值误差百分数(%) 标准差误差百分数(%)
拉丁超立方重要抽样法 n=10 0。02410702 0。092070017 3。359042574
n=20 0。03246138 0。04478413 3。200128812
n=30 0。03992372 0。002489358 3。042837714
n=40 0。04835976 0。049765562 2。887429264
n=50 0。05599326 0。096993851 2。733258279
传统拉丁超立方抽样法 0。01173138 0。14417374 3。663944248
从上表中可以看出,拉丁超立方重要抽样法的抽样时间随着n的增加而增加,并且抽样时间要比传统拉丁超立方抽样法抽样时间长;拉丁超立方重要抽样法的期望值误差百分数随着n的增加先减少后增加,但总体上是小于传统拉丁超立方抽样法的期望值误差百分数;拉丁超立方重要抽样法的标准差误差百分数随着n的增加逐步减少,总体上也是小于传统拉丁超立方抽样法的标准差误差百分数。因而拉丁超立方重要抽样法在速度上虽然稍慢于传统拉丁超立方抽样法,但抽样精度要高于传统拉丁超立方抽样法的抽样精度,说明了拉丁超立方重要抽样法的有效性。
2。3基于拉丁超立方重要抽样的概率潮流计算文献综述
由已知的样本点集合求解待求随机变量的分布密度函数问题一般可使用参数估计和非参数估计两种方法。
参数估计有参数回归分析和参数判别分析两种。在参数回归分析中,一般假定数据分布符合某种特定的线性或指数性性态,之后便可根据目标函数求出特定的解,即确定回归模型中的未知参数。在参数判别分析中,对于具有判别依据的随机数据样本,一般需要在各种可能类别中服从特定的分布。但是,从经验上来说,这种参数模型的假定与实际的物理模型中间有很大的差距,所以这些方法都难以取得令人满意的结果。 大规模风电接入的概率潮流研究(4):http://www.youerw.com/zidonghua/lunwen_99619.html