聚类分析在各行各业的应用已经十分广泛,但是在证券投资行业却仍有很大的发展空间,特别是在国内!国内聚类分析指标大部分只是局限于公司的盈利情况,而不能全面反映股票特征,所以深层次讨论聚类分析在证券的应用很有必要!

2 聚类分析模型简介

2。1 聚类分析的定义

“物以类聚”这个问题在社会经济的研究中十分普遍,例如,市场营销中的市场细分和客户细分的问题。大型商厦收集客户的人口特征消费行为以及喜好方面的数据,并希望对这些客户进行特征分析。可以从客户分类入手,根据客户的年龄,职业,收入,消费金额,消费频率,喜好等方面进行单变量或者多变量的客户分组。这种分组是极为常见的客户细分方式,但不足的是客户群划分带有明显的主观色彩,需中的客户在某些特征方要有丰富的行业经验才能得出比较合理理想的客户细分,否则得到的分组可能无法充分反映和展现客户的特点。主要表现在:同一客户细分段中的客户在某些特征方面并不相似,而不同客户细分段面却又很相似。因此,这种客户细分并没有起到划分客户群的作用。为了解决该问题,希望从数据本身出发,充分利用数据进行客户分组,使得诸多特征有相似性的客户能被分在同一组内,而不相似的客户能被分到另一些组中。这时候就可以采用聚类分析方法。

在实际研究中,既可以对样本个体进行聚类,也可以对研究变量进行聚类,对样本个体进行聚类通常称为Q型聚类,对研究变量进行的聚类称为R型聚类。在市场研究中,Q型聚类常用于市场细分研究,寻找不同目标市场及其构成者特征,R型聚类可以用于确定产品各属性的同质性。

聚类分析的方法很多,常用的有系统聚类、动态聚类。动态聚类的原理是先对分类事物作一个初始的粗糙的分类,然后在根据某种原则对初始分类进行修改,直至分类被认为比较合理为止。

系统聚类除了要定义事物之间的亲疏程度指标,还要定义类与类之间亲疏程度指标,并且要导出求取类间亲疏指标值的递推公式。系统聚类初始,先把所有待分类事物各自看成独立的一类,求出两两之间的亲疏指标值,把关系最为亲密的两类合并成一个新类,然后计算新类与原有各类之间的亲疏指标值,再把其中关系最为密切的两类合并,如此反复进行,直到最终所有待分类事物合并成一个大类为止。最终绘成一幅系统聚类的谱系图,再根据一定的原则确定最终分类结果。文献综述

从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用 值、 中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。

2。2 明氏距离

设有 个样品, 个指标,每个样品都有这 个指标的观察值,设第 个样品的第 个指标的观察值为 ,把  样品看成 维空间中的 个点,则两个样品间亲疏程度可用 维空间中两点的距离来度量。令 表示样品 与 的距离。定义距离公式,本文采用明氏距离[2]。

明氏距离[2]:         

 当 时,明氏距离变为绝对距离:     

当 时,明氏距离为欧氏距离:       

当 时,明氏距离变为切比雪夫距离: 

设  表示第  种股票第  个指标的值。 表示第 种股票的距离,我们定义距离越近表示两种股票的性质越接近,可以归为一类。

2。3 聚类分析评价方法与步骤

聚类分析的职能是建立一种分类方法,它是将一批样品或变量,按照他们在性质上的亲疏程度进行分类。凡是具有数值特征的变量和样品都可以采用系统聚类方法,选择不同的距离和聚类方法可以获得满意的数值分类效果。

上一篇:RP2原则江苏省城镇居民消费函数模型
下一篇:随机因素对logistic-CA城镇用地扩张模拟模型模拟精度影响的敏感度分析

数形结合在中学数学中的...

浙江省工业企业发展的因子分析

杭州中考历年圆题型分析

杭州历年中考三角形的题型分析

论数形结合在中学数学教育中的应用

小学数学教师在学生心目中的形象

向量法在高中数学中的应用矢量法

麦秸秆还田和沼液灌溉对...

张洁小说《无字》中的女性意识

LiMn1-xFexPO4正极材料合成及充放电性能研究

我国风险投资的发展现状问题及对策分析

互联网教育”变革路径研究进展【7972字】

老年2型糖尿病患者运动疗...

新課改下小學语文洧效阅...

ASP.net+sqlserver企业设备管理系统设计与开发

安康汉江网讯

网络语言“XX体”研究