摘要:网络性能测量是网络行为分析的基础。本文对网络性能测量的相关内容以及网络性能指标的测量与分析进行了系统的介绍,并对网络性能测量的下一步发展进行了展望。
关键字:网络性能测量技术性能指标分析与研究
1。引言
随着Internet技术和网络业务的飞速发展,用论文网户对网络资源的需求空前增长,网络也变得越来越复杂。不断增加的网络用户和应用,导致网络负担沉重,网络设备超负荷运转,从而引起网络性能下降。这就需要对网络的性能指标进行提取与分析,对网络性能进行改善和提高。因此网络性能测量便应运而生。发现网络瓶颈,优化网络配置,并进一步发现网络中可能存在的潜在危险,更加有效地进行网络性能管理,提供网络服务质量的验证和控制,对服务提供商的服务质量指标进行量化。比较和验证,是网络性能测量的主要目的。
2。网络性能测量的概念
2。1网络性能的概念
网络性能可以采用以下方式定义[1]:网络性能是对一系列对于运营商有意义的,并可用于系统设计。配置。操作和维护的参数进行测量所得到的结果。可见,网络性能是与终端性能以及用户的操作无关的,是网络本身特性的体现,可以由一系列的性能参数来测量和描述。
2。2网络性能参数的概念
对网络性能进行度量和描述的工具就是网络性能参数。IETF和ITU-T都各自定义了一套性能参数,并且还在不断的补充和修订之中。
2。2。1性能参数的制定原则
网络性能参数的制定必须遵循如下几个原则:
1)性能参数必须是具体的和有明确定义的;
2)性能参数的测量方法对于同一参数必须具有可重复性,即在相同条件下多次使用该方法所获得的测量结果应该相同;
3)性能参数必须具有公平性,即对同种网络的测量结果不应有差异而对不同网络的测量结果则应出现差异;
4)性能参数必须有助于用户和运营商了解他们所使用或提供的IP网络性能;
5)性能参数必须排除人为因素;
2。2。2ITU-T定义的IP网络性能参数
ITU-T对IP网络性能参数的定义[2]包括:
1)IP包传输延迟(PacketTransferDelay,IPTD)
2)IP包时延变化(IPPacketDelayVariation,IPDV)
3)IP包误差率(IPPacketErrorRateIPER)
4)IP包丢失率(IPPacketLassRate,IPLR)
5)虚假IP包率(SpuriousIPPacketRate)
6)流量参数(Flowrelatedparameters)
7)业务可用性(IPServiceAvailability)
2。2。3IETF定义的IP网络性能参数
IETF将性能参数[3]称为度量(Metric)。由IPPM(IPPerformanceMetrics)工作组来负责网络性能方面的研究及性能参数的制定。IETF对IP网络性能参数的定义包括:
1)IP连接性
2)IP包传送时延
3)IP包丢失率
4)IP包时延变化
5)流量参数
2。3网络性能结构模型
从空间的角度来看,网络整体性能可以分为两种结构:立体结构模型和水平结构模型。
2。3。1立体结构模型
IP网络就其协议栈来说是一个层次化的网络,因此,对IP网络性能的研究也可以按照一种自上而下的方法进行。可以以IP层的性能为基础,来研究IP层不同性能与上层不同应用性能之间的映射关系。
2。3。2水平结构模型
对于网络的性能,用户主要关心的是端到端的性能,因此从用户的角度来看,可以利用水平结构模型来对IP网络的端到端性能进行分析。
3。网络性能测量的方法
网络性能测量涉及到许多内容,如采用主动方式还是被动方式进行测量;发送测量包的类型;发送与截取测量包的采样方式;所采用的测量体系结构是集中式还是分布式等等。
3。1测量包
网络性能测量中,影响测量结果的一个重要因素就是测量数据包的类型。
3。1。1P类型包
类型P是对IP包类型的一种通用的声明。只要一个性能参数的值取决于对测量中采用的包的类型,那么参数的名称一定要包含一个具体的类型声明。
3。1。2标准形式的测量包
在定义一个网络性能参数时,应默认测量中使用的是标准类型的包。比如可以定义一个IP连通性度量为:IP某字段为0的标准形式的P类型IP连通性“。在实际测量中,很多情况下包长会影响绝大多数性能参数的测量结果,包长的变化对于不同目的的测量来说影响也会不一样。
3。2主动测量与被动测量方式
最常见的IP网络性能测量方法有两类:主动测量和被动测量。这两种方法的作用和特点不同,可以相互作为补充。
3。2。1主动测量
主动测量是在选定的测量点上利用测量工具有目的地主动产生测量流量,注入网络,并根据测量数据流的传送情况来分析网络的性能。主动测量的优点是对测量过程的可控性比较高,灵活。机动,易于进行端到端的性能测量;缺点是注入的测量流量会改变网络本身的运行情况,使得测量的结果与实际情况存在一定的偏差,而且测量流量还会增加网络负担。主动测量在性能参数的测量中应用十分广泛,目前大多数测量系统都涉及到主动测量。
要对一个网络进行主动测量,需要一个测量系统,这种主动测量系统一般包括以下四个部分:测量节点(探针)。中心服务器。中心数据库和分析服务器。有中心服务器对测量节点进行控制,由测量节点执行测量任务,测量数据由中心数据库保存,数据分析则由分析服务器完成。
3。2。2被动测量
被动测量是指在链路或设备(如路由器,交换机等)上利用测量设备对网络进行监测,而不需要产生多余流量的测量方法。被动测量的优点在于理论上它不产生多余流量,不会增加网络负担;其缺点在于被动测量基本上是对单个设备的监测,很难对网络端到端的性能进行分析,并且可能实时采集的数据量过大,另外还存在用户数据泄漏等安全性和隐私问题。
被动测量非常适合用来进行流量测量。
3。2。3主动测量与被动测量的结合
主动测量与被动测量各有其优。缺点,而且对于不同的性能参数来说,主动测量和被动测量也都有其各自的用途。因此,将主动测量与被动测量相结合将会给网络性能测量带来新的发展。
3。3测量中的抽样
3。3。1抽样概念
抽样,也叫采样,抽样的特性是由抽样过程所服从的分布函数所决定的。研究抽样,主要就是研究其分布函数。对于主动测量,其抽样是指发送测量数据包的过程;对于被动测量来说,抽样则是指从业务流量中采集测量数据的过程。
3。3。2抽样方法
依据抽样时间间隔所服从的分布,抽样方法可分为很多种,目前比较常用的抽样方法是周期抽样。随机附加抽样和泊松抽样[4]。周期抽样是一种最简单的抽样方式,每隔固定时间产生一次抽样。因为简单,所以应用的很多。但它存在以下一些缺点:测量容易具有周期性。具有很强的可预测性。会使被测网络陷入一种同步状态。随机附加抽样的抽样间隔的产生是相互独立的,并服从某种分布函数,这种抽样方法的优劣取决于分布函数:当时间间隔以概率1取某个常数,那么该抽样就退化为周期抽样。随机附加抽样的主要优点在于其抽样间隔是随机产生的,因此可以避免对网络产生同步效应,它的主要缺点是由于抽样不是以固定间隔进行,从而导致频域分析复杂化。
在RFC2330中,推荐泊松抽样,它的时间间隔符合泊松分布,它的优点是:能够实现对测量结果的无偏估计。测量结果不可预测。不会产生同步现象。但是,由于指数函数是无界的,因此泊松抽样有可能产生很长的抽样间隔,因此,实际应用中可以限定一个最大间隔值,以加速抽样过程的收敛。
4。性能指标的测量与分析
4。1连接性
连接性[5]也称可用性。连通性或者可达性,严格说应该是网络的基本能力或属性,不能称为性能,但ITU-T建议可以用一些方法进行定量的测量。目前还提出了连通率的概念,根据连通率的分布状况建立拟合模型。
4。2延迟
延迟的定义是[6]:IP包穿越一个或多个网段所经历的时间。延迟由固定延迟和可变延迟两部分组成[7][8]。固定延迟基本不变,由传播延迟和传输延迟构成;可变延迟由中间路由器处理延迟和排队等待延迟两部分构成。对于单向延迟测量要求时钟严格同步,这在实际的测量中很难做到,许多测量方案都采用往返延迟,以避开时钟同步问题。
往返延迟的测量方法是:入口路由器将测量包打上时戳后,发送到出口路由器。出口路由器一接收到测量包便打上时戳,随后立即使该数据包原路返回。入口路由器接收到返回的数据包之后就可以评估路径的端到端时延。
4。3丢包率
丢包率的定义是[9]:丢失的IP包与所有的IP包的比值。许多因素会导致数据包在网络上传输时被丢弃,例如数据包的大小以及数据发送时链路的拥塞状况等。
为了评估网络的丢包率,一般采用直接发送测量包来进行测量。对丢包率进行准确的评估与预测则需要一定的数学模型。目前评估网络丢包率的模型主要有贝努利模型。马尔可夫模型和隐马尔可夫模型等等[10]。贝努利模型是独立同分布的,即假定每个数据包在网络上传输时被丢弃的概率是不相关的,因此它比较简单但预测的准确度以及可靠性都不太理想。但是,由于先进先出的排队方式的采用,使得包丢失之间有很强的相关性,即在传输过程中,包被丢失受上一个包丢失的影响相当大。假定用随机变量Xi代表包的丢失事件,Xi=0表示包丢失,而Xi=1表
示包未丢失。则第i个包丢失的概率为P[Xi|Xi-1,Xi-2,…Xi-n],Xi-1,Xi-2,。。。Xi-n取所有的组合情况。当N=2时,该Markov链退化为著名的Gilbert模型。隐马尔可夫模型是对马尔可夫模型的改进。
MayaYajnik等人所作的172小时的测量试验[11]结果表明,在不同的数据采样间隔下(20ms,40ms,80ms,160ms)采用三种不同的丢包率分析模型进行分析得到的结果完全不同,在不同的估计精确度的要求下实验结果也各有不同。因此,目前需要能够精确描述丢包率的数学模型。
4。4带宽
带宽一般分为瓶颈带宽和可用带宽。瓶颈带宽是指当一条路径(通路)中没有其它背景流量时,网络能够提供的最大的吞吐量。对瓶颈带宽的测量一般采用包对(packetpair)技术,但是由于交叉流量的存在会出现时间压缩“或时间延伸“现象,从而会引起瓶颈带宽的高估或低估。另外,还有包列等其它测量技术。
可用带宽是指在网络路径(通路)存在背景流量的情况下,能够提供给某个业务的最大吞吐量。因为背景流量的出现与否及其占用的带宽都是随机的,所以可用带宽的测量比较困难。一般采用根据单向延迟变化情况可用带宽进行逼近。其基本思想是:当以大于可用带宽的速率发送测量包时,单向延迟会呈现增大趋势,而以小于可用带宽的速率发送测量包时,单向延迟不会变化。所以,发送端可以根据上一次发送测量包时单向延迟的变化情况动态调整此次发送测量包的速率,直到单向延迟不再发生增大趋势为止,然后用最近两次发送测量包速率的平均值来估计可用带宽
瓶颈带宽反映了路径的静态特征,而可用带宽真正反映了在某一段时间内链路的实际通信能力,所以可用带宽的测量具有更重要的意义。
4。5流量参数
ITU-T提出两种流量参数作为参考:一种是以一段时间间隔内在测量点上观测到的所有传输成功的IP包数量除以时间间隔,即包吞吐量;另一种是字节吞吐量:用传输成功的IP包中总字节数除以时间间隔。
Internet业务量的高突发性以及网络的异构性,使得网络呈现复杂的非线性,建立流量模型越发变得重要。早期的网络流量模型,是经典流量模型,也即借鉴PSTN的流量模型,用poisson模型描述数据网络的流量,以及后来的分组火车模型,Markov模型等等。随着网络流量子相似性的发现,自相似模型的流量建模研究也取得了不少进展和得到了广泛的应用,譬如分形布朗运动模型和分形高斯噪声模型以及小波理论分析等等。高速网络技术的发展使得对巨大的网络流量进行直接测量几乎不可能,同时,大量的流量日志也使流量分析变得相当困难。为了解决这一问题,近几年,流量抽样测量研究已成为高速网络流量测量的研究重点。
5.网络性能测量的展望
网络性能测量中还有许多关键技术值得研究。例如:单向测量中的时钟同步问题;主动测量与被动测量的抽样算法研究;多种测量工具之间的协同工作;网络测量体系结构的搭建;性能指标的量化问题;性能指标的模型化分析[12]~[16];对网络未来状况进行趋势预测;对海量测量数据进行数据挖掘或者利用已有的模型(Petri网。自相似性。排队论)研究其自相似性特征[17]~[19];测量与分析结果的可视化,以及由测量所引起的安全性问题等等都是目前和今后所要研究的重要内容。随着网络性能相关理论。测量方法。分析模型研究的逐渐深入。各种测量工具的不断出现以及大型测量项目的不断开展,人们对网络的认识会越来越深刻,从而不断地推动网络技术向前发展。
6.结束语:
本文对目前网络性能测量技术的主要方面进行了介绍和分析并对未来网络性能测量的研究重点进行了展望。
参考文献
[1]ITU-T建议1。350
[2]ITU-T,建议Y1540
[3]IETF,RFC2330,“FrameworkforIPPerformanceMetrics“TableofContents6
[4]IETF,RFC2330,“FrameworkforIPPerformanceMetrics“TableofContents11
[5]IETF,RFC2678,“IPPMMetricsMeasuringConnectivity“
[5]IETF,RFC2679,“AOne-wayDelayMetricforIPPM“
[6]IETF,RFC2681,“ARound-tripDelayMetricforIPPM“
[7]IETF。RFC3393,“IPPacketDelayVariationMetricforIPPM“
PDF文件使用“pdfFactoryPro“试用版本创建www。fineprint。com。cn
http://www。paper。edu。cn
[8]IETF,RFC2680,“AOne-wayPacketLossMetricforIPPM“
[9]H。SanneckandG。CarleGMDFokus,Kaiserin-Augusta-Allee31,D-10589Berlin,Germany,“AFramework
ModelforPacketLossMetricsBasedonLossRunlengths“
[10]MayaYajnik,SueMoon,JimKuroseandDonTowsley,“MeasurementandModellingoftheTemporal
DependenceinPacketLoss“,DepartmentofComputerScienceUniversityofMassachusettsAmherst,MA01003
USA
[11]JacobsonV,“PathcharATooltoInferCharacteristicsofInternetPaths。“
[12]LOPRESTIF,DUFFIELDNG,HOROWITZJ,etal。Multicast-basedInferenceofNetworkInternet-Delay
Distributions“。UniversityofMassachusetts,Amherst,ComputerScience,TechnicalReportUM-CS-1999-055,
1999。
[13]DUFFIELDNG,LOPRESTIF。Multicastinferenceofpacketdelayvarianceatinteriornetworklinks“。
IEEEINFOCOM2000[C]。TelAvivIsrael,2000。
[14]HUANGL,SEZAKIK。End-to-endInternetDelayDynamics“。IEICETechnicalReportofCQWG,May
2000。
[15]OHSAKIH,MURATAM,MIYAHARAH,Modelingend-to-endpacketdelaydynamicsoftheInternet“
usingsystemidentification[A]。InternationalTeletrafficCongress17[C]。SalvadordaBahia,Brazil,2001。
[16]SueB。Moon,“MeasurementandAnalysisofEnd-to-EndDelayandLossinTheInternet“
[17]J。-C。Bolot。End-to-endpacketdelayandlossbehaviorintheInternet“。InProceedingsofACMSIGCOMM,
SanFrancisco,August1993。
[18]V。Paxson,MeasurementsandAnalysisofEnd-to-EndInternetDynamics“,Ph。D。dissertation,1997。
[19]张宏莉,方滨兴,胡铭曾,姜誉,詹春艳,张树峰,Internet测量与分析综述“,软件学报,2003年1
月,Vol。14,No。