摘要随着社会经济的飞速发展,空气质量也随之恶化,各种空气质量检测数据应运而生, 而空气质量指数 AQI 则是空气质量最直接的反应。本文利用统计学方法对南京市 2015 年 的空气质量指数以及与其紧密相关的六项基本检测指标利用 R 语言编程进行相应的数据 分析。首先对六项基本检测中的 PM2。5 与其余五项进行相关分析得到具体关系,并以 PM2。5 为响应变量进行多元线性回归建模并进行一系列模型分析和预测。之后对空气质量指数 进行一元时间序列建模,选取合适的 ARMA 模型进行拟合最终得出短期预测结果。76143
毕业论文关键词 AQI R 语言 相关分析 多元线性回归 时间序列分析
Title The AQI Data Analysis based on R shiny package
Abstract With the rapid development of social economy,the air quality has been deteriorated and various air quality data came into being。Among them,the air quality index can manifest the condition of air quality directly。In this paper,we use statistical method to do the research of 2015 Nanjing’s air quality index and six basic air indicators which are closely related to AQI,using R language to write codes for the data analysis。First of all, we try to figure out the relation ships between PM2。5 and the other air quality data,using correlation analysis。Then we put PM2。5 as response variable to build the multivariable linear regression model and do model analysis and prediction。At last,the time series analysis method is applied to model the air quality index,we select the suitable model to fit the data and forecast short term results。
Keywords AQI R language Correlation Analysis Multivariable Linear Regression Time Series Analysis
目 次
1 绪论 1
1。1 课题的研究背景和意义 1
1。2 相关分析的简单介绍 1
1。2。1 相关性的概念 1
1。2。2 相关性检验 2
1。3 回归分析模型的简单介绍 3
1。3。1 多元线性回归模型的一般形式 3
1。3。2 多元线性回归模型的基本假定 3
1。4 时间序列分析模型的简单介绍 4
1。5 R 语言的简单介绍 5
1。6 本文的主要工作及内容安排 6
2 相关分析在空气质量指数分析中的应用 7
2。1 相关分析散点图 7
2。2 相关系数的计算和检验 9
2。3 相关关系的可视化 10
2。4 本章小结 11
3 回归分析模型在空气质量指数分析中的应用 12
3。1 参数估计原理 12
3。2 拟合回归模型 12
3。3 线性回归方程的检验 13
3。3。1 回归方程的显著性检验 13
3。3。2 回归系数的显著性检验 14
3。3。3 拟合优度 14
3。4 回归诊断