摘 要随着科技的进步,我们处于大数据时代,面对着“信息爆炸”。在信息技术,复杂网络、遥感技术、电子商务、金融安全等各个方面不断产生了大数据。数据挖掘、人工智能、机器学习等领域的出现对统计学提出了更高的要求,也带了机会和挑战。本论文主要介绍了数据分析的步骤,数据分析的主要方法,并结合案例对相关方法给出了具体应用。同时,用R编程对相关的理论进行了验证。88967
毕业论文关键词:大数据; 数据挖掘; 数据分析; 机器学习
With the progress of science and technology, we are in the era of large data, in the face of "information explosion。" In the information technology, complex networks, remote sensing technology, e-commerce, financial security and other aspects continue to produce large data。 Data mining, artificial intelligence, machine learning and other areas of the emergence of a higher demand for statistics, but also with opportunities and challenges。 This paper mainly introduces the steps of data analysis, the main methods of data analysis, and gives the concrete application of the relevant method in combination with the case。 At the same time, R programming is used to verify the relevant theory。
Key words: large data; data mining; data analysis; machine learning
目 录
一 研究背景以及历史意义 4
二 研究的内容和要解决源Q于D优G尔X论V文Y网wwW.yOueRw.com 原文+QQ75201`8766 的主要问题 5
三 数据的展示和描述方法 5
3。1 条形图 5
3。2 饼图 6
3。3 直方图 6
3。4 盒形图 6
3。5 茎叶图 6
3。6 散点图 6
四 数据分析的各类方法 7
4。1 回归方法 7
4。2 回归分析主要解决的问题 8
4。3 回归分析步骤 8
4。4 回归分析的有效性和注意事项 8
4。5 回归分析常用的几个概念 8
4。6 方法步骤 8
4。7 分类方法 10
4。8 聚类方法 10
4。9 主成分分析方法 11
4。10 因子分析方法 14
五 具体案例以及实现 15
一 研究背景以及历史意义
随着云计算与移动互联网和物联网等新一代信息技术的创新和应用普及,人类要处理的数据的量越来越大。人类将飞速进入大数据时代。几乎所有领域都有大数据,但是未经处理的大数据就是海量碎片化的信息数据,巨量资料。数据巨大复杂,但是却让我们难以很快意识到数据里面所展现给我们的重要的信息。为了给决策者或者普通百姓展现出很容易接受的数据形式以及海量数据里面所体现的规律和内涵,我们需要将大量数据聚集起来,通过合理而有科学的数据分析方法,将我们接触到的“一手数据”,进行初期的洗涤,筛选,进而科学的分析,最终合成便于存储,分析,查询的形式。这是大数据时代数据分析的主要目的与意义。From优T尔K论M文L网wWw.YouERw.com 加QQ75201^8766