数据分析研究数据搜集和挖掘可视化
时间:2018-12-02 17:07 来源:毕业论文 作者:毕业论文 点击:次
摘要随着社会的发展,数据逐渐成为越来越重要的资源,很多人希望了解手中的数据然而并不懂专业技术。 一个简单易用的数据分析及可视化平台可以帮助非专业人士方便地了解数据,从数据中发现有价值信息。 本课题研究了数据分析的基本方法、数据可视化的常见形式、两种聚类算法和基于协同过滤的推荐算法,讨论了怎样直观地可视化挖掘结果、做数据可视化时应该注意的问题。最终把这些研究成果集成为一个方便易用的数据分析及可视化平台,具备数据筛选、统计分析、图表绘制、推荐建议等功能。30951 毕业论文关键词 数据分析 数据可视化 Title The research of data analysis: data filtering、mining and visualization Abstract As the development of the society, data is becoming an important resource. The information behind data can give us some valuable advices, so lots of people try to understand the data in hand. However, many of them don’t have the professional skills to do that. As it is, a user-friendly platform for data analysis and visualization can help them a lot. This project researches some common methods of data analysis and data visualization, two algorithms for clustering and one recommending system based on collective filtering. It also makes some efforts to visualize the results of the two clustering methods. In the end, a user-friendly platform was built with functions of data filtering、data visualization、 recommending and clustering. Keywords data analysis、data visualization 目次 1 引言 1 2 数据可视化研究 2 2.1 数据可视化的发展历史和现状 3 2.2 数据可视化的设计原则… 6 2 . 3 数据分析及可视化平台… 8 2.3.1 数据筛选… 9 2.3.2 图表绘制与分析 12 3 推荐系统 16 3.1 推荐系统的应用价值和发展现状16 3.2 本平台的推荐功能18 3.2.1 推荐策略…18 3.2.2 第一步:数据搜集18 3.2.3 第二步:计算兴趣相似度…19 3.2.4 第三步: 给出推荐建议21 3.2.5 应用展示…22 4. 聚类系统23 4.1 层次聚类及可视化23 4.1.1 层次聚类及树形图的设计与实现…24 4.1.2 层次聚类结果及可视化…25 4.2 K-Means 聚类算法26 4.2.1 算法设计与分析…26 4.2.2 在二文平面内展示多文数据27 5. 平台实现31 结论 33 致谢 34 参考文献35 1 引言 本课题的意义主要体现在如下几个方面: 1. 数据逐渐成为一种资源,从数据中发现有价值信息可以帮助人们做出决策。然而很多渴望了解数据的人士,比如企业领导、销售人员等缺少数据处理的专业能力。一个简单易用的平台可以方便他们了解手中掌握的数据。 2. 数据筛选需要可视化图表的反馈,因此数据分析和可视化往往是一个反复交替的过程,一开始很难保证把握数据的特点并做出高质量的图表。本平台简单易用,功能强大,使这种数据筛选、数据分析、可视化、再筛选的过程更加方便,逐步得到更准确的结果。 3. 本平台尝试可视化层次聚类和K-Means 聚类的结果,做出了一些探索。 4. 本平台可以为多种科研实验的数据分析提供帮助,有一定的通用性和实用价值。 (责任编辑:qin) |