金融论坛数据挖掘系统的设计与实现
时间:2024-02-18 21:45 来源:毕业论文 作者:毕业论文 点击:次
摘 要: 二十一世纪的到来,人们迈入了信息时代,各种信息层出不穷。其中金融论坛评论数据非常之多,要想在这些评论数据中提取出有用的信息并且把他们用图标,模型等展示出来,越来越成为需要研究的目标。本设计所采用爬虫技术对数据进行挖掘,数据库技术对数据进行存储,机器学习方法对数据进行分析。主要过程是利用多线程爬虫对数据进行筛选并且存入数据库。然后对存入数据库的数据进行进一步的分析,例如中文分词,情感分析等,并且把分析后的结果再存入数据库。最后,利用web浏览器进行可视化输出,展示在用户面前,从而为用户提供数据参考。93934 毕业论文关键词:金融评论,机器学习,情感分析,朴素贝叶斯,django ABSTRACT: With the gradual development of financial electronic construction, how to effectively and rationally use the data, to maximize the role of data, the data into a meaningful analysis and reporting applications such as information, and found that knowledge , So as to provide a basis for scientific decision-making, which is placed in front of us a pressing issue。 Application of data mining technology and financial business integration, to build a set of investors for the whole process of science, objective and quantitative technical support system is a good solution。The design uses reptile technology to mine data, database technology to store data, machine learning methods to analyze the data。 The main process is the use of multi-threaded crawler to filter the data and stored in the database。 And then the data stored in the database for further analysis, such as Chinese word segmentation, emotional analysis, and the results of the analysis and then into the database。 Finally, the use of web browser visual output, displayed in front of the user, so as to provide users with data reference。 Keywords: financial review, machine learning, emotional analysis, naive Bayesian, django 目录 1 引言 3 1。1 研究背景和意义 3 1。2 系统开发工具简介 3 1。3 开发环境及配置 4 1。3。1 本系统原始运行环境 4 1。3。2 本系统推荐运行环境 4 1。4 论文的组织结构 4 2。1 中文分词技术 5 2。2 朴素贝叶斯 8 2。3 基于朴素贝叶斯算法的情感分析 8 3 需求分析与总体设计 10 3。1 界面分析 10 3。2 功能分析 10 3。2。1 功能结构图 11 3。2。2 数据存储 12 3。2。3 情感分析 14 3。2。4 可视化输出 14 3。4 故障处理 15 3。5 用例图 16 3。6 类图 16 3。7 数据库设计 17 3。7。1 E-R图设计 17 3。7。2 数据库设计 18 3。8 主界面 20 4 详细设计 23 (责任编辑:qin) |