4。1 爬虫设计 23
4。2 情感分类软件(c#) 24
4。3 训练数据生成贝叶斯分类器 26
5 系统实现 27
5。1 主函数模块 27
5。2 生成分类器模块 28
5。3 情感分析计算代码 29
6 试验结果分析 29
6。1 单元测试 29
6。2 运行结果 30
7 系统安全性 33
7。1 xss保护 33
7。2 csrf保护 34
7。3 sql注入保护 34
结论 35
参考文献 36
致 谢 37
1 引言
1。1 研究背景和意义
需求是一切新技术的源泉和动力。随着经济全球化的发展,许多物理学家,科学家,数学家,计算机学家都进入美国顶尖金融领域工作。他们用新颖的方法和技术去研究股票指数,利率,期权,分红等问题,并且研究出了许多优秀的结论与方法。论文网
在出现数据挖掘以前,也有过关于数据分析的研究。虽然所能处理的数据量很小,通常是以建立模型。
调整参数所得到的结论只能是暂时的,局部的,不完善的。但是用数据挖掘的方法,确是一种全新的,长久性的方法。不是只是从数据库中查询方法,直接得出所需要的数据。而是通过数据里所潜藏的知识,去挖掘出辅助人进行决策的信息。
多年来,财务公司数量迅速增加,数据日益增多,一方面,随着计算机技术的发展,使得数据存储硬件的价格在不断降低,数据采集的成本也越来越低。另一方面,而由于很多股票投资者和研究者不断的获取大量的数据,但是这些数据都是没有规律的数据。人们收集数据的存储量正在成指数级上涨。面对突然出现的的巨大信息浪潮,人们发现很难以消化和吸收。
金融论坛里包含很多金融信息,反映了金融市场的热点、情绪,这些信息也会影响金融市场的走势,因此该系统的设计与实现,可以为金融从业人士提供参考。该系统主要以东方财富的股票数据论坛作为数据源,在实际需求中可以为不同的论坛定制不同的系统,所改动的代码很少。因此,本设计对于投资者和金融行业从业人士的理财与投资具有重要的指导意义。[1]
1。2 系统开发工具简介
(1) Sublime Text
sumblime text 是一个文本编辑器,也是web网页编辑器,设计初衷就是为了更好的扩展插件。
sumblime text 具有好看的ui和丰富的功能,例如代码快捷块等。可定制性非常高,而且跨平台,支持多种os。
(2)PyCharm
PyCharm是一个py IDE,可以提高开发者的编程效率,从而为开发者节省时间。最终提供工作的效率。
1。3 开发环境及配置
本设计用到了Django (Python Web 框架)、Bootstrap、Echart 、Scrapy、这些工具。
以python27作为程序设计语言,搭建在windows系统上,需要安装ntlk语言包,jieba分词,django包等等。如果需要完整的依赖,可以向本作者索要完整的依赖文件。[2]
1。3。1 本系统原始运行环境
硬件环境: 华硕笔记本x45v,因特尔i3处理器,gt610m显卡,4g内存条。