4。 结论 16
参考文献 18
致谢 19
1。 绪论
1。1。 问题背景
竞技体育比赛是受关注度最高的项目之一,其最大的特点就是不可预测性, 因为强度高,节奏快的比赛,往往不到最后一秒,比赛的结果都有可能是不同的, 影响胜负的因素有很多,实力、临场发挥、心理状态、突发事件等都是会影响最 后胜负的归属,虽然有的因素看似不起眼,但每个因素都有可能会导致比赛结果 的不同,也就导致了比赛的结果的难以预测。
近年来,体育竞技的分析以及预测比赛结果已经演变成为一个重要的领域。 一方面,球队的老板每年都会花费大量的钱财在各自的球队身上,希望通过分析 预测比赛结果及其影响因素以便可以避免在那些对球队实力没有帮助的球员身 上耗费资金,并且通过各种方式来提高球队的获胜几率,最终可以提升获得比赛 胜利的几率;另一方面,从商业效益上看,因为有无数的球迷会想在整个赛季赢 得比赛竞猜的胜利,而相关的行业就会需要对数据及其他的相关因素进行综合的 考虑分析并预测哪个球队获得冠军的概率更高,以便设计出对应的计划来利用球 迷对比赛获胜者的竞猜以获取巨大的收益,那么同样的,对于那些球迷来说,既 希望自己可以赢得比赛竞猜的胜利,也希望自己赢得胜利可以获取一笔意外之 财。论文网
1。2。 问题意义
目前,由于体育竞技多为团队之间的对抗,研究者主要使用大量的概率统计 模型并结合队员的实力因素、临场发挥、队员之间的配合等因素去对比赛进行分 析,以便可以比较准确的预测出系列比赛之间的胜负,赛季的冠军,可以更加准 确的分析出队员对胜负的影响,对球队的贡献。在现在用于预测篮球联赛的方法 主要有:基于贝叶斯网络来进行篮球联赛比分的预测、基于 Fisher 模型预测篮球 联赛等。但每种预测的方法都有各自的缺陷,例如:基于贝叶斯网络来进行篮球 联赛比分的预测,需要结合队员的实力,临场发挥、球员的心理状态突发事件等 各种因素,但这些因素的判断是需要取决于个人的主观判断其重要程度的,那么 这样的预测就会难以有一个标准。
各种不同的运动预测获胜者的研究表明,可能存在一个体育结果预测精度的上限运动, 大概是在 70%到 80%。利用决策树对篮球联赛的获胜者进行预测,主要是利用已 有的数据进行处理,从数据中提取有用的特征进行预测,可以避免主观上的判断。 比起其他算法,决策树有很多优点,其中最主要的一个优点是决策过程是机器和 人都能看懂的,我们使用机器学习到的模型就能完成预测任务;决策树的另一个 优点则是它能处理多种不同类型的特征。另外,决策树算法是可以利用 Python 进行的,而 Python,从特性的观点来看,Python 丰富的工具集使其介于传统的 脚本语言和系统语言之间。Python 提供了所有脚本语言的简单性和易用性,并且 具有的高级软件工程工具只有在编译语言中才能找到的。运行 Python 程序,只 需要简单地键入 Python 程序并运行就可以了。不需要编译和链接等中间步骤就
可以立即执行程序,往往在修改代码后能立即看到程序改变后的效果。 决策树起源于概念学习系统 CLS ( Concept Learning System)[10],其是在已
知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于 零的概率,评价项目风险,判断项目可行性的决策分析方法,决策树也是直观运 用概率分析的一种图解法。决策树可高度自动化地建立起容易被用户所理解的模 型,而且决策树系统具有较好地处理缺省数据及带有噪声数据等能力。