在搜寻了相关资料以后,我了解到现有的对篮球比赛结果的预测模型主要有3种:第一种是灰色系统关联模型,第二种是竞赛图理论排序模型,最后一种是灰色理论预测模型。
其中,灰色系统关联模型主要是经过衡量各项技术指标与比赛成绩的关联关系来定义相干度,然后通过构建出衡量球队较量成绩的目标体系,对每支球队的技术做出简要分析,最后给出简单的改进意见。
接着说竞赛图排序模型,这其实是一种穷举的办法,但我们能够经过一系列优化措施,使难以看懂的算法变得浅显易懂,从而确保科学性和准确性,并且不失效率性。再加上灰色模型,对球赛排名等预测的结果就会更加精确。[3]
但总体上说,这些算法都不够精确。现在预测比较准确的是决策树和随机森林算法。
1。3 决策树算法背景介绍
机器学习这个词语是最近才出现的。它涉及的范围比较广。而且它和统计学有着很大的联系。
它基本上是应用于设计和剖析一些能让计算机主动学习的算法,无疑是数据分析领域最为热点的内容。它的算法也主要有:
1、决策树:完全按照对象的特点来制作模型。它主要用在处理区分事物时遇到的困难。
2、回归:通过预测结果与真实情况的比对,来推敲那些可变因素存在的影响的算法。
3、集成:使用不常见的模块来做算法,最后把答案写在一起研究准确性。
决策树算法是球赛预测的主要算法之一。它是使用率很高的分类办法。它属于一种监管学习方法。接下来解释一下监管学习。先实现取出一定量的数据,然后分成好几组,给它们都调配一定的特点,并分类。更重要的是,这些分配的特点都必须早就确定好。因而只要是通过机器学习得到的分类器,都能正确给那些新的事物区分开来。这样的机器学习就被称之为监督学习。并且决策树就是属于这种类型的。它看起来就像是由一系列节点组成的流程图,其中位于上层节点的值将能决定下一步节点的走向。
那么什么是节点呢?决策树由决策节点、状态节点和结果节点三部分组成的。接下来,对这三种节点做出相应的解释。第一,决策点是在已知许多可能实行的方案中进行选择,从而选择出最优的方案。当然,决策树和现实生活中的树一样可能存在很多层。那么可以把它分成好几部分,分别进行判断。最后再选择最佳的方案。第二个节点是状态节点。这其实就是一个中间的过度期一般。我们可以把这些点看成是具备某种经济效果的。然后对这些经济效果进行比较。这需要权衡各种因素,最后选出最好的方案。通过状态节点,我们又引进了一个新的概念,叫做概率枝,也就是决策树的一部分分支,在这些分支上,我们必须注明该状态可能出现的概率。第三个是结果节点,它是最后一步,需要将各个方案的收益值写在节点的右端,方便我们观察比较。
本文主要采取决策树算法。它现在使用最多,而且被大家所公认接受。它主要是通过现在了解和掌握的东西,来推敲未来可能发生某事的可能性。该算法主要通过建立模型,来把要预测的事物的固有特点和真实结果建立联系。最后反应出某种关系。
决策树作为一种像树一样的模型,它的每一个树上的节点都能代表事物的一个特点,然后它有许多分支,每个分支都可以输出一个特点。它的优点主要有:
1。生成的规则浅显易懂
2。算法计算量小
3。可以处理的情况广
4、以决策树的图来了解哪些是重点