欧洲杯投注预测分析 知乎
相比足球预测的数据信息,股票相关的信号众多,不管是从数量上,还是特征维度上都是爆炸式的增长。 从最基本的开盘价收盘价,到股票技术性指标,如MACD,KDJ等,再到股票基本面信息的抽象。 信号和特征维度众多,关键在于:一是如何挖掘更多具有股票相关性的信号;二是相关性量化和特征分析。 利用深度神经网络的多重非线性变换,我们便可得到输入数据特征的另一种更加有效的表示,实现了对足彩数据特征的有效学习。
随着近20年AI技术的蓬勃发展,大力推动了量化交易的自动化、数据化和智能化发展。 但量化交易作为一个涉及到多领域、大量数理知识、金融知识以及系统工程的问题,在实际运用中更为复杂,相比理论假设有更多的非理性因素和消息不透明等情况,还涉及到交易策略等股票实操问题。 量化交易的完整讲述甚至只是简单介绍都值得另开一篇拙文,这里只是抛砖引玉,对前文足彩预测中的方法简单扩展。
实际足彩中有多种彩种玩法,如竞彩足球中就包括胜平负游戏、比分游戏、总进球游戏、半全场胜平负游戏、过关组合玩法等等。 那基于前面得到的足彩预测系统,能不能对我们的足彩投注有所指导。 其中最后17维特征为球队基本面特征,其余的为赔率特征。
这就导致对战队伍的历史对局相对较少,同时历史对战数据的指导性变弱。 如在世界杯上,能够与中国队一战的队伍不过巴西、哥斯达黎加、土耳其,数据极少。
根据英超联赛的预测结果来看,SVM模型的预测准确率比LR模型的预测准确率提高了13.05%,我们猜测非线性模型在足球比赛结果的预测上具有更好的表现。 我们采用同样的训练集和测试集,尝试了多个不同的非线性模型。 现有比赛数据从2010年7月27日开始累积,其中包含了五个完整的赛季以及2015年的赛季数据。
到此为止,我们在采用随机森林模型对英超联赛能取得53.42%的预测准确率,除了进一步挖掘更多的特征,还有没有方法可以进一步提高准确率呢? 下面我们先来看下现有的特征在随机森林模型下对目标值的作用权重。 由以上方法计算得到的结果可以看到,法甲的混沌程度得分远高于其他的四大联赛,和球迷在感性上的认识是一致的,这就导致了利用同样的数据信息,对法甲的预测准确率远低其它的四大联赛。 参考多篇关于football prediction的论文,其预测比赛利用的数据主要分为两方面,一是球队基本面信息,二是公开的赔率盘口。 这里的足彩预测实现主要也是考虑了这两方面的数据。