Machine learning prevê o ganhador da Copa da Rússia

A Copa da Rússia começa na próxima quinta (14/6) e promete ser muito disputada. Prever e projetar o ganhador é uma atividade levada a sério por muita gente, principalmente por casas de apostas. São várias as possibilidades de apostas: nos jogos individuais, nos artilheiros e também no vencedor da Copa. O volume de dinheiro que gira no mercado de apostas é significativo.

Geralmente, as casas de apostas utilizam técnicas estatísticas mais convencionais para fazer suas projeções e precificar as apostas. Mas nos últimos anos, tem sido desenvolvidas técnicas de machine learning com objetivo de chegar a projeções mais confiáveis que as tradicionais. O que essas novas técnicas prevêem como o resultado provável da Copa do Mundo de 2018?

Uma delas vem do trabalho feito por Andreas Groll, Christophe Ley, Gunther Schauberger e Hans Van Eetvelde. Andreas e seus colegas usaram a chamada floresta randômica (random forest ou random decision forest) para projetar o mais provável vencedor. Floresta randômica é um método de aprendizado voltado para classificação, regressão e outras tarefas. Ela opera construindo uma multiplicidade de árvores de decisão e gerando a classe que é a moda das classes (classificação) ou a previsão média (regressão) das árvores individuais.

Nesse trabalho, Andreas e seus colegas usaram exatamente essa abordagem para modelar a Copa do Mundo de 2018. Eles modelaram o resultado de cada jogo e usaram os resultados para construir o caminho de eventos mais provável do torneio. Eles trabalharam com 16 variáveis que podem determinar ou influenciar os resultados. Dentre estas, estão fatores econômicos como o PIB e a população do país, o ranking de seleções da FIFA e algumas características de cada equipe, como idade média, número de jogadores que jogam a Liga dos Campeões da Europa, possível vantagem por jogar próximo do país de origem, etc.

Para ver todo o trabalho deles, é só baixar o paper aqui.

Por fim, qual o resultado saiu desse modelo?

Essa tabela mostra a classificação dos grupos ao final da primeira fase:

Esse diagrama mostra o caminho mais provável a ser percorrido na fase de mata-mata.

Pois é, não parece ter um fim muito bom para a seleção brasileira. :(((

 


Veja também: