Avatar

Dissertação de mestrado “1X2 Previsão de Resultados de Jogos de Futebol”

29 Junho 2015
Sem comentários

Título: “1X2 Previsão de Resultados de Jogos de Futebol”

Autor: Luís Duarte

Orientadores: Prof. Carlos Soares e Jorge Teixeira (FEUP)

CursoMestrado Integrado em Engenharia Informática e Computação da Faculdade de Engenharia da Universidade do Porto

Resumo (PT):
Nos últimos anos tem havido um aumento de trabalhos na área de Data Mining devido à perceção do potencial que esta tecnologia pode ter no mundo da medicina, indústria e também no desporto, entre outras áreas. Cada vez mais se armazenam grandes quantidades de dados e a extração de informação desses dados pode ser extremamente útil na resolução de problemas.
O futebol é um dos desportos mais populares no mundo e gera muitas paixões em volta dos seus resultados. A antecipação de um resultado é uma tarefa muito complexa devido à grande quantidade de fatores que podem influenciar os jogos.
Apesar da sua popularidade, há pouca informação sobre a aplicação da tecnologia de Data Mining ao futebol. Isto pode ser explicado pelo facto de as equipas de futebol quererem manter em segredo os seus processos mais inovadores, e, assim tirarem vantagem da utilização desta tecnologia. Apesar disso, este assunto gera muito interesse em todo o mundo. Fãs, comunicação social e apostadores querem cada vez mais ter informações privilegiadas do que acontece num jogo de futebol e, idealmente, até prever o que se vai passar.
Nesta dissertação é abordada a aplicação de técnicas de Data Mining na previsão de resultados de jogos de futebol. A previsão dos resultados foi feita de uma forma categórica (vitória, empate ou derrota) e foi aplicado a jogos da Liga Portuguesa de Futebol. Como resultado da dissertação foi desenvolvido e testado empiricamente um modelo que faz a previsão de resultados de jogos futuros e como conclusão obteve-se uma taxa de acerto de aproximadamente 59% nos jogos da Liga Portuguesa 2012/2013. Em todo o processo foram usados diferentes dados dos jogos de futebol que foram disponibilizados pelo Laboratório SAPO/ U.Porto. Com base nos dados dispo- nibilizados, foram criadas novas variáveis com o objetivo de fornecer informação mais preditiva aos algoritmos de aprendizagem. A previsão de resultados foi suportada em vários algoritmos de Machine Learning como por exemplo KNN, SVM,Random Forest, etc.

Abstract (EN):
During the last years there has been a huge growth of Data Mining due to the perception of the potential that this technology can have in the world of medicine, in industry and also in sport, among other areas. Each day there is a growing storage of data, being the extraction of information from these data extremely useful in solving problems.
Football is one of the most popular sports in the world and so it generates many passions around its overcome. The overcome prediction is a very complex task, due to the large amount of factors that influence a football game.
Despite its popularity, there is little information on the implementation of Data Mining te- chnology to football. This can be explained by the fact that football teams want to keep in all investigations that they do in secret, and thus taking advantage of using this technology. Neverthe- less, this subject generates much interest worldwide. Fans, media and punters increasingly want to have inside information of what happens in a football game and , ideally , to predict what will happen.
In this dissertation it is addressed the application of data mining techniques to predict the overcomes of football matches. The forecast of the overcomes was done in a categorical way (win, draw or defeat) and was applied to matches of the Portuguese Football League. It was developed and empirically tested a model that is predicting the results of future games and as a conclusion was obtained approximately a 59% accuracy in the games of the Portuguese League 2012/2013 . Throughout the process, several data from football games that were provided by the laboratory SAPO/ U.Porto, were used. With these information, other data was developed, which suit the problem. There were also used several Machine Learning algorithms such as KNN, SVM, Random Forest, etc.

Texto integral: Repositório Aberto UP



Sem comentários