O passado pode dizer muito sobre o futuro e analisar suas apostas é uma exploração rica e muito interessante sobre os dados que você mesmo gerou ao longo dos seus palpites. Muitas vezes os dados nos têm muito a dizer, mas não sabemos muito bem como perguntar. No artigo de hoje, você vai ver diversas formas de fazer as perguntas corretas aos seus dados através da análise das apostas que nós mesmos fizemos no Desafio Punting 2017.
A análise das apostas do Desafio Punting 2017
Nada melhor que começarmos com um análise completa como exemplo para o nosso aprendizado, não é mesmo? Abaixo, você verá uma apresentação interativa do software de análise de dados chamado Tableau sobre o Desafio Punting 2017 que fizemos aqui no início do ano. Esse software muito utilizado por analistas e cientistas de dados nos mostra como é possível contar histórias interessantes através dos dados. Espere a apresentação carregar e vá navegando por cada um dos slides, lembre-se que o Tableau é muito interativo, e você poderá ter ainda mais informações ao colocar o mouse sobre os elementos:
Entretanto, ao observar o desafio, vemos que foram feitas 342 apostas ao todo e que o prejuízo foi de pouco mais de 20$, assim percebemos que todas as apostas não foram inseridas porque no começo do desafio eu não havia trazido variáveis que são muito importantes para análise que eu realizei, que é o cálculo da probabilidade dada pelo modelo. Então, infelizmente perdi algumas boas informações por não ter anotado uma informação tão valiosa.
Como analisar as suas próprias apostas em futebol utilizando dados?
Como você pode ver acima, gráficos são ótimos para dar sentido a uma montanha de dados. Imagine-se tentando encontrar padrões ou tendências em uma tabela com várias colunas e incontáveis linhas. Certamente você não conseguiria enxergar nada que lhe fosse muito útil. É por isso que os gráficos são ferramentas importantes. Ainda que a gente tenha utilizado o Tableau para fazê-lo, nada te impede de fazê-los pelo Excel também.
Para começar a analisar as suas apostas você vai precisar de dados e também escolher exatamente quais gráficos serão capazes de responder a pergunta que você quer. Lembre-se disso: boas análises começam sempre com perguntas relevantes aos seus dados. Vamos começar pelos dados então:
A análise das apostas precisa de dados
Se você ainda não criou o hábito de anotar todas as suas apostas, seja em uma planilha Excel ou em algum software de Gestão de Banca, você certamente está perdendo a oportunidade de tirar aprendizado dos seus dados e, consequentemente, está perdendo dinheiro com isso. Para apresentação acima, foram necessárias somente essas informações:
- Data da aposta;
- Esporte;
- Competição;
- País;
- Evento apostado;
- Aposta realizada;
- Probabilidade calculada;
- Valor Esperado Calculado;
- Mercado;
- Odds;
- Stake Apostada;
- Resultado da aposta (Lucro/Prejuízo)
Gráfico de linha: uma demonstração da evolução da sua banca
No primeiro slide utilizamos um gráfico de linha para mostrar a evolução da banca ao longo do período. Se você acompanhou o desafio punting, sabe que iniciamos com uma banca de US$2.000,00, e através do gráfico pode ver a relação lucro/prejuízo ao longo do tempo. Assim, no eixo Y (o eixo vertical, que está em pé) visualiza-se o lucro/prejuízo, enquanto no eixo X (eixo horizontal, que está deitado) vemos as datas progredindo de maneira cronológica. Portanto, se quer acompanhar a evolução de algo ao longo do tempo, o gráfico de linha é sempre uma boa pedida.
BANs: Big Ass Numbers
Construir bons gráficos, estórias ou dashboards, passando as informações de maneira rápida e intuitiva é uma tarefa que designers também se debruçam. Sabemos que o tempo é valioso, e precisamos garantir que conseguiremos passar uma mensagem de maneira efetiva e em poucos segundos. Dentre as melhores práticas do design estão os Big Ass Numbers, que em outras palavras significam “números grandes”. Os números grandes naturalmente atraem o primeiro olhar quando apresentado, principalmente quando se utiliza cores contrantes com o fundo. Na primeira página da apresentação acima, muito provavelmente seu olhar recaiu primeiro sobre os indicadores em números grandes:
- Quantidade de apostas realizadas;
- Total apostado ao longo do período;
- E o prejuízo final.
Então, já no primeiro instante, acredito que consegui introduzi-lo ao conteúdo que será apresentado e também as informações mais relevantes para que você possa entender o que será explicado em seguida.
Assim, ao construir os seus dashboards, tente utilizar números grandes para as informações mais importantes, os conhecidos KPIs, ou “Indicadores chave de desempenho”.
Mapa Geográfico: em quais campeonatos você é melhor?
O mapa geográfico, visto no slide nº2 não é tão relevante para análise feita acima porque trata-se de um modelo estatístico que não utilizei de análises qualitativas que a maioria dos apostadores utilizam. Tratava-se de um modelo que utilizava como input somente os resultados passados de cada uma das equipes.
Entretanto, para apostadores que utilizam do método qualitativo ou mesmo algo “qualiquanti”, o mapa geográfico nos mostra com clareza informações muito interessantes como:
- O nº de apostas realizadas em cada campeonato;
- O lucro/prejuízo em cada um deles;
Assim, ele pode ser um excelente indicador para que possamos compreender onde realmente mandamos bem – e devemos aumentar os nossos investimentos – e onde estamos mandando mal – e, com isso, repensar se vale a pena continuar apostando nesses campeonato ou mudar a nossa metodologia de análise por lá.
Acredito que alguma utilidade pode se ter também para modelos puramente estatístico, apesar de improvável, países diferentes podem ter distribuições diferentes em relação aos seus dados que podem, talvez, afetar o modelo.
Gráficos de barras: comparando mercados, odds e valores esperados
Gráficos de barras são muito úteis quando queremos comparar diferentes variáveis categóricas. Nas apresentação acima usamos para saber se haviam diferenças relevantes nos resultados para:
- Odds;
- Mercados;
- Valores Esperados;
Você somente precisará medir o retorno por faixas de valor esperado se estiver usando um modelo estatístico, assim poderá comparar os resultados pelas faixas de valor esperado. Entretanto – e pensando melhor agora – talvez possa fazer o mesmo se você consegue quantificar de alguma forma os seus palpites em forma de probabilidades. Mas deve-se lembrar que teria muita subjetividade envolvida, e as informações não seriam tão precisas, podendo mais atrapalhar do que ajudar.
Na apresentação acima não usamos para essa finalidade, mas podemos usar os gráficos de barras para comparar times também e, com isso, ver quais estão te dando retornos acima dos demais.
Os gráficos de barra são muito úteis, e veja que analisar as faixas de EV foi essencial para chegar à conclusão final e tirar bons insights dos dados coletados.
Gráficos de dispersão: checando a correlação entre duas variáveis
Quando precisamos medir a correlação entre duas variáveis o gráfico de dispersão deve ser o primeiro a vir a mente, com ele podemos medir diversos tipos de correlações diferentes que podem interessar a nós apostadores, por exemplo:
- Folha salarial x % de aproveitamento no campeonato;
- Saldo de gols x nº de vitórias;
- % de aproveitamento 1º turno x % de aproveitamento 2º turno.
Enfim, são diversas as correlações possíveis que se pode medir com um gráfico de dispersão. Muitas vezes, na construção de um modelo multivariável, os analisar iniciam por fazer gráficos de dispersão entre as variáveis dependentes e as independentes.
No caso acima, vemos que há uma boa correlação entre o modelo usado e as odds oferecidas pela casa. Entretanto, percebe-se que com o aumento das odds os pontos do gráfico começam a ficar mais distantes da linha de tendência, o que nos deu mais um sinal de que para odds maiores e, consequentemente, para EVs maiores o modelo não estava respondendo bem.
Diagrama de Pareto: 20% das ocorrências são responsáveis por 80% dos resultados
Pareto foi um economista italiano responsável pelo famoso princípio 80/20 que você muito provavelmente deve ter ouvido falar em algum lugar, de acordo com o ele:
80% das consequências advêm de 20% das causas.
Verá que não se pode levar a cabo. Muitas vezes os valores vão fugir um pouco da regra acima, entretanto o que se observa é que boa parte dos acontecimentos podem ser resumidos a umas poucas causas.
O diagrama de Pareto é útil para vermos o acumulado dessas relações, sendo composto de um gráfico de barras e um de linha ao mesmo tempo, onde vai se adicionando os percentuais até chegar a 100%. Em nossa análise, usamos o diagrama de Pareto para mostrar que somente 11,77% de todo o valor apostado foi utilizado nas faixas de valor esperado lucrativas, enquanto quase 90% foi utilizado nas demais faixas que, em maior parte, nos trouxe prejuízos.
E tem outros gráficos também…
Devemos enxergar os gráficos como sendo as ferramentas mais adequadas para o que queremos descobrir – no caso de uma análise exploratória – ou para uma explicação – no caso de querer compartilhar os resultados. Veja alguns gráficos que não foram utilizados, mas que também poderiam ter grande utilidade:
- Gráfico de pizza: úteis para ver a representação de cada unidade em relação ao todo (100%);
- Gráfico de radar: muito comum nos scouts do Fifa, bom para visualizar grandezas em muitas variáveis;
- Gráfico de bolhas: uma mão na roda para representar correlação entre 3 ou até mesmo mais variáveis;
- Gráfico de caixas ou Candles: bons para mostrar valores mínimos, máximos, quartis e medianas das unidades de análise;
- Mapa de árvore: ajudam bastante a representar hierarquias e seus respectivos valores.
Creio que os principais são esses. Poderá encontrar muitas variações e talvez outros bem diferentes que nem mesmo citamos por aqui. Lembre-se que ao construir dashboards ou tentar contar histórias através dos dados, quanto mais simples melhor. Às vezes queremos utilizar soluções sofisticadas para mostrar que “manjamos muito”, quando poderíamos simplificar com gráficos mais tradicionais e, portanto, mais familiares aos usuários. Fuja dessa armadilha da sofisticação desnecessária. O segredo está em pegar algo complexo e torná-lo em uma visualização que qualquer um possa entender em poucos segundos.
Como a análise das apostas através dos dados pode te ajudar?
Você viu que graças a análise gráfica demonstrada acima chegamos a uma conclusão muito importante: “quando a esmola é grande, o santo desconfia”. Em outras palavras, ao utilizar um modelo estatístico, onde as casas possuem softwares avançados, técnicas modernas de Machine Learning e bons profissionais para supervisionar esses modelos, é muito ingênuo achar que pode-se conseguir com facilidade 10% ou mais de valor esperado positivo. Portanto, em um próximo desafio iremos certamente calibrar o modelo para apostar somente neste valor ou abaixo dele.
Como você acha que a análise das apostas pode te ajudar? Já fez alguma? Conte para a gente os resultados.
A análise acima foi feita utilizada o Tableau Public, que é uma versão gratuita do software que poderá te atender muito bem. Entretanto, se você ainda está engatinhando nessa parte, dê uma olhada em nosso curso gratuito “Apostas Punting • Estatística e Excel aplicados às apostas no futebol“, por lá você vai aprender os fundamentos da parte analítica nas apostas esportivas, enquanto utiliza o Excel para fazer modelos simples de previsão e criar seus primeiros dashboards por lá, clique no banner abaixo e confira: