Como um modelo estatístico estima probabilidades no futebol
Poisson, força de ataque e defesa, e o ajuste Dixon-Coles
Quando uma análise diz que uma equipa tem 55% de probabilidade de vencer, esse número não saiu de um palpite. Saiu de um modelo estatístico que transforma o histórico de golos em probabilidades para cada resultado. Este guia explica, sem matemática assustadora, como isso funciona: a distribuição de Poisson, a força de ataque e defesa de cada equipa, e o ajuste Dixon-Coles que o BlitzTips usa.
Não precisas de saber fazer as contas para apostar melhor. Mas perceber de onde vêm as probabilidades ajuda a confiar nelas pelas razões certas — e a saber onde param os seus limites.
Porque é preciso um modelo
A intuição vê duas equipas e diz “esta é melhor”. Um modelo faz a mesma leitura, mas obriga-se a ser específico: quão melhor, em quantos golos, e com que probabilidade para cada resultado possível. Em vez de “a casa deve ganhar”, dá “45% casa, 28% empate, 27% fora”.
Essa disciplina é o que permite comparar a leitura com a odd e procurar valor esperado. Sem um número, não há forma de dizer se uma odd está cara ou barata. O modelo existe para produzir esse número de forma consistente, jogo após jogo, sem se deixar levar pela equipa da moda.
Os golos seguem (quase) uma distribuição de Poisson
A peça central é uma ideia simples: os golos são eventos relativamente raros, espalhados ao longo dos 90 minutos. Esse tipo de contagem aproxima-se de uma distribuição de Poisson, que responde a uma pergunta muito útil — dado que uma equipa marca, em média, um certo número de golos, qual a probabilidade de marcar exatamente 0, 1, 2, 3 ou mais neste jogo?
Tudo o que a distribuição de Poisson precisa é desse número médio, normalmente chamado lambda (λ): os golos esperados da equipa naquele jogo. A partir dele, sai a probabilidade de cada número de golos. Um λ de 1,8, por exemplo, distribui-se à volta de um ou dois golos, com caudas mais finas para 0 ou para 3 e mais.
O modelo não tenta adivinhar “o resultado”. Estima a probabilidade de cada resultado e deixa a variância fazer o resto. É por isso que o azarão ganha, e isso não invalida o modelo.
Cada equipa tem força de ataque e de defesa
O λ não cai do céu. Vem da força de cada equipa, medida em relação à média da liga. Cada equipa tem dois números: uma força de ataque (quantos golos costuma marcar, face à média) e uma força de defesa (quantos costuma sofrer). Uma equipa com bom ataque e boa defesa tem ataque acima da média e defesa que concede abaixo da média.
Junta-se ainda a vantagem de jogar em casa, que historicamente vale golos. O λ de cada lado nasce do cruzamento destas peças:
λ casa = ataque(casa) × fragilidade defensiva(fora) × média de golos da liga × vantagem de casa
Para o visitante é a mesma ideia, sem o fator casa. O resultado são dois golos esperados — um para cada equipa — que resumem quem ataca melhor, quem defende pior e onde se joga. É a mesma família de ideias por trás dos golos esperados (xG), aplicada à previsão e não só ao que já aconteceu.
O que o ajuste Dixon-Coles acrescenta
Um Poisson simples, com um λ por equipa, já dá uma boa primeira aproximação. Mas tem duas fraquezas conhecidas, e é aqui que entra o modelo Dixon-Coles (proposto por Mark Dixon e Stuart Coles em 1997), uma das bases mais usadas neste tipo de análise.
1. Corrige os resultados de poucos golos
Tratar o ataque das duas equipas como totalmente independente faz o Poisson simples estimar mal os resultados baixos — sobretudo 0-0, 1-0, 0-1 e 1-1, que no futebol real aparecem com frequências um pouco diferentes do que a teoria pura prevê. O Dixon-Coles aplica uma pequena correção a essas quatro caixas, aproximando o modelo da realidade dos jogos fechados.
2. Dá mais peso aos jogos recentes
Uma equipa de há seis meses pode não ser a mesma de hoje. Por isso o modelo pondera os jogos pelo tempo: os mais recentes pesam mais, os antigos vão perdendo influência de forma gradual. Assim, a força estimada acompanha a forma atual sem ignorar por completo o histórico — um equilíbrio entre não reagir a tudo e não ficar preso ao passado.
Da matriz de resultados às probabilidades de mercado
Com o λ de cada equipa (já corrigido), o modelo calcula a probabilidade de cada placar: 1-0, 2-1, 0-0, 3-2, e assim por diante. O resultado é uma grelha de probabilidades para todos os resultados plausíveis. A partir daí, qualquer mercado é só uma soma das caixas certas:
- 1X2: soma dos placares em que a casa marca mais (vitória), iguala (empate) ou marca menos (derrota).
- Over/Under 2.5: soma de todos os placares com 3 ou mais golos no total, contra os de 0 a 2.
- Ambas marcam: soma dos placares em que os dois lados marcam pelo menos um golo.
É o mesmo conjunto de probabilidades a alimentar mercados diferentes — por isso é que Over 2.5 e BTTS andam relacionados, mas não são iguais: olham para caixas diferentes da mesma grelha.
Do modelo ao valor
Uma probabilidade do modelo transforma-se facilmente numa odd justa: basta dividir 1 pela probabilidade. Se o modelo dá 50% a um resultado, a odd justa é 2,00. Se a casa oferece 2,20 por esse mesmo resultado, há margem de valor esperado positivo; se oferece 1,80, não há.
Mas o modelo não é a única fonte de informação. O mercado também sabe muito, e o preço de fecho costuma ser difícil de bater. Por isso o BlitzTips não usa só o modelo: combina a probabilidade do modelo com a do mercado antes de calcular o valor, e a estimativa de EV é apresentada já calibrada. A ideia não é “o modelo contra a casa”, é usar os dois para encontrar onde a odd parece mesmo desalinhada.
O que o modelo não vê
Um modelo é tão bom como os dados que recebe — e há muito que os golos passados não contam:
- Lesões, castigos e onzes alternativos decididos à última hora.
- Motivação e contexto: um jogo sem nada em disputa, uma final, um dérbi.
- Calendário e rotação: cansaço, viagens, jogo europeu a meio da semana.
- Mudanças de treinador, de sistema ou de estilo recentes demais para aparecerem nos dados.
E mesmo com tudo isto bem estimado, sobra a variância: probabilidades não são certezas. Um modelo que acerta nas probabilidades vai, mesmo assim, “falhar” muitos jogos individuais — porque 30% de hipótese acontece, de facto, três em cada dez vezes.
Exemplo prático
De dois números a uma probabilidade
O modelo estima 1,7 golos esperados para a equipa da casa e 0,9 para o visitante. Só com isto, a distribuição de Poisson já diz que o 0-0 é pouco provável, que a casa marca na maioria das vezes, e que o resultado mais provável anda à volta de 1-0 ou 2-1.
Somadas as caixas, sai algo como 56% casa, 24% empate, 20% fora. Se a vitória da casa está a 1,55 (que implica cerca de 65%), o modelo acha-a cara; se está a 1,95 (cerca de 51%), pode haver valor. A odd não muda a probabilidade real — só diz quanto te pagam por ela.
Como o BlitzTips usa isto
O modelo do BlitzTips assenta nesta base — Poisson com força de ataque e defesa, o ajuste Dixon-Coles para resultados baixos e ponderação temporal — e cruza a sua probabilidade com a do mercado para estimar valor. Os detalhes da metodologia e do que entra no cálculo estão na página de metodologia.
O objetivo não é prometer acertos, é mostrar o trabalho: de onde vem cada probabilidade, porque é que um pick tem valor e onde a leitura pode falhar. Um número com método por trás é mais útil do que uma certeza sem explicação.
Perguntas frequentes
O que é a distribuição de Poisson aplicada ao futebol?
É uma forma de estimar a probabilidade de uma equipa marcar 0, 1, 2, 3 ou mais golos, a partir de um único número: a média de golos que se espera que ela marque naquele jogo. Funciona porque os golos são eventos relativamente raros e espalhados ao longo da partida, o que se aproxima das condições da distribuição de Poisson.
O que é que o modelo Dixon-Coles acrescenta a um modelo de Poisson simples?
Acrescenta duas correções. Primeira: ajusta os resultados de poucos golos (0-0, 1-0, 0-1 e 1-1), que um Poisson simples tende a estimar mal. Segunda: dá mais peso aos jogos recentes do que aos antigos, para que a força estimada de cada equipa acompanhe a forma atual.
Um modelo estatístico garante acertar nos resultados?
Não. Um modelo estima probabilidades, não certezas. Mesmo quando atribui uma probabilidade alta a um resultado, o outro lado continua a poder acontecer, e a variância garante que no curto prazo há sempre surpresas. O modelo serve para decidir melhor, não para prever o futuro.
Qual é a diferença entre xG e um modelo de previsão?
O xG mede a qualidade das ocasiões de um jogo que já aconteceu; é uma fotografia do passado. Um modelo de previsão usa a força acumulada das equipas para estimar o que pode acontecer num jogo futuro. Estão relacionados — ambos pensam em golos esperados — mas respondem a perguntas diferentes.
Para ligar isto à prática, vê também os guias sobre valor esperado, xG, Over/Under 2.5 e como ler odds.
18+Aposta com responsabilidade. Um modelo estima probabilidades, não garante resultados. Nenhuma análise elimina o risco nem assegura lucro.
Se sentires que o jogo está a causar problemas pessoais, financeiros ou emocionais, procura ajuda na Linha de Apoio 1414. Em Portugal, joga apenas em operadores licenciados pelo SRIJ.