Calibración de probabilidades

La calibración de probabilidades es un paso clave para mejorar la precisión de los modelos de predicción de apuestas. Aunque un modelo (Poisson, Dixon-Coles, Machine Learning) puede predecir bien qué equipo ganará, sus probabilidades pueden estar “desajustadas”, si predice 60% de probabilidad de victoria, pero en realidad solo gana en 50% de los casos.

La calibración ajusta las probabilidades para que reflejen la frecuencia real.

Técnicas comunes:

  • Platt Scaling (Regresión Logística).
  • Isotonic Regression (Regresión Isotónica).

Platt Scaling

Método paramétrico. Más estable con pocos datos (solo ajusta dos parámetros A y B). Usar si tienes <500 partidos históricos.

Isotonic Regression

Método no paramétrico. Más preciso con grandes bases de datos (captura irregularidades del modelo). Usar si tienes miles de partidos y tu modelo inicial es bastante consistente.

Cada liga tiene dinámicas distintas (pocos goles, sorpresas).

Curva de Calibración (Reliability Curve)

  1. Agrupa tus predicciones en bins ....r ejemplo: 0.0 – 0.1, 0.1 – 0.2, ...., 0.9 – 1.0).
  2. Para cada bin:
    • Calcula el promedio de las probabilidades predichas.
    • Calcula el porcentaje real de aciertos.
  3. Grafica estos puntos:
    • Eje X = probabilidad predicha (promedio del bin).
    • Eje Y = proporción de veces que el evento ocurrió realmente.

Una línea diagonal y=x representa una casa perfectamente calibrada.