Calibración de probabilidades
La calibración de probabilidades es un paso clave para mejorar la precisión de los modelos de predicción de apuestas. Aunque un modelo (Poisson, Dixon-Coles, Machine Learning) puede predecir bien qué equipo ganará, sus probabilidades pueden estar “desajustadas”, si predice 60% de probabilidad de victoria, pero en realidad solo gana en 50% de los casos.
La calibración ajusta las probabilidades para que reflejen la frecuencia real.
Técnicas comunes:
- Platt Scaling (Regresión Logística).
- Isotonic Regression (Regresión Isotónica).
Platt Scaling
Método paramétrico. Más estable con pocos datos (solo ajusta dos parámetros A y B). Usar si tienes <500 partidos históricos.
Isotonic Regression
Método no paramétrico. Más preciso con grandes bases de datos (captura irregularidades del modelo). Usar si tienes miles de partidos y tu modelo inicial es bastante consistente.
Cada liga tiene dinámicas distintas (pocos goles, sorpresas).
Curva de Calibración (Reliability Curve)
- Agrupa tus predicciones en bins ....>r ejemplo:
0.0 – 0.1
,0.1 – 0.2
, ....>,0.9 – 1.0
). - Para cada bin:
- Calcula el promedio de las probabilidades predichas.
- Calcula el porcentaje real de aciertos.
- Grafica estos puntos:
- Eje X = probabilidad predicha (promedio del bin).
- Eje Y = proporción de veces que el evento ocurrió realmente.
Una línea diagonal y=x representa una casa perfectamente calibrada.