Estadísticas de Fútbol para Apuestas en la Liga Española


El fútbol es el deporte rey, y en las apuestas deportivas esta ley se cumple sin discusión. Apostar en fútbol se lleva más de la mitad del dinero de todo el juego online que se mueve en el mundo. En nuestro país somos especialmente futboleros, y además tenemos la suerte de disfrutar en la liga española de la competición más potente del mundo. No es de extrañar, pues, que pronosticar los resultados de nuestra primera división sea la forma más habitual de jugar para la mayoría de nosotros. Así que nos ha parecido de gran interés para todos compartir un análisis en profundidad de las estadísticas de fútbol para apuestas en la liga española, de forma que nos sirva como referencia a la hora de plantear estrategias y evaluar nuestros picks.

Existen en internet muchos sitios con resultados históricos y bases de datos de primera división desde su fundación, allá por el 1928. Por desgracia, la información se encuentra o bien agrupada por equipos y temporadas independientes, o bien demasiado cruda y dispersa en partidos individuales como para poder tomar decisiones de forma ágil. Consolidar las cifras por clubs no es buena idea, porque en la Liga las tornas cambian de un año para otro y puede ser que un año un conjunto luche por la participar en Champions mientras que al siguiente sufra por evitar posiciones de descenso. Y si no, que se lo digan a la Real Sociedad, que en 2002/2003 terminó segunda y a punto estuvo de llevarse el triunfo absoluto en la última jornada, y que luego en 2003/2004 finalizó en decimoquinta posición y sufriendo durante casi toda la competición por huir de plazas de descenso.

Por ello, parece más indicado realizar la agrupación por la posición final allá por el mes de Junio, cuando ya no hay más enfrentamientos. Para esto, hay que procesar los datos y reordenarlos convenientemente. Así que como a quien escribe estas líneas le gustan los números y se lo pasa bien con las matemáticas, me he descargado toda esa información, la he metido en el excel y he puesto a sacar humo a mi portátil hasta obtener frecuencias y probabilidades listas para ser consideradas y comparadas con las cuotas de nuestras apuestas de fútbol.

El estudio se centra en victorias y derrotas en la Liga BBVA, y dejaremos para más adelante considerar goles para overs/unders u otros elementos para handicaps. Puesto que el fútbol de los años 40 se parece como un huevo a una castaña al actual y queremos utilizar las conclusiones del trabajo de cara al futuro, hemos empleado solamente los partidos disputados entre las temporadas 2006/2007 y 2013/2014. Ocho campañas, a 38 jornadas cada una y 10 encuentros por jornada salen a un total de 3040 encuentros analizados. No está mal para tener confianza en la validez de las conclusiones.

En la entrada encontrarás tres análisis independientes:

  • El porcentaje de triunfos locales, empates y derrotas locales promedio por temporada metiendo todos los partidos y equipos en el mismo saco. Esto nos servirá para estimar probabilidades promedio y entrever tendencias globales.
  • La media de victorias locales, empates y victorias visitantes en la liga durante las ocho campañas consideradas, pero en este caso bloqueando el resultado según la clasificación final de cada club. Así podremos cuantificar las diferencias entre la potencia futbolística de un grande, un conjunto de competición europea, otro de la zona media, uno de los que luchan por mantener la categoría y los que son carne segura de segunda.
  • Las frecuencias de los tres posibles finales en función no sólo de la situación clasificatoria del equipo anfitrión, sino también del visitante. De aquí obtendremos los resultados más útiles de todos, pues nos dejará lista y preparada una estadística de referencia para un partido concreto de primera división si somos capaces de intuir aproximadamente el orden de los clubs al finalizar la Liga. Ya estemos ante un Valencia CF - Villarreal o un Athletic de Bilbao – Real Sociedad, si estimamos más o menos cómo pueden acabar la competición tendremos una estimación de la probabilidad razonablemente cercana a la real. Como el tema da para largo y en un solo post no cabe todo, esta tercera pata del estudio será publicada en una próxima entrega.

Como colofón a este preámbulo, identificaremos los resultados mediante la conocida nomenclatura de las quinielas. De esta forma denotaremos como 1 cuando ganan los locales, X cuando el marcador termina en equilibrio y 2 para la victoria a domicilio. Y una vez aclarado este punto, es hora de empezar a mirar los números.

Análisis de estadísticas de las últimas temporadas de Primera División

El cuadro de debajo muestra las frecuencias a las cuales se han producido los tres posibles desenlaces de los partidos de la Liga BBVA, junto con el ganador final de la competición.

Temporada 1 X 2 Ganador Liga Primera División Española
2013-2014 47.1% 22.6% 30.3% Atlético de Madrid
2012-2013 49.7% 22.1% 28.2% FC Barcelona
2011-2012 49.5% 24.7% 25.8% Real Madrid CF
2010-2011 51.8% 20.8% 27.4% FC Barcelona
2009-2010 51.1% 25.0% 23.9% FC Barcelona
2008-2009 48.4% 21.8% 29.7% FC Barcelona
2007-2008 47.9% 22.9% 29.2% Real Madrid CF
2006-2007 45.3% 25.8% 28.9% Real Madrid CF
Media 48.8% 23.2% 27.9%
Desviación tipo 2.1% 1.8% 2.1%

Muy en resumen, los datos corroboran lo que muchos aficionados sabemos de manera intuitiva. El resultado más probable es la victoria de la alineación de casa, que se da aproximadamente en la mitad de los casos. El empate y el triunfo a domicilio se reparten la otra mitad, con ligero predominio de la victoria visitante gracias al incentivo de los tres puntos para el ganador, que anima a los rivales a no conformarse con terminar en tablas.

Por otro lado, notemos que existe una cierta –y lógica– variabilidad en los resultados de las ocho temporadas. En el cuadro hemos evaluado la media de todas ellas pero además aparece otro parámetro denominado desviación tipo. Este estadístico, conocido también como desviación típica o estándar, se utiliza para medir la dispersión de una variable –que en nuestro caso es la frecuencia de los posibles finales. Como esta entrada es sobre apuestas de fútbol y no sobre matemáticas remito a internet a quien quiera investigar los detalles de este concepto. Baste decir que (1) aceptando la hipótesis de normalidad, (2) agitándola con algunas zarandajas algebraicas más, y (3) saltándonos las enseñanzas de un señor que trabajaba en la fábrica de cervezas Guiness y que publicaba libros de estadística bajo el pseudónimo de Student, se deduce que hay como un 95% de probabilidades de que, en las próximas campañas que no se han jugado, los resultados estén en más/menos el 4% de las medias calculadas (dos veces la desviación tipo del 2% aprox. que nos sale para los tres finales).

Dicho en lenguaje normal y corriente, en las temporadas 2014/2015 ó 2015/2016 la frecuencia de victoria local estará en el 49%+/-4%, la igualada en el 23%+/-4%, y se llevan el partido los visitantes en el 28%/-4% en nuestra querida Liga española. Como el futuro no se puede conocer hasta que realmente sucede, obviamente nos podemos equivocar en nuestra afirmación. El riesgo que corremos de ello es de un 5%. No parece como para tirarse de los pelos. Brindemos –con birra– por ello.

El otro punto curioso corresponde a las victorias locales. Se observa que en los años de máximo dominio de los dos grandes de la Primera División –el FC Barcelona de Guardiola y Tito Vilanova, y el Real Madrid de Mourinho y Pellegrini– las tasas de triunfo local son más elevadas, y en cambio esta tendencia parece revertirse con la entrada en liza del tercer grande, el Atlético de Madrid del Cholo Simeone. Si esto es causa o consecuencia no importa demasiado, lo que vale es que una cosa se correlaciona con la otra, así que como tipsters elaboradores de pronósticos ésta puede ser una buena consideración para nuestras predicciones deportivas.

Estadísticas de la liga española en función de la clasificación del local

Continuemos con nuestro análisis. Hay que reconocer que el estudio anterior es un poco burdo. Quizás esos números nos puedan ser útiles para orientarnos cuando juegan dos formaciones que típicamente se mueven por la zona intermedia de la Liga. Para clubs de fútbol como puedan ser RCD Espanyol o Getafe, que a menudo no sufren demasiado para evitar las zonas de descenso ni suelen optar habitualmente a plazas de competición europea, pueden valer.

Por desgracia, para líderes y colistas no nos sirven. Los dos grandes de la primera división, FC Barcelona y Real Madrid, ganan en el Camp Nou y el Bernabéu mucho más de la mitad de los partidos que disputan. Y lo mismo pero a la inversa sucede con quienes están inmersos en la lucha por evitar bajar a la segunda división. Es de esperar que equipos más débiles como Granada, Elche o Almería sufran más de lo que nos sugieren los promedios.

Para reflejar este hecho, reagrupamos los datos en función de la clasificación final de los contendientes, de forma que obtenemos estas otras estadísticas, muchísimo más útiles para apostar al fútbol de la Liga:

Resultados en casa 2006-2014

Clasificación final en la Liga 1 X 2
1 83% 11% 6%
2 82% 12% 7%
3 68% 15% 16%
4 64% 18% 17%
5 63% 16% 21%
6 58% 20% 22%
7 53% 26% 22%
8 48% 24% 28%
9 51% 22% 28%
10 44% 26% 30%
11 44% 28% 28%
12 39% 24% 37%
13 39% 28% 33%
14 39% 25% 36%
15 38% 26% 36%
16 36% 30% 35%
17 37% 26% 37%
18 32% 35% 33%
19 36% 26% 38%
20 23% 26% 51%
Promedio 48.8% 23.2% 27.9%

Así a bote pronto esta ensalada de cifras marea un poco, pero aún así en ella se observan patrones muy interesantes. Como una imagen vale más que mil palabras, vamos a representar gráficamente la columna correspondiente al porcentaje de victorias del anfitrión respecto de su clasificación al concluir la Liga:

Esto ya está mucho más claro. Vemos una curva que empieza con una probabilidad muy alta para los equipos que encabezan la tabla (del orden del 85%) y muy baja para los que la cierran (alrededor del 25%). De nuevo, tenemos confirmación de lo que todos sabemos: que lo normal es que Messi y Ronaldo conduzcan a sus respectivas formaciones a la victoria ante sus aficionados, y que el farolillo rojo tenga unos delanteros que no le meten un gol al arco iris y una portería con más agujeros que el sombrero de Carpanta. Las estadísticas deportivas y el sentido común coinciden. Buena señal para las apuestas.

Lo bueno de este gráfico es que nos da números muy precisos de lo que sucede entre medio, que no es exactamente lo que habíamos supuesto. La gráfica tiene una cierta curvatura, así que la probabilidad de que un conjunto en la zona media de la tabla gane es ligeramente inferior a la mitad, más bien del 45%, o dicho de otra forma, con esta probabilidad deberíamos considerar equilibradas cuotas del orden de 2.2 para el triunfo de estos conjuntos. Y para otras situaciones se aprecian otros hechos interesantes, como que la probabilidad de ganar en campo propio del 5º está en el orden del 60% (si vamos a apostar le corresponderían cuotas de 1.7) y para el 15º es del 38% (cuotas de 2.6 en promedio más o menos).

En la imagen se observan dos curvas, una azul de trazo continuo y otra de trazo discontinuo. La continua corresponde a las cifras estimadas directamente de los datos históricos, y la azul es una línea de tendencia que quiere filtrar el ruido y el azar. En román paladín, si queremos usar estos números para nuestras futuras estrategias de apuestas mejor fijarse en los valores de la línea de puntos.

Veamos ahora qué se puede esperar del empate y de la derrota de los locales:

Tal como reza la leyenda de la gráfica superior, las líneas verdes corresponden a victorias a domicilio y las naranjas a empates. Los trazos punteados otra vez representan las tendencias, por lo que nos fijaremos en esos valores en lugar del raw data (números originales sin cocinar). De nuevo, se puede observar la curvatura de las líneas pero curiosamente, las derrotas caseras aumentan con la situación final, pero en cambio las igualadas se saturan y dibujan una planicie en el entorno del 28%, una vez superada la décima posición.

Dicho de otro modo: a partir del duodécimo clasificado, la diferencia entre un club que desciende y uno que conserva la categoría está en los partidos perdidos en casa.

Yendo a los porcentajes, vemos que un líder pierde en su propio terreno el 5% de los enfrentamientos (cuotas de apuestas de 20) y empata el 10% (cuotas de 10). Para un quinto empates y derrotas están ya más igualadas y próximas al 20%. Aquí empieza la cosa bifurcarse y revertirse. Los empates tienden a aplanarse como ya hemos dicho, y las pérdidas caseras aumentan paulativamente hasta cerca del 45% para el último clasificado.

Este estudio supone un gran avance respecto del anterior pues nos da la comparación de las victorias de los equipos en función de la clasificación del propietario del terreno de juego. No obstante, de nuevo, no es lo mismo jugar en casa contra este rocoso Atlético de Madrid de primeros de 2015 que recibir al Elche o al Granada. Los visitantes también juegan, y habrá que tenerlo en cuenta si queremos que la estadística de fútbol para apostar sea lo más fiable posible. Lo suyo sería utilizar dos variables en lugar de una, y representar una superficie de probabilidad en lugar de una curva como hemos hecho. Aunque es bastante más complejo de analizar y de evaluar, como soy bastante cabezota cuando me pongo con algo también he logrado extraer esa información. Dado que es bastante largo de explicar, lo dejo para la siguiente entrada. Estad atentos, porque los resultados merecen la pena.

En Conclusión

A la hora de establecer nuestros pronósticos de apuestas de fútbol, apoyarnos en estadísticas es de gran utilidad. Sin embargo, debemos estar muy atentos a la composición de los datos. Para obtener una frecuencia es necesario agregar varios partidos, casi siempre de temporadas diferentes, y si no se hace bien se pueden sacar conclusiones con poco valor, o incluso erróneas.

Apostar empleando esas cifras a las que son tan aficionados los comentaristas de radio y televisión cuando escuchamos retransmisiones en directo pueden costarnos caro. Que el Valencia no le haya ganado más de N veces al Levante en sus últimas X visitas dice más bien poco, porque el Valencia de hace 10 años no es el de ahora, ni tampoco lo es su rival. Sin embargo, la posición en la tabla la dan puntos y para ello hay que ganar o empatar, y de estos factores sí se desprenden patrones mucho más útiles para correlacionar un resultado. Saber buscar y encontrar estos patrones no es fácil, pero la recompensa puede merecer la pena. Como dicen en la bolsa, lo que todo el mundo sabe no sirve de gran cosa en los mercados. Y la radio la escucha todo el mundo.

Os espero a todos en la siguiente entrada.

The following two tabs change content below.
Me gano la vida con la ingeniería pero lo que de verdad me apasiona es el deporte al aire libre, los libros, y escribir siempre que puedo. Apostar y bloguear sobre el tema es ese punto intermedio entre lo que me ha enseñado mi profesión y lo que me gusta de verdad. Y compartir cuanto he aprendido es la manera más justa de devolverle a la red lo que me ha ofrecido. ¡Espero que mis artículos te sean de utilidad!

Acerca de Ismael

Me gano la vida con la ingeniería pero lo que de verdad me apasiona es el deporte al aire libre, los libros, y escribir siempre que puedo. Apostar y bloguear sobre el tema es ese punto intermedio entre lo que me ha enseñado mi profesión y lo que me gusta de verdad. Y compartir cuanto he aprendido es la manera más justa de devolverle a la red lo que me ha ofrecido. ¡Espero que mis artículos te sean de utilidad!


¿Y tú qué opinas? ¡Déjanos tu comentario!

9 ideas sobre “Estadísticas de Fútbol para Apuestas en la Liga Española

  • Máximo

    Hola, Ismael;
    Estaba pensando en hacer dinero apostando 100 euros todas las jornadas a que gana el Barcelona (que parece el equipo más fiable en porcentaje de victorias), pero mirando las cuotas, resulta que los las ganancias conseguidas en los aproximadamente 30 partidos que gana, son contrarrestadas con los 8 partidos que pierde. ¿Crees que apostar a un resultado fijo es buena idea? Supongo que esto está más que pensado para que esta clase de apuestas no acaben en ganancias.

    Saludos.

    • Ismael Autor

      Hola Máximo, gracias por tu mensaje. Tal como sospechas, esta manera de apostar no funciona. Las cuotas se calculan para equilibrar la probabilidad promedio. Así que a menos que realmente seas capaz de determinar, en un partido concreto, que la probabilidad que sugieren las cuotas no corresponde a la real, difícilmente ganarás dinero. En eso precisamente estriba el arte de ser un buen tipster o pronosticador. Así que apostar con los ojos cerrados y sin más análisis no puede ser una estrategia ganadora.

  • Sergio

    Hola Ismael

    Solo decirte que me ha gustado mucho tu analisis. Es algo que tenia en mente hacer desde hace mucho tiempo, pero la falta precisamente de tiempo libre me lo ha impedido.

    El motivo por el que queria hacerlo es porque habia una estrategia rondandome la cabeza, y necesitaba analizar la probabilidad de empate para la media tabla, eliminando la cabeza y la cola.

    De hecho esta idea se ve reforzada con tu analisis al ver como la probabilidad de empate se nivela. Si asumimos un 25% de probabilidad de empate, necesitamos cuotas >3 para rentabilizarlo a largo plazo. Ahora mismo mirando en Bet365 no hay ninguna cuota que baje de 3 para los empates.

    Por supuesto necesitaria refinarla, y considerar mas cosas, pero como una idea inicial me parece bastante buena.

    Por cierto, podrias compartir el excel con tus datos?

    Muchas gracias por adelantado y espero tus impresiones
    Sergio

    • Ismael Autor

      Gracias Sergio por tus palabras. Como bien sabrás de otros artículos, probabilidades del 25% implican cuotas superiores a cuatro para rentabilizarlos… 3 sugiere probabilidades superiores, del orden del 33%. Un saludo!

      • Sergio

        Hola Ismael

        Tienes razón, olvide restarle el euro que se invierte del beneficio al calcular la esperanza matematica.

        Algun sitio en tu web donde pueda descargar el excel de este analisis? Gracias

  • Leonardo Aranguren

    Hermano Muchas gracias por escribir este blog es muy interesante sin embargo quiero saber si me puedes ayudar ampliar la informacion acotando una vez teniendo en cuenta los partidos ganados y perdidos, en casa o como visitantes y los empates que formula debo utilizar para desarrollar un pronostico mas acertado para mis apuestas? tambien e leido que hay q tener informacion de los jugadores y de condiciones del terreno y toda la informacion que pueda tener antes del partido. lamentablemente en las aginas que conosco hablan muy poco de esos aspectos sin embargo me gustaria saber si tienes algunas que me puedas indicar para tener esa informacion. me parece muy excelente tu pagina y si puedes dejar un enlace donde hablas de los partidos de la NBA seria excelente. Muchas Muchas Gracias…. Saludos

  • Guillermo

    Buenos días Ismael, me gustaría saber que complejidad de estadística es necesaria para poder tener unas estadísticas precisas que puedan rivalizar con las de una casa de apuestas. Un saludo.

    • Redaccion

      Hola Marcis, gracias por tu mensaje. Es verdad que la clasificación final no la tendrás hasta el final de la liga, pero después de unos cuantos partidos ya tienes una buena aproximación de la tabla. Es verdad que durante la competición irán variando las clasificiaciones, pero a partir de la jornada 8 ó 10 típicamente los cambios no son demasiado grandes y puedes tener una buena aproximación de la probabilidad.