¿Cómo va el índice de Huertas? (2)

Cuatro más partidos que pasaron volando y que terminan la fase de octavos de final. Ocho equipos sobrevivieron. De los primeros cuatro partidos ya hablamos. Los siguientes cuatro dejan al índice maltrecho pero todavía en pie. El índice predecía: victoria de Francia sobre Nigeria (sí, angustiosa pero sí), victoria de Alemania sobre Argelia (de nuevo sí, aunque el modelo predecía una victoria contundente que en realidad nunca llegó), victoria de Argentina contra Suiza (otra vez sí, y otra vez casi que no) y, finalmente, una victoria de Estados Unidos sobre Bélgica (que no fue (esta me dolió), pero en el índice sí fue: 0,09 para Estados Unidos y 0,07 para Bélgica — uno de esos partidos atípicos en los que el vencedor es ofensivamente más “débil” (en este sentido preciso que evalúa el índice) que el derrotado). Así, sobre cuatro puntos yo le pondría un 3,7. Sumando el 2,6 de los primeros partidos el modelito sucio e improvisado logra un honroso 6,3 sobre 8. Seguro que le fue mejor que al pato Alberto. La guartinaja de Montelíbano, Córdoba, Colombia, sí nos superó con 7 de 8.

Un dato adicional (para preocuparnos): el equipo con el mejor índice de Huertas fue Colombia (0,3) seguido de Países Bajos (0,2).

Como dije en la anterior entrada, los índices de Huertas de estos partidos contribuyen información a la tabla con la que se calculan los coeficientes ofensivos y defensivos. Para los equipos sobrevivientes estos números son: Brasil (0,457-0,035), Colombia (0,943-0,015), Países Bajos (0,815, 0,046), Costa Rica (0,517-0,019), Francia (0,537-0,016), Alemania (0,618-0,025), Argentina (0,435-0,029) y Bélgica (0,336-0.048). Esto quiere decir que los índices de Huertas que el modelo predice para cuartos de final son:

Equipo A Equipo B Huertas A Huertas B Pronostico
(HA/HB)
Brasil Colombia 0,007 0,033 0,21
Países Bajos Costa Rica 0,015 0,023 0,65
Francia Alemania 0,013 0,009 1,38
Argentina Bélgica 0,021 0,009 2,13

En este caso el modelo no parece predecir ningún empate. El partido más parejo sería Francia – Alemania (con ventaja para Francia). Yo por mi parte me conformo con que la primera predicción se cumpla el viernes a las buenas o a las malas. El resto me valen güevo, pero (contradiciendo al modelo) sospecho que Países Bajos se lleva a Costa Rica sobrado.

¿Cómo va el índice de Huertas?

Cuatro del ocho partidos de octavos de final han sido jugados y el modelo predictivo basado en el índice de Huertas ha tenido un desempeño desigual: predecía (es un decir) empate de Brasil y Chile (bien), victoria de Colombia sobre Uruguay (bien), victoria de México sobre Holanda (casi pero no) y victoria de Costa Rica sobre Grecia (empataron y finalmente Costa Rica ganó en serie de penales). Podría decirse que logró algo así como 2.6 sobre 4. Yo lo rajaría.

Algunos detalles:

  • Aunque Brazil y Chile empataron a un gol, el índice de Huertas favoreció a Chile: 0.133 – 0.068. La superioridad de Chile fue evidente durante buena parte del juego pero al borde de la derrota los locales lograron empatar e imponerse en una serie de penales deprimente.
  • El partido de México y Holanda concluyó con un 2-1 por un gol por penalti a ultimísimo minuto (falta discutible a Robben en el área) y sólo hasta el minuto 90 fue empatado por Holanda. Hasta entonces el partido lo ganaba México por un gol. En índice de Huertas el resultado fue 0.235 para Holanda y 0.133 para México. Por experimentar calculé también el que sería el índice si a Holanda no le dan ese penal: 0.111. Eso le hubiera dado a México una pequeñísima ventaja sobre Holanda en el indicador. Dado este detalle, de pronto podríamos despachar este resultado como ruido (si se tratara de defender el índice).
  • Finalmente, pese a que Grecia y Costa Rica empataron a un gol (de nuevo, como en el partido del medio día, el empate llegó en el minuto noventa) el índice de Huertas favorecía ostensiblemente a Costa Rica 0.25 contra 0.064 de los griegos. El resultado de los penaltis, podría decirse, fue justo. De todas maneras siento que esta es la predicción más descachada del índice hasta ahora, pues el cálculo del viernes le daba una ventaja inmensa a Costa Rica. El partido fue lamentable.

Estos nuevos números se pueden añadir a la matriz de resultados para recalcular coeficientes ofensivos y defensivos para todos los equipo contando con más información. Cuando terminen los siguientes cuatro partidos publicaré, por jugar, pronósticos para los cuartos de final. Por lo pronto adelanto que pese al empate Costa Rica parecería tener una ligera ventaja sobre Holanda, pero si juegan como jugaron hoy contra los griegos dudo mucho que el índice de Huertas los ampare. Ese fútbol flojo no lo aprueba Dios.

Chilenos llorando

Por el poder del índice de Huertas

Álvaro Huertas

En la antesala de la siguiente ronda de partidos (serán ocho) aprovechemos para seguir dando vueltas alrededor del índice de Huertas (el señor sonriente aquí a la derecha que no se ha visto ni un partido de este mundial).

Advertencia: esta entrada es estrictamente for the lulz y le va la madre al que la tome en serio y empiece a decir imbecilidades obvias sobre las debilidades evidentes del modelo predictivo que vamos a proponer (las sabemos, pero nos parece divertido jugar con los números — no hay pecado alguno en eso; aquí no creemos en la sal).

Arranquemos con la tabla de partido a partido con el índice de Huertas relativo para los equipos correspondientes (o sea calculado usando los tiros y goles del partido para cada equipo).

Noten que en la mayoría de los partidos el radio entre el número de goles y el radio de los índices de Huertas son similares: cuando el índice de Huertas de A es mayor que el índice de Huertas de B, A le gana a B. Hay dos tipos de excepciones: en rojo marco los partidos donde el equipo victorioso tuvo menor índice de Huertas que el derrotado. Estos fueron partidos apretados donde hasta el último minuto no era del todo claro quién ganaría. En amarillo marco los partidos empatados a más de cero goles donde la diferencia de índice de Huertas es notoria en alguna dirección: o sea partidos en los que la aparente ventaja en fuerza ofensiva por alguna razón no alcanzó a imponerse lo suficiente como para superar el empate (el ejemplo más memorable, a mi parecer, es el 2 – 2 de Estados Unidos – Portugal). Espero que no se me haya volado ninguna otra rareza.

Equipo A Equipo B Goles A Goles B Huertas A Huertas B
Brazil Croatia 3 1 0.3000 0.1429
Mexico Cameroon 1 0 0.1538 0.0000
Netherlands Spain 5 1 0.4167 0.1429
Chile Australia 3 1 0.4000 0.1176
Colombia Greece 3 0 0.3158 0.0000
Costa Rica Uruguay 3 1 0.3529 0.1667
Italy England 2 1 0.2353 0.0870
Ivory Coast Japan 2 1 0.1538 0.2222
Switzerland Ecuador 2 1 0.1739 0.1429
France Honduras 3 0 0.2400 0.0000
Argentina Bosnia-Herzegovina 2 1 0.2857 0.0909
Germany Portugal 4 0 0.4211 0.0000
Iran Nigeria 0 0 0.0000 0.0000
USA Ghana 2 1 0.3333 0.0833
Belgium Algeria 2 1 0.1600 0.5000
Russia South Korea 1 1 0.0870 0.1333
Mexico Brazil 0 0 0.0000 0.0000
Netherlands Australia 3 2 0.2609 0.2857
Chile Spain 2 0 0.3333 0.0000
Croatia Cameroon 4 0 0.2963 0.0000
Colombia Ivory Coast 2 1 0.2353 0.1250
Uruguay England 2 1 0.4000 0.1111
Greece Japan 0 0 0.0000 0.0000
Costa Rica Italy 1 0 0.1250 0.0000
France Switzerland 5 2 0.2941 0.1905
Ecuador Honduras 2 1 0.2857 0.0909
Argentina Iran 1 0 0.0800 0.0000
Germany Ghana 2 2 0.2500 0.1600
Nigeria Bosnia-Herzegovina 1 0 0.0690 0.0000
Belgium Russia 1 0 0.1429 0.0000
Algeria South Korea 4 2 0.4000 0.3333
USA Portugal 2 2 0.2000 0.1429
Netherlands Chile 2 0 0.2353 0.0000
Spain Australia 3 0 0.4286 0.0000
Brazil Cameroon 4 1 0.2759 0.1538
Mexico Croatia 3 1 0.4000 0.1538
Uruguay Italy 1 0 0.1053 0.0000
Costa Rica England 0 0 0.0000 0.0000
Colombia Japan 4 1 0.4706 0.0645
Greece Ivory Coast 2 1 0.2222 0.1176
Argentina Nigeria 3 2 0.1935 0.2667
Bosnia-Herzegovina Iran 3 1 0.3529 0.2222
Switzerland Honduras 3 0 0.2308 0.0000
Ecuador France 0 0 0.0000 0.0000
Germany USA 1 0 0.1053 0.0000
Portugal Ghana 2 1 0.1600 0.0952
Belgium South Korea 1 0 0.1000 0.0000
Algeria Russia 1 1 0.1429 0.1538

Aquí viene la magia: existe un procedimiento en álgebra lineal (Huertas en persona lo sugirió) que permite, dada una configuración como esta, obtener para cada país dos números positivos, llamémoslos Coeficiente Ofensivo (CO) y Coeficiente Defensivo (CD) tal que los índices de Huertas del partido del equipo A y el equipo B son aproximadamente (y hay que enfatizar que en este caso es entendiendo el aproximadamente de una forma bastante laxa) CO(A) x CD(B) (Huertas de A) y CO(B) x CD(A) (Huertas de B).

El CO de un equipo mide su capacidad ofensiva, digamos, base (entre más alta mejor) y el CD de un equipo es un número que mide cómo es afectada la CO de un oponente cuando se enfrenta al equipo en cuestión (0 sería el que aniquila la capacidad ofensiva del oponente siempre).

A continuación la tabla de CO y CD para cada país de acuerdo a los cuarenta y ocho partidos de la primera fase:

Equipo CO CD
Brazil 0.4398 0.0254
Croatia 0.4529 0.0598
Mexico 0.4230 0.0131
Cameroon 0.1175 0.0620
Netherlands 0.6971 0.0366
Spain 0.4364 0.0641
Chile 0.5600 0.0302
Australia 0.3080 0.0931
Colombia 0.7802 0.0162
Greece 0.1697 0.0370
Ivory Coast 0.3028 0.0581
Japan 0.2190 0.0534
Costa Rica 0.3650 0.0142
Uruguay 0.5131 0.0397
Italy 0.1797 0.0271
England 0.1513 0.0543
Switzerland 0.4545 0.0373
Ecuador 0.3273 0.0226
France 0.4079 0.0163
Honduras 0.0694 0.0647
Argentina 0.4271 0.0306
Bosnia-Herzegovina 0.3390 0.0493
Iran 0.1697 0.0370
Nigeria 0.2563 0.0165
Germany 0.5929 0.0137
Portugal 0.2313 0.0612
USA 0.4073 0.0283
Ghana 0.2586 0.0635
Belgium 0.3077 0.0427
Algeria 0.7964 0.0553
Russia 0.1839 0.0358
South Korea 0.3564 0.0502

Observación breve: el equipo con el mayor CO es Algeria (seguido de Colombia) y el equipo con el menor CD es México (seguido de Costa Rica).

Ahora empieza la especulación absurda: como notamos en la primera tabla, dado un partido entre A y B, los índices de Huertas de A y B para ese partido parecen ser un buen indicador del resultado. Pero ahora los CD y CO de cada equipo nos permiten predecir índices de Huertas de A y B para equipos que no se han enfrentado: basta multiplicar los correspondientes coeficientes de forma cruzada, como explicaba más arriba.

Por supuesto, todo esto es ridículo porque en realidad contamos con apenas tres partidos para cada equipo (o sea nada), pero imaginémonos por un momento que los CD y CO que obtuvimos son medidas más o menos serias. Si esto fuera así, entonces lo siguiente que deberíamos hacer es calcular los índices de Huertas de los partidos programados para la fase que viene:

Equipo A Equipo B Huertas A Huertas B Pronostico
(HA/HB)
Brazil Chile 0.0133 0.0142 0.9341
Colombia Uruguay 0.0309 0.0083 3.7231
France Nigeria 0.0067 0.0042 1.6170
Germany Algeria 0.0328 0.0109 3.0111
Netherlands Mexico 0.0092 0.0155 0.5916
Costa Rica Greece 0.0135 0.0024 5.5932
Argentina Switzerland 0.0160 0.0139 1.1483
Belgium USA 0.0087 0.0174 0.5007

Quien llegue hasta acá merece un premio: además de calcular los pronósticos del índice de Huertas para cada partido, añadí una columna llamada Pronóstico con la razón entre el Huertas del primer equipo y el Huertas del segundo. Si le creemos a lo que sugiere la primera tabla, una razón muy cerca de 1 diagnosticaría un empate (ese sería nuestro pronóstico incauto para Chile – Brasil); una razón menor a 1 diría que el segundo equipo gana y una razón sobre 1 querría decir que el primer equipo gana. Hagan ustedes sus estimaciones. La magnitud de la razón indicaría algo así como la contundencia de la victoria, pero creo que ya estamos sobrepasando los niveles de abuso cuantitativo tolerables incluso para un blog de aficionados ignorantes como este.

Lo mejor, en cualquier caso, es no confiar en ningún modelo predictivo (todos son horriblemente imprecisos sobre todo en lo que respecta a mundiales — este corresponsal no apostaría ni un peso por ninguna de esas dizque predicciones) y más bien disfrutar del fútbol, que siempre es más edificante que cualquier tabla de números, especialmente en lo que va de este torneo.

Que mañana ganen los mejores, o sea Colombia y Chile.

Porcentaje de pases acertados por equipo (Tercera ronda)

Para continuar con los resúmenes de la tercera ronda, aquí el gráfico obligado comparando efectividad de pase de los diferentes equipos. Esta vez, contraviniendo reglas de gramática básica de esos gráficos de barras, incluí el número de goles anotados en el partido sobre la barra. Definitivamente parecería no haber mayor correlación entre victoria y superioridad en POPA en un partido.

pases.relativos.tercera.ronda

POPA parece medir la aptitud para manejar cierta herramienta de juego pero no necesariamente para volverla un factor decisivo de triunfo. Mañana si hay tiempo cuelgo el acumulado de POPA para los primeros 48 partidos a ver qué cara tiene.

El regreso del índice de Huertas

Ahora que la fase de grupos ha terminado (48 partidos; 136 goles) podemos regresar al índice de Huertas, que pretendía, como les contaba ayer, medir efectividad ofensiva de los países de acuerdo al número de tiros, número de tiros al arco y número de goles a favor.

Dado que el índice es propuesto por un colombiano, no debe sorprendernos que Colombia encabece la tabla al cierre de esta fase. Con ese propósito fue diseñado: para alentar el triunfalismo ciego que incomoda a tanto morrongo por ahí.

Más notable, sin embargo, es la (aparente) capacidad del índice de Huertas para detectar a los equipos clasificados con muy poca información (apenas tres variables acumuladas): exceptuando a Grecia, Nigeria y Bélgica, los demás equipos clasificados encabezan la tabla descontando un bache extraño en el sexto lugar de Croacia, que fue eliminado por México.

En algún artículo leí que se referían a Camerún como el peor equipo de este torneo. El índice de Huertas ilustra bien a qué se refieren con eso. Otra: de pronto Estados Unidos tiene más chance contra Bélgica del que le calcula muy conservadoramente don Nate Silver. Otra más: Chile tiene con qué darse con Brasil. Y otra: Grecia no debió clasificar.

País Goles Tiros Tiros al
arco
% Tiros al arco
sobre tiros
% goles
sobre tiros
% goles sobre
tiros al arco
Índice
de Huertas
Colombia 9 37 16 43 24 56 0.34
Argelia 6 26 12 46 23 50 0.32
Países Bajos 10 41 23 56 24 43 0.31
Chile 5 26 10 38 19 50 0.28
Alemania 7 38 16 42 18 44 0.26
Croacia 6 39 15 38 15 40 0.22
Estados Unidos 4 27 9 33 15 44 0.22
Costa Rica 4 28 11 39 14 36 0.21
Suiza 7 50 20 40 14 35 0.20
Brasil 7 47 23 49 15 30 0.20
Uruguay 4 31 10 32 13 40 0.20
México 4 33 10 30 12 40 0.19
Francia 8 63 26 41 13 31 0.18
Argentina 6 51 19 37 12 32 0.17
Australia 3 27 8 30 11 38 0.17
España 4 36 14 39 11 29 0.16
Ecuador 3 32 10 31 9 30 0.14
Bélgica 4 44 15 34 9 27 0.14
Costa de Marfil 4 47 12 26 9 33 0.14
Corea del Sur 3 34 13 38 9 23 0.13
Bosnia-Herzegovina 4 48 18 38 8 22 0.12
Ghana 4 56 13 23 7 31 0.12
Portugal 4 52 18 35 8 22 0.11
Nigeria 3 42 16 38 7 19 0.10
Italia 2 33 9 27 6 22 0.10
Grecia 2 33 11 33 6 18 0.09
Inglaterra 2 38 12 32 5 17 0.08
Rusia 2 39 12 31 5 17 0.08
Irán 1 24 6 25 4 17 0.07
Japón 2 49 13 27 4 15 0.06
Honduras 1 33 10 30 3 10 0.05
Camerún 1 42 4 10 2 25 0.04

Índice de Huertas

Pregunté en Twitter qué me recomendaban para medir efectividad de ataque usando número de tiros, número de tiros al arco y número de goles. Álvaro Huertas, un físico colombiano devenido en activista altermundista y radicado en la república independiente de Escocia, propuso un puntaje-f. La analogía tiene sentido: el puntaje-f pretende medir la precisión de un test usando la fracción de resultados positivos sobre el total de evaluaciones y la fracción de resultados positivos sobre el total de evaluaciones que deberían ser positivas (ahí en el enlace pueden ver la fórmula: es la media armónica de estos dos valores). En este caso particular cada equipo sería un test y un resultado positivo sería meter gol. El total de evaluaciones sería el total de tiros y el total de evaluaciones que debieron ser gol debería ser el total de tiros al arco.

Esta es la tabla de equipos en el mundial ordenados de acuerdo al índice propuesto por Huertas y considerando sólo sus resultados en los primeros dos juegos del mundial:

País Goles Tiros Tiros al
arco
% Tiros al arco
sobre tiros
% goles
sobre tiros
% goles sobre
tiros al arco
Índice
de Huertas
Argelia 5 18 6 33 28 83 0.42
Chile 5 18 9 50 28 56 0.37
Alemania 6 25 10 40 24 60 0.34
Holanda 8 28 19 68 29 42 0.34
Colombia 5 24 12 50 21 42 0.28
Uruguay 3 17 5 29 18 60 0.27
Francia 8 42 17 40 19 47 0.27
EEUU 4 23 9 39 17 44 0.25
Croacia 5 29 12 41 17 42 0.24
Costa Rica 4 24 9 38 17 44 0.24
Corea del Sur 3 18 9 50 17 33 0.22
Ecuador 3 20 8 40 15 38 0.21
Australia 3 23 8 35 13 38 0.19
Suiza 4 34 10 29 12 40 0.18
Bélgica 3 29 10 34 10 30 0.15
Argentina 3 33 6 18 9 50 0.15
Brasil 3 29 12 41 10 25 0.15
Costa de Marfil 3 34 8 24 9 38 0.14
Italia 2 24 8 33 8 25 0.12
Ghana 3 40 9 22 8 33 0.12
Inglaterra 2 30 11 37 7 18 0.10
Portugal 2 34 11 32 6 18 0.09
Honduras 1 21 6 29 5 17 0.07
México 1 22 6 27 5 17 0.07
Japón 1 25 6 24 4 17 0.06
España 1 26 10 38 4 10 0.06
Rusia 1 30 8 27 3 12 0.05
Nigeria 1 30 13 43 3 8 0.05
Bosnia-Herzegovina 1 36 13 36 3 8 0.04
Grecia 0 20 6 30 0 0
Irán 0 17 4 24 0 0
Camerún 0 30 3 10 0 0

Que encabece Argelia es intrigante pero no del todo descabellado. Al fin y al cabo estamos intentando medir efectividad y en sus dos partidos Argelia logró un 83% de tiros al arco convertidos en gol. De resto la tabla parece reiterar las sospechas que tenemos sobre la efectividad de holandeses y alemanes. Chile es obviamente otra sorpresa pero tampoco tanto. Hasta el segundo partido llevaba solo victorias. Recuerden que no estamos considerando en esta tabla su derrota ante Holanda. Muy seguramente al final de la ronda de grupos los equipos cambiarán bastante de posición. Me intriga dónde terminará Argentina después de los dos goles de Messi.

Prometo revisión de esta tabla en pocos días.

Artilleros

Los quince mayores tiradores de las primeras dos rondas de la fase de grupos (32 partidos y 519 jugadores; 315 han intentado tiros) ordenados por número de disparos. O por qué Holanda da tanto miedo:

Nombre País Goles Tiros Tiros al arco % Tiros al arco
sobre total tiros
Karim Benzema Francia 3 15 8 53
Cristiano Ronaldo Portugal 0 14 3 21
Lionel Messi Argentina 2 10 2 20
Edin Dzeko Bosnia-Herzegovina 0 9 4 44
Xherdan Shaqiri Suiza 0 9 2 22
Robin van Persie Holanda 3 8 6 75
Daniel Sturridge Inglaterra 1 8 5 62
James Rodríguez Colombia 2 8 4 50
Ogenyi Onazi Nigeria 0 8 3 38
Asamoah Gyan Ghana 1 8 2 25
Arjen Robben Holanda 3 7 6 86
Neymar Brasil 2 7 4 57
Nani Portugal 1 7 4 57
Clint Dempsey EEUU 2 7 4 57
Tim Cahill Australia 2 7 3 43

Robben_van_Persie

Porcentaje de pases acertados por equipo (Segunda ronda)

Pareciera que el fútbol no se deja medir. La primera ronda de la fase de grupos, por ejemplo, me había dejado convencido de que los partidos donde el porcentaje de pases acertados (llamemos a eso “POPA” para abreviar) del vencido era mayor que el del vencedor eran una rareza de dependía de estilos de juego idiosincráticos como el de España: equipos que controlan la pelota muy bien pero no logran armar ofensivas efectivas. En la segunda ronda, sin embargo, la mayoría de partidos terminaron de esa forma:

pases.relativos.segunda.ronda

Como si lo hicieran intencionalmente para contradecirme, los únicos partidos donde se cumplió la regla empírica (ahora a todas luces descabellada) que había propuesto fueron Croacia-Camerún, Ecuador-Honduras, esa horripilancia de partido Argentina-Irán y (escasamente) Bélgica-Rusia. Cuatro de dieciséis partidos.

Curiosidades:

  • Partido más intenso/fluído (de acuerdo al promedio de POPAs): Estados Unidos – Portugal.
  • Partido más pausado/contenido: Uruguay – Inglaterra.
  • Partido más parejo (de acuerdo a diferencia de POPAs): Bélgica – Rusia.
  • Partido más disparejo: Argentina – Irán (aquí más peculiaridades cuantitativas de este encuentro).
  • Con respecto a la primera ronda, la segunda fue ligeramente menos intensa en general: mientras que en la primera ronda el promedio de promedios de POPA por partido fue 83,22, en esta segunda ronda fue de 80,29.
  • Con respecto a la primera ronda, esta segunda ronda fue más desigual: mientras que en la primera el promedio de (valores absolutos) de las diferencias de POPA fue 6,57 en esta segunda ronda alcanzó los 8,71.

Aquí la tabla con todos los números:

E1 G POPA E2 G POPA DIF PRM
1 Mexico 0 79.60 Brazil 0 83.85 -4.26 81.73
2 Netherlands 3 79.43 Australia 2 80.19 -0.76 79.81
3 Chile 2 73.06 Spain 0 82.98 -9.92 78.02
4 Croatia 4 85.64 Cameroon 0 81.00 4.64 83.32
5 Colombia 2 79.18 Ivory Coast 1 84.57 -5.39 81.88
6 Uruguay 2 62.85 England 1 82.53 -19.68 72.69
7 Greece 0 65.92 Japan 0 89.57 -23.65 77.75
8 Costa Rica 1 76.55 Italy 0 89.24 -12.69 82.89
9 France 5 81.09 Switzerland 2 84.43 -3.34 82.76
10 Ecuador 2 75.83 Honduras 1 72.63 3.21 74.23
11 Argentina 1 90.23 Iran 0 63.97 26.26 77.10
12 Germany 2 86.48 Ghana 2 77.90 8.58 82.19
13 Nigeria 1 80.43 Bosnia-Herzegovina 0 85.43 -5.00 82.93
14 Belgium 1 80.27 Russia 0 79.94 0.32 80.11
15 Algeria 4 79.56 South Korea 2 80.77 -1.21 80.17
16 USA 2 86.25 Portugal 2 88.08 -1.83 87.17

Sigo intrigado por la “sustancia futbolística” (por así decirlo) de este indicador. ¿Qué mide? ¿Qué determina? ¿Es meramente estético? ¿Por qué pareciera que desprecio o subvaloro la belleza en la pregunta anterior? ¿Qué es la belleza en el fútbol? ¿Qué es la belleza en el universo? ¿Dónde está? ¿Cuánto importa la belleza? Algunas pruebas preliminares parecen sugerir que hay una correlación positiva entre POPA y número de (digamos) tiros al arco. Pero dado lo visto mejor me espero hasta acumular dieciséis partidos más antes de soltar una conclusión de ese estilo.

Durante esta semana, dependiendo del tiempo que tenga, intentaré comparar la capacidad ofensiva y defensiva de los diferentes equipos en lo que va del campeonato aprovechando que ahora tengo más información.

Argentina – Irán: una singularidad desnuda

El partido Argentina contra Irán que Argentina ganó agónicamente con un gol de Messi en el minuto noventa y uno fue una singularidad de muchas formas a la vez.

La primera y más obvia la señala Cathal Kelly en su crónica sobre el partido para The Globe and Mail: el mejor jugador del equipo iraní (Reza) juega para un equipo de segunda división inglés (Charlton Athletic) mientras que el equipo argentino cuenta con jugadores en Barça, Real Madrid y Manchester City, entre otros. Valor de los pases de los jugadores de Argentina: 600 millones de dólares. Valor de los pases de los jugadores de Irán: 35 millones escasos.

Una cuantitativa menos evidente: el porcentaje de efectividad de pase de Irán fue 64%, el segundo peor para un equipo en lo que va del campeonato (Funfact: el peor fue el del equipo de Uruguay que venció a Inglaterra: 62%.) El de Argentina, 90%. Esto lo hace, de lejos, el partido más desequilibrado en cuanto a dominio del balón, con una diferencia de 26 puntos (para comparar, recuerden que en primera ronda lo más desequilibrado, y ya parecía casi cruel, era Bélgica contra Argelia, con apenas 16 puntos de diferencia.)

Peor aún: Argentina hizo 21 tiros al arco iraní y 41 centros. Por lo pronto, no hay ningún equipo en el torneo que lo supere en número de centros en un partido y apenas hay uno que ha tenido más tiros al arco: 22 de Francia en el partido contra Suiza. Si usamos tiros al arco más centros como un indicador de oportunidades de gol, este Argentina que jugó contra Irán no tiene igual ni similar.

Y sin embargo con toda esa ventaja sólo hizo un gol. Un gol(azo) triste que a mí me sigue sabiendo a empate si no a derrota. Aunque supongo que siempre se puede decir que lo único que importa son los goles e ignorar el resto, como hacen los modelos predictivos que están tan de moda y tanto se equivocan.

En Teherán seguro celebraron.

Reza

Los pases con la edad

Hoy inauguramos nuestra sección Preguntas de los lectores con una hipótesis propuesta por el señor Óscar Rodríguez desde el bellísimo departamento de Córdoba, en la costa caribe de Colombia. En su carta, el señor Rodríguez pregunta si hay relación entre la edad y la precisión del pase. La hipótesis de nuestro corresponsal es que entre mayor edad mayor precisión. De esta pregunta deduzco que probablemente el señor Rodríguez es un cuarentón preocupado, como todo adulto maduro, por su desempeño, entendido en ese sentido cosmogónico que la vida adquiere más o menos a esa edad. Lo invito a aceptar con dignidad su senectud inminente. Como sea, a continuación a modo de respuesta una gráfica de edad contra porcentaje de pases acertados de cada jugador. Dada las diferencias en función en el juego, hago un plano por cada posición:

pases.acertados.edad

Dos observaciones: (1) Parecería que no: al menos si nos restringimos a los dieciséis partidos de la primera ronda de la fase de grupos, no parecería haber mayor calidad de pase entre jugadores más experimentados que entre los jovenes. Si acaso, (2) los delanteros más jóvenes parecen más capaces en el pase que los veteranos. (En Twitter dije erróneamente que el gráfico sugería que con la edad los delanteros perdían calidad de pase pero probablemente la hipótesis más justa (como varios corrieron a corregir) es que la diferencia es generacional, de escuela.)

Una pregunta relacionada es si los jugadores más experimentados, dados sus años en el fútbol y la supuesta humildad que viene con el tiempo, estarían más dispuestos a pasar (mal o bien) que los más jóvenes. Revisemos la gráfica comparando edad y número total de pases:

pases.totales.edad

De nuevo la respuesta parece ser no. La edad no nos hace mejores ni más amables.

Un saludo al señor Rodríguez y fuerza en esa nueva etapa de su vida.

Recuerden que nos pueden hacer preguntas en Twitter o por carta. Preferimos las cartas.

Porcentaje de pases acertados por equipo (Primera ronda)

Ahora que ha terminado la primera ronda de la fase de grupos, con dieciséis partidos jugados (apenas dos empates) y cuarenta y seis goles anotados (cuatrocientos cuarenta y tres jugadores han participado en los juegos), vale la pena hacer una valoración general de los equipos y partidos de acuerdo al porcentaje de pases acertados por equipo, tal y como ya hicimos con los primeros ocho partidos en esta entrada.

pases.relativos.primera.ronda

Los partidos más parejos en este sentido fueron Colombia-Grecia (diferencia de 0,5 puntos a favor de Colombia) y Alemania-Portugal (diferencia de 1,05 a favor de Alemania). Los más disparejos fueron Bélgica-Argelia (diferencia de 16,39 puntos a favor de Bélgica) y Francia-Honduras (diferencia de 12,71 a favor de Francia).

Mención especial merecen los dos empates: en Irán-Nigeria la ventaja a favor de Nigeria era inmensa (¡12,18 puntos!) pero fue totalmente desaprovechada por falta de definición. En Rusia-Corea del Sur, en cambio, la competencia fue pareja (con apenas 1,61 a favor de los coreanos, que en la opinión de este comentarista resentido y desinformado merecían ganar).

Si aceptamos, como propuse en la entrada anterior, que el promedio de porcentajes de pases acertados es una medida razonable de “intensidad” del juego, por lo pronto los mejores dos juegos han sido Italia-Inglaterra (92 puntos) y Alemania-Portugal (87,99 puntos), y los dos más aburridos serían Iran-Nigeria (77,8 puntos) y Estados Unidos-Ghana (77,86 puntos). Pero a mí me divirtió Estados Unidos-Ghana así que no sé.

Estados Unidos-Ghana también es de destacar porque hace parte de ese grupo de partidos extraños en los que el derrotado tiene mayor control de la pelota, igual que Holanda-España. En este caso, Ghana aventajaba a Estados Unidos por 10,07 puntos, una diferencia muy alta, pero fueron derrotados 2-1. Tuvieron mala suerte: durante el partido sumaron 21 tiros al arco y 38 centros. En total, 59 oportunidades de gol desperdiciadas. Ningún otro equipo ha tenido tantas en un partido en lo que va del torneo (30,8 en promedio).

Aquí está la tabla completa con estos cálculos para la primera ronda:

E1 G %PA E2 G %PA DIF PRM
1 Brazil 3 85.37 Croatia 1 78.29 7.07 81.83
2 Mexico 1 85.34 Cameroon 0 81.82 3.52 83.58
3 Netherlands 5 81.42 Spain 1 87.38 -5.96 84.40
4 Chile 3 86.42 Australia 1 79.44 6.98 82.93
5 Colombia 3 82.89 Greece 0 82.38 0.51 82.63
6 Costa Rica 3 79.03 Uruguay 1 77.96 1.07 78.49
7 Italy 2 93.19 England 1 90.81 2.38 92.00
8 Ivory Coast 2 88.58 Japan 1 78.87 9.71 83.73
9 Switzerland 2 87.70 Ecuador 1 79.02 8.68 83.36
10 France 3 90.66 Honduras 0 77.95 12.71 84.30
11 Argentina 2 90.21 Bosnia-Herzegovina 1 84.95 5.26 87.58
12 Germany 4 88.52 Portugal 0 87.47 1.05 87.99
13 Iran 0 71.71 Nigeria 0 83.88 -12.18 77.80
14 USA 2 72.83 Ghana 1 82.89 -10.07 77.86
15 Belgium 2 88.49 Algeria 1 72.10 16.39 80.29
16 Russia 1 82.09 South Korea 1 83.70 -1.61 82.90

En una próxima entrada intentaremos comparar el porcentaje de pases acertados con otros indicadores de ataque y defensa para entender más a detalle su significado práctico en el juego.

Pases

Simplifiquemos (olvidemos el amor del gol, los colores, la pasión, el sudor, la tensión y hasta el espacio físico) y pensemos en el fútbol como un juego de pases. Los pases son dominio y los pases exitosos son la preservación del dominio. En la ingenuidad de esta perspectiva el control es una condición necesaria para el triunfo (o al menos para evitar la derrota).

Para empezar, tomemos cada uno de los equipos que han jugado hasta ahora y calculemos el número de pases totales y, entre ellos, el número de pases acertados:

pases.absolutos

Generalmente, el equipo que gana el partido hace más pases que el derrotado. En algunos partidos, sin embargo, no fue así: en Holanda – España, Colombia – Grecia y Costa Rica – Uruguay el vencido supera al vencedor en pases visiblemente. La magnitud en el número de pases habla tal vez de estilo de juego más que de control. Tal vez un mejor indicador de control es el porcentaje de pases acertados sobre los pases totales. Intentemos ahora eso:

pases.relativos

Ahora la regularidad es más clara: exceptuando Holanda – España, en el resto de partidos el vencedor ha sido el equipo con mayor porcentaje de pases acertados. En el caso de Holanda – España pensé inicialmente que sería una peculiaridad holandesa al respecto de su estilo de juego, pero Pablo Bueno en Twitter me explicó que esta es más bien una rareza española: el equipo se especializa en controlar pero tiene dificultades definiendo. Pierda o gane, siempre controla.

Otra observación: si la diferencia en porcentaje de pases acertados se lee como un indicador de ventaja, los partidos más parejos hasta ahora serían Colombia – Grecia (diferencia de apenas 0,5 puntos) y Costa Rica – Uruguay (diferencia de 1,06 puntos). Y el más desigual es Costa de Marfil – Japón, con una diferencia de casi 10 puntos (9,7). Sólo por curiosidad, España, aunque brutalmente derrotada, le saca a Holanda casi 6 puntos (5,96).

Y otra más: después del partido de Inglaterra – Italia, que no vi, leí a varios comentaristas decir que había sido el más intenso y emocionante hasta ahora. Si es así, estos porcentajes de pases acertados parecen un buen indicador de intensidad: si ambas barras son largas, el partido es más intenso. Podríamos usar el promedio de los porcentajes de ambos equipos como un indicador de intensidad. En ese caso, mientras que la mayoría de los partidos están entre los 78 y los 84 puntos, el partido de Italia – Inglaterra alcanza los 92. El más “aburrido”, en ese caso, habría sido Costa Rica – Uruguay, con apenas 78,49 puntos. Supongo que los costarricenses no estarán de acuerdo.

Para terminar adentrémonos en el nivel individual: en lugar de considerar el porcentaje grupal de pases acertados calculémoslo jugador a jugador y grafiquemos la distribución de estos valores para cada equipo:

pases.distribucion

La línea roja es el promedio de porcentajes de pases acertados para todos los 222 jugadores que han participado en el torneo hasta este momento. Las barras describen, por así decirlo, la dispersión técnica de los jugadores medida por su efectividad al completar pases. Mientras que los ingleses son parejamente eficientes (parejamente profesionales), los croatas y los camerunenses tienen jugadores en todo el espectro de aptitud técnica (son equipos desiguales). De nuevo, es evidente la excepcionalidad del partido Italia – Inglaterra así como la ventaja bestial de Costa de Marfil sobre Japón.

Durante la segunda fase de esta primera ronda podremos apreciar qué tan persistentes son estos patrones para cada equipo. Y de paso exploraremos la relación de estos indicadores de pases con otros más específicos del ataque y la defensa.

(Aunque ya lo he dicho antes, no sobra reiterar que los cálculos que hacemos están basados en los datos disponibles en WhoScored.com.)

Voladores

Esta es otra de esas gráficas que si mi Dios me da vida y paciencia volveré a hacer más adelante: por lo pronto, setenta y dos jugadores han participado en “duelos aéreos”. Un duelista volador es victorioso cuando cabecea antes que su oponente en el mismo plan. Aquí la diferencia entre victorias y derrotas de duelos aéreos contra la estatura de los jugadores diferenciados por equipo y posición en el juego. Para que los puntos no se solaparan los perturbé un tris horizontalmente. La línea roja es el promedio de estaturas del grupo completo.

duelos.aereos

El menos efectivo es el mediocampista croata Ivan Perisic (dos ganados, seis perdidos y 1,87 metros) y el cabeceador número uno por lo pronto es el defensa Jason Davidson, de Australia (cinco ganados, cero perdidos y 1,80 metros). El más entregado al duelo aéreo es el croata Nikica Jelavic, con diez duelos hasta ahora (otro en 1,87 metros). Por desgracia, ha perdido seis de esos diez duelos.

Estos cálculos asumen, claro, que la efectividad de un duelista volador es mayor si la diferencia entre victorias y derrotas es mayor. Tremendamente discutible. Un criterio más justo (pero tal vez menos emocionante) sería calcular la razón entre el número de duelos ganados sobre duelos totales. Entre más próximo a uno, el jugador es un mejor cabeceador. Así le reconocemos a Ivan Perisic que es sin duda mejor que los que intentan y nunca le dan. Este es el resultado en ese caso (de nuevo perturbé un poco el gráfico horizontalmente para reducir puntos solapados; uso el tamaño de los puntos para representar el total de duelos en los que el jugador correspondiente participó):

duelos.aereos.razon

Desde Mundo Pelota un saludo especial a esos valientes por debajo del metro setenta (como el delantero chileno Alexis Sánchez: uno ganado, cuatro perdidos, 1,68 metros) que de todas maneras se lanzan a luchar un cabezazo. Todo el respeto es para ellos.

(De nuevo, para estos cálculos usamos los datos disponibles en WhoScored.com.)

Masa

Ahora tenemos a nuestros becarios anotando a mano en cuadernos argollados viejos los datos para cada jugador disponibles en WhoScored.com.

En este momento, con cuatro partidos jugados, ciento diez jugadores han participado (activamente) en partidos del mundial. Por curiosidad, para ver cómo se ve eso entre deportistas profesionales, me puse a calcular su índice de masa corporal (en gringo, BMI). Aquí la distribución BMIs de los jugadores diferenciados por equipos y coloreados de acuerdo a su posición en el juego. La línea roja es el promedio del grupo completo.

BMI

El jugador con el BMI más alto en este grupo es el defensa Cedric Djeugoue de Camerún. El que tiene el BMI más bajo es el mediocampista croata Mateo Kovacic.

¿Se dieron cuenta de lo extraña que es la defensa de Holanda?

Cuando todos los equipos hayan jugado la primera ronda vuelvo a hacer este gráfico.

Rankings y campeones

El ranking de la FIFA es un instrumento de medición de equipos nacionales extraño y no particularmente confiable (aquí cómo lo calculan y resúmenes de las críticas) que la FIFA lleva promocionando (con el patrocinio reciente de Coca-Cola) desde 1993. Aquí en Mundo Pelota no le hacemos mala cara a ninguna perspectiva así que con el apoyo de nuestros becarios recopilamos a mano los datos del ranking de la FIFA, mes a mes, desde 1993 hasta junio de 2014. La tabla correspondiente está en nuestro repositorio en GitHub.

Pregunta: ¿cuáles son los mejores equipos en este justo momento de acuerdo al sistema de puntuación de FIFA?

Para detectar los mejores equipos según el ranking tomamos las sucesiones de posiciones mes a mes desde 1993 hasta hoy y aplicamos un algoritmo de clustering básico (k-means) que dividiera la lista de países en cinco grupos de acuerdo a similitud. Después tomamos el grupo que tuviera (por decir algo) el promedio de promedios de puntajes más alto (aquí están los cálculos en R). Este grupo de veinticuatro países lo conforman Alemania, Argentina, Brasil, Colombia, Croacia, Dinamarca, España, Estados Unidos Francia, Grecia, Inglaterra, Irlanda, Italia, Japón, México, Noruega, Países Bajos, Paraguay, Portugal, Rumania, Rusia, Suecia, Turquía y Uruguay. Considerando lo arbitrario que parece el ranking hace un trabajo más que digno aislando a los países con fama de fútbol fuerte.

Otra pregunta: ¿Y cómo les ha ido a estos veinticuatro países en el ranking FIFA desde el año 2000 hasta hoy?

top.ranking.loess

Las curvas son versiones suavizadas (o sea, describiendo las tendencias) de las posiciones en el ranking de los diferentes equipos. El tubo gris que las rodea representa el margen de error para cada curva. Que sean tendencias es lo que permite que las curvas puedan sumergirse bajo cero (por la fuerza del ascenso en las primeras posiciones). Hagan clic en el gráfico si quieren verlo ampliado.

Hoy nuestro editor en jefe decía en Twitter: “Mi pronóstico para este mundial es que vamos a ser campeones y desde la cima vamos a saludar”. El ranking de la FIFA, por lo menos, parece darle la razón.

Adenda: ¿Otro sistema de puntuación de equipos? Qué tal el Unofficial Football World Championships, que usa esencialmente las reglas del boxeo para decidir quién lleva la corona. En este momento su campeón es Uruguay.