¿Cómo va el índice de Huertas? (2)

Cuatro más partidos que pasaron volando y que terminan la fase de octavos de final. Ocho equipos sobrevivieron. De los primeros cuatro partidos ya hablamos. Los siguientes cuatro dejan al índice maltrecho pero todavía en pie. El índice predecía: victoria de Francia sobre Nigeria (sí, angustiosa pero sí), victoria de Alemania sobre Argelia (de nuevo sí, aunque el modelo predecía una victoria contundente que en realidad nunca llegó), victoria de Argentina contra Suiza (otra vez sí, y otra vez casi que no) y, finalmente, una victoria de Estados Unidos sobre Bélgica (que no fue (esta me dolió), pero en el índice sí fue: 0,09 para Estados Unidos y 0,07 para Bélgica — uno de esos partidos atípicos en los que el vencedor es ofensivamente más “débil” (en este sentido preciso que evalúa el índice) que el derrotado). Así, sobre cuatro puntos yo le pondría un 3,7. Sumando el 2,6 de los primeros partidos el modelito sucio e improvisado logra un honroso 6,3 sobre 8. Seguro que le fue mejor que al pato Alberto. La guartinaja de Montelíbano, Córdoba, Colombia, sí nos superó con 7 de 8.

Un dato adicional (para preocuparnos): el equipo con el mejor índice de Huertas fue Colombia (0,3) seguido de Países Bajos (0,2).

Como dije en la anterior entrada, los índices de Huertas de estos partidos contribuyen información a la tabla con la que se calculan los coeficientes ofensivos y defensivos. Para los equipos sobrevivientes estos números son: Brasil (0,457-0,035), Colombia (0,943-0,015), Países Bajos (0,815, 0,046), Costa Rica (0,517-0,019), Francia (0,537-0,016), Alemania (0,618-0,025), Argentina (0,435-0,029) y Bélgica (0,336-0.048). Esto quiere decir que los índices de Huertas que el modelo predice para cuartos de final son:

Equipo A Equipo B Huertas A Huertas B Pronostico
(HA/HB)
Brasil Colombia 0,007 0,033 0,21
Países Bajos Costa Rica 0,015 0,023 0,65
Francia Alemania 0,013 0,009 1,38
Argentina Bélgica 0,021 0,009 2,13

En este caso el modelo no parece predecir ningún empate. El partido más parejo sería Francia – Alemania (con ventaja para Francia). Yo por mi parte me conformo con que la primera predicción se cumpla el viernes a las buenas o a las malas. El resto me valen güevo, pero (contradiciendo al modelo) sospecho que Países Bajos se lleva a Costa Rica sobrado.

¿Cómo va el índice de Huertas?

Cuatro del ocho partidos de octavos de final han sido jugados y el modelo predictivo basado en el índice de Huertas ha tenido un desempeño desigual: predecía (es un decir) empate de Brasil y Chile (bien), victoria de Colombia sobre Uruguay (bien), victoria de México sobre Holanda (casi pero no) y victoria de Costa Rica sobre Grecia (empataron y finalmente Costa Rica ganó en serie de penales). Podría decirse que logró algo así como 2.6 sobre 4. Yo lo rajaría.

Algunos detalles:

  • Aunque Brazil y Chile empataron a un gol, el índice de Huertas favoreció a Chile: 0.133 – 0.068. La superioridad de Chile fue evidente durante buena parte del juego pero al borde de la derrota los locales lograron empatar e imponerse en una serie de penales deprimente.
  • El partido de México y Holanda concluyó con un 2-1 por un gol por penalti a ultimísimo minuto (falta discutible a Robben en el área) y sólo hasta el minuto 90 fue empatado por Holanda. Hasta entonces el partido lo ganaba México por un gol. En índice de Huertas el resultado fue 0.235 para Holanda y 0.133 para México. Por experimentar calculé también el que sería el índice si a Holanda no le dan ese penal: 0.111. Eso le hubiera dado a México una pequeñísima ventaja sobre Holanda en el indicador. Dado este detalle, de pronto podríamos despachar este resultado como ruido (si se tratara de defender el índice).
  • Finalmente, pese a que Grecia y Costa Rica empataron a un gol (de nuevo, como en el partido del medio día, el empate llegó en el minuto noventa) el índice de Huertas favorecía ostensiblemente a Costa Rica 0.25 contra 0.064 de los griegos. El resultado de los penaltis, podría decirse, fue justo. De todas maneras siento que esta es la predicción más descachada del índice hasta ahora, pues el cálculo del viernes le daba una ventaja inmensa a Costa Rica. El partido fue lamentable.

Estos nuevos números se pueden añadir a la matriz de resultados para recalcular coeficientes ofensivos y defensivos para todos los equipo contando con más información. Cuando terminen los siguientes cuatro partidos publicaré, por jugar, pronósticos para los cuartos de final. Por lo pronto adelanto que pese al empate Costa Rica parecería tener una ligera ventaja sobre Holanda, pero si juegan como jugaron hoy contra los griegos dudo mucho que el índice de Huertas los ampare. Ese fútbol flojo no lo aprueba Dios.

Chilenos llorando

Por el poder del índice de Huertas

Álvaro Huertas

En la antesala de la siguiente ronda de partidos (serán ocho) aprovechemos para seguir dando vueltas alrededor del índice de Huertas (el señor sonriente aquí a la derecha que no se ha visto ni un partido de este mundial).

Advertencia: esta entrada es estrictamente for the lulz y le va la madre al que la tome en serio y empiece a decir imbecilidades obvias sobre las debilidades evidentes del modelo predictivo que vamos a proponer (las sabemos, pero nos parece divertido jugar con los números — no hay pecado alguno en eso; aquí no creemos en la sal).

Arranquemos con la tabla de partido a partido con el índice de Huertas relativo para los equipos correspondientes (o sea calculado usando los tiros y goles del partido para cada equipo).

Noten que en la mayoría de los partidos el radio entre el número de goles y el radio de los índices de Huertas son similares: cuando el índice de Huertas de A es mayor que el índice de Huertas de B, A le gana a B. Hay dos tipos de excepciones: en rojo marco los partidos donde el equipo victorioso tuvo menor índice de Huertas que el derrotado. Estos fueron partidos apretados donde hasta el último minuto no era del todo claro quién ganaría. En amarillo marco los partidos empatados a más de cero goles donde la diferencia de índice de Huertas es notoria en alguna dirección: o sea partidos en los que la aparente ventaja en fuerza ofensiva por alguna razón no alcanzó a imponerse lo suficiente como para superar el empate (el ejemplo más memorable, a mi parecer, es el 2 – 2 de Estados Unidos – Portugal). Espero que no se me haya volado ninguna otra rareza.

Equipo A Equipo B Goles A Goles B Huertas A Huertas B
Brazil Croatia 3 1 0.3000 0.1429
Mexico Cameroon 1 0 0.1538 0.0000
Netherlands Spain 5 1 0.4167 0.1429
Chile Australia 3 1 0.4000 0.1176
Colombia Greece 3 0 0.3158 0.0000
Costa Rica Uruguay 3 1 0.3529 0.1667
Italy England 2 1 0.2353 0.0870
Ivory Coast Japan 2 1 0.1538 0.2222
Switzerland Ecuador 2 1 0.1739 0.1429
France Honduras 3 0 0.2400 0.0000
Argentina Bosnia-Herzegovina 2 1 0.2857 0.0909
Germany Portugal 4 0 0.4211 0.0000
Iran Nigeria 0 0 0.0000 0.0000
USA Ghana 2 1 0.3333 0.0833
Belgium Algeria 2 1 0.1600 0.5000
Russia South Korea 1 1 0.0870 0.1333
Mexico Brazil 0 0 0.0000 0.0000
Netherlands Australia 3 2 0.2609 0.2857
Chile Spain 2 0 0.3333 0.0000
Croatia Cameroon 4 0 0.2963 0.0000
Colombia Ivory Coast 2 1 0.2353 0.1250
Uruguay England 2 1 0.4000 0.1111
Greece Japan 0 0 0.0000 0.0000
Costa Rica Italy 1 0 0.1250 0.0000
France Switzerland 5 2 0.2941 0.1905
Ecuador Honduras 2 1 0.2857 0.0909
Argentina Iran 1 0 0.0800 0.0000
Germany Ghana 2 2 0.2500 0.1600
Nigeria Bosnia-Herzegovina 1 0 0.0690 0.0000
Belgium Russia 1 0 0.1429 0.0000
Algeria South Korea 4 2 0.4000 0.3333
USA Portugal 2 2 0.2000 0.1429
Netherlands Chile 2 0 0.2353 0.0000
Spain Australia 3 0 0.4286 0.0000
Brazil Cameroon 4 1 0.2759 0.1538
Mexico Croatia 3 1 0.4000 0.1538
Uruguay Italy 1 0 0.1053 0.0000
Costa Rica England 0 0 0.0000 0.0000
Colombia Japan 4 1 0.4706 0.0645
Greece Ivory Coast 2 1 0.2222 0.1176
Argentina Nigeria 3 2 0.1935 0.2667
Bosnia-Herzegovina Iran 3 1 0.3529 0.2222
Switzerland Honduras 3 0 0.2308 0.0000
Ecuador France 0 0 0.0000 0.0000
Germany USA 1 0 0.1053 0.0000
Portugal Ghana 2 1 0.1600 0.0952
Belgium South Korea 1 0 0.1000 0.0000
Algeria Russia 1 1 0.1429 0.1538

Aquí viene la magia: existe un procedimiento en álgebra lineal (Huertas en persona lo sugirió) que permite, dada una configuración como esta, obtener para cada país dos números positivos, llamémoslos Coeficiente Ofensivo (CO) y Coeficiente Defensivo (CD) tal que los índices de Huertas del partido del equipo A y el equipo B son aproximadamente (y hay que enfatizar que en este caso es entendiendo el aproximadamente de una forma bastante laxa) CO(A) x CD(B) (Huertas de A) y CO(B) x CD(A) (Huertas de B).

El CO de un equipo mide su capacidad ofensiva, digamos, base (entre más alta mejor) y el CD de un equipo es un número que mide cómo es afectada la CO de un oponente cuando se enfrenta al equipo en cuestión (0 sería el que aniquila la capacidad ofensiva del oponente siempre).

A continuación la tabla de CO y CD para cada país de acuerdo a los cuarenta y ocho partidos de la primera fase:

Equipo CO CD
Brazil 0.4398 0.0254
Croatia 0.4529 0.0598
Mexico 0.4230 0.0131
Cameroon 0.1175 0.0620
Netherlands 0.6971 0.0366
Spain 0.4364 0.0641
Chile 0.5600 0.0302
Australia 0.3080 0.0931
Colombia 0.7802 0.0162
Greece 0.1697 0.0370
Ivory Coast 0.3028 0.0581
Japan 0.2190 0.0534
Costa Rica 0.3650 0.0142
Uruguay 0.5131 0.0397
Italy 0.1797 0.0271
England 0.1513 0.0543
Switzerland 0.4545 0.0373
Ecuador 0.3273 0.0226
France 0.4079 0.0163
Honduras 0.0694 0.0647
Argentina 0.4271 0.0306
Bosnia-Herzegovina 0.3390 0.0493
Iran 0.1697 0.0370
Nigeria 0.2563 0.0165
Germany 0.5929 0.0137
Portugal 0.2313 0.0612
USA 0.4073 0.0283
Ghana 0.2586 0.0635
Belgium 0.3077 0.0427
Algeria 0.7964 0.0553
Russia 0.1839 0.0358
South Korea 0.3564 0.0502

Observación breve: el equipo con el mayor CO es Algeria (seguido de Colombia) y el equipo con el menor CD es México (seguido de Costa Rica).

Ahora empieza la especulación absurda: como notamos en la primera tabla, dado un partido entre A y B, los índices de Huertas de A y B para ese partido parecen ser un buen indicador del resultado. Pero ahora los CD y CO de cada equipo nos permiten predecir índices de Huertas de A y B para equipos que no se han enfrentado: basta multiplicar los correspondientes coeficientes de forma cruzada, como explicaba más arriba.

Por supuesto, todo esto es ridículo porque en realidad contamos con apenas tres partidos para cada equipo (o sea nada), pero imaginémonos por un momento que los CD y CO que obtuvimos son medidas más o menos serias. Si esto fuera así, entonces lo siguiente que deberíamos hacer es calcular los índices de Huertas de los partidos programados para la fase que viene:

Equipo A Equipo B Huertas A Huertas B Pronostico
(HA/HB)
Brazil Chile 0.0133 0.0142 0.9341
Colombia Uruguay 0.0309 0.0083 3.7231
France Nigeria 0.0067 0.0042 1.6170
Germany Algeria 0.0328 0.0109 3.0111
Netherlands Mexico 0.0092 0.0155 0.5916
Costa Rica Greece 0.0135 0.0024 5.5932
Argentina Switzerland 0.0160 0.0139 1.1483
Belgium USA 0.0087 0.0174 0.5007

Quien llegue hasta acá merece un premio: además de calcular los pronósticos del índice de Huertas para cada partido, añadí una columna llamada Pronóstico con la razón entre el Huertas del primer equipo y el Huertas del segundo. Si le creemos a lo que sugiere la primera tabla, una razón muy cerca de 1 diagnosticaría un empate (ese sería nuestro pronóstico incauto para Chile – Brasil); una razón menor a 1 diría que el segundo equipo gana y una razón sobre 1 querría decir que el primer equipo gana. Hagan ustedes sus estimaciones. La magnitud de la razón indicaría algo así como la contundencia de la victoria, pero creo que ya estamos sobrepasando los niveles de abuso cuantitativo tolerables incluso para un blog de aficionados ignorantes como este.

Lo mejor, en cualquier caso, es no confiar en ningún modelo predictivo (todos son horriblemente imprecisos sobre todo en lo que respecta a mundiales — este corresponsal no apostaría ni un peso por ninguna de esas dizque predicciones) y más bien disfrutar del fútbol, que siempre es más edificante que cualquier tabla de números, especialmente en lo que va de este torneo.

Que mañana ganen los mejores, o sea Colombia y Chile.

Cómo no te voy a querer

Dice Javier que ahora sí, esto se puso serio. Ahora que nos dimos cuenta que podemos ganar, la idea de perder espanta más. Cuando el sorteo estuvo, comentábamos que era un grupo mentiroso. Fácil en el papel, en ese sentido arbitrario que usamos para juzgar la viabilidad de una victoria sobre una selección mundialista. No clasificar era entrar en una duda existencial. Clasificar holgadamente era llegar a los octavos de final, el verdadero inicio del mundial, con un convencimiento no del todo sano, a enfrentar a un rival más serio, más potente. Colombia ha clasificado con solvencia, y el rival en la siguiente es Uruguay, un equipo que fútbol más fútbol menos, sabe competir. La posibilidad de perder es más real que nunca.

Otra forma de verlo, es que si no te ilusionas ahora, no te vas a ilusionar nunca.

Me sigue pareciendo que Colombia no tuvo una primera ronda muy exigente. Grecia, un equipo ahí. Costa de Marfil, mucho músculo, mucha improvisación, empujó bastante. Japón pateó mucho, tal vez porque ya estaba todo dicho Colombia lo permitió pero queda la duda si con un equipo con más olfato para estas cosas el resultado hubiera sido distinto. No sabemos cómo reacciona el equipo si se ve en desventaja. O como resuelve con el rival tirado atrás apostándole al contragolpe. Hasta ahora, solo hemos sabido ganar.

Uno que no sabe de estas cosas analiza sin tener idea, se ilusiona con poco, a veces con nada, a veces, como en este caso, con mucho. Se aventura uno en filosofías, en metáforas pretensiosas. Me dicen acá, que lo nuestro es conformismo pero también racionalizar incluso las derrotas como pequeñas victorias. Justificarlo todo y aceptar lo que venga. Yo no sé de estas cosas y vivo en un lugar en el que el fútbol quiere decir a veces poco o casi siempre nada, lejos de compinches con quién celebrar. Pero lo pienso y lo pienso, le doy vueltas a esta ilusión y me doy cuenta que lo que quiero es ganar, este partido que viene, más que todos los demás, este partido que viene, lo quiero ganar.

De la mano de Joachim

Ya entrados en el tema, pensaría uno, uno que, digamos, ve el mundial sin verlo, que ya tendríamos un candidato serio a ganar este asunto, un equipo de los muchos que haya dado el golpe en la mesa o algo. Pero España se va, Inglaterra se va, Italia y Uruguay deciden quién se queda en el último partido, Alemania que aunque la verdad sea dicha seguramente pasará, tendrá que jugar su tercer partido como quien quiere la cosa, Argentina pasa dejando dudas con un Messi desaparecido, y Brasil va por ahí con la inercia del local. Son los sospechosos de siempre.

Lo de Alemania es de rascarse la cabeza y mirar al cielo. En el primer partido esencialmente eliminaron a Portugal con una de esas victorias que además de quitar los puntos quitan también las ganas de estar vivo. Pero en el segundo se vieron arrollados por un Ghana dispuesto a quedarse. También es de rascarse la cabeza, esta vez con mano en la barbilla, el ver lo que Low ha modificado en el equipo que ha funcionado en el pasado. Del viejo doble pivote Khedira y Schweinsteiger con Özil, Mueller y Podolski por delante, ha cambiado a un 4-3-3 dándole labores de mediocampo a Lahm, en otra época lateral derecho, con Khedira y Kroos de interiores. La idea, supongo yo, que no sé de estas cosas, es optar por más control de balón (posesión, pues) y menos, digamos, rodillo alemán en el medio y vértigo en el avance. Cuando Mourinho quiso aventurarse al toque toque los que no sabemos de estas cosas llegamos a pensar con desdén que tener a Özil y no apostarle al vértigo es de una terquedad de museo. Este último empate ha puesto el experimento en evidencia, el partido se jugó como Ghana quiso y a la velocidad que quiso, y eso ya es mucho cuento.

Solo nos queda La Naranja Mecánica, es lo que le quiero decir.

Rankings y campeones

El ranking de la FIFA es un instrumento de medición de equipos nacionales extraño y no particularmente confiable (aquí cómo lo calculan y resúmenes de las críticas) que la FIFA lleva promocionando (con el patrocinio reciente de Coca-Cola) desde 1993. Aquí en Mundo Pelota no le hacemos mala cara a ninguna perspectiva así que con el apoyo de nuestros becarios recopilamos a mano los datos del ranking de la FIFA, mes a mes, desde 1993 hasta junio de 2014. La tabla correspondiente está en nuestro repositorio en GitHub.

Pregunta: ¿cuáles son los mejores equipos en este justo momento de acuerdo al sistema de puntuación de FIFA?

Para detectar los mejores equipos según el ranking tomamos las sucesiones de posiciones mes a mes desde 1993 hasta hoy y aplicamos un algoritmo de clustering básico (k-means) que dividiera la lista de países en cinco grupos de acuerdo a similitud. Después tomamos el grupo que tuviera (por decir algo) el promedio de promedios de puntajes más alto (aquí están los cálculos en R). Este grupo de veinticuatro países lo conforman Alemania, Argentina, Brasil, Colombia, Croacia, Dinamarca, España, Estados Unidos Francia, Grecia, Inglaterra, Irlanda, Italia, Japón, México, Noruega, Países Bajos, Paraguay, Portugal, Rumania, Rusia, Suecia, Turquía y Uruguay. Considerando lo arbitrario que parece el ranking hace un trabajo más que digno aislando a los países con fama de fútbol fuerte.

Otra pregunta: ¿Y cómo les ha ido a estos veinticuatro países en el ranking FIFA desde el año 2000 hasta hoy?

top.ranking.loess

Las curvas son versiones suavizadas (o sea, describiendo las tendencias) de las posiciones en el ranking de los diferentes equipos. El tubo gris que las rodea representa el margen de error para cada curva. Que sean tendencias es lo que permite que las curvas puedan sumergirse bajo cero (por la fuerza del ascenso en las primeras posiciones). Hagan clic en el gráfico si quieren verlo ampliado.

Hoy nuestro editor en jefe decía en Twitter: “Mi pronóstico para este mundial es que vamos a ser campeones y desde la cima vamos a saludar”. El ranking de la FIFA, por lo menos, parece darle la razón.

Adenda: ¿Otro sistema de puntuación de equipos? Qué tal el Unofficial Football World Championships, que usa esencialmente las reglas del boxeo para decidir quién lleva la corona. En este momento su campeón es Uruguay.