Índice de Huertas

Pregunté en Twitter qué me recomendaban para medir efectividad de ataque usando número de tiros, número de tiros al arco y número de goles. Álvaro Huertas, un físico colombiano devenido en activista altermundista y radicado en la república independiente de Escocia, propuso un puntaje-f. La analogía tiene sentido: el puntaje-f pretende medir la precisión de un test usando la fracción de resultados positivos sobre el total de evaluaciones y la fracción de resultados positivos sobre el total de evaluaciones que deberían ser positivas (ahí en el enlace pueden ver la fórmula: es la media armónica de estos dos valores). En este caso particular cada equipo sería un test y un resultado positivo sería meter gol. El total de evaluaciones sería el total de tiros y el total de evaluaciones que debieron ser gol debería ser el total de tiros al arco.

Esta es la tabla de equipos en el mundial ordenados de acuerdo al índice propuesto por Huertas y considerando sólo sus resultados en los primeros dos juegos del mundial:

País Goles Tiros Tiros al
arco
% Tiros al arco
sobre tiros
% goles
sobre tiros
% goles sobre
tiros al arco
Índice
de Huertas
Argelia 5 18 6 33 28 83 0.42
Chile 5 18 9 50 28 56 0.37
Alemania 6 25 10 40 24 60 0.34
Holanda 8 28 19 68 29 42 0.34
Colombia 5 24 12 50 21 42 0.28
Uruguay 3 17 5 29 18 60 0.27
Francia 8 42 17 40 19 47 0.27
EEUU 4 23 9 39 17 44 0.25
Croacia 5 29 12 41 17 42 0.24
Costa Rica 4 24 9 38 17 44 0.24
Corea del Sur 3 18 9 50 17 33 0.22
Ecuador 3 20 8 40 15 38 0.21
Australia 3 23 8 35 13 38 0.19
Suiza 4 34 10 29 12 40 0.18
Bélgica 3 29 10 34 10 30 0.15
Argentina 3 33 6 18 9 50 0.15
Brasil 3 29 12 41 10 25 0.15
Costa de Marfil 3 34 8 24 9 38 0.14
Italia 2 24 8 33 8 25 0.12
Ghana 3 40 9 22 8 33 0.12
Inglaterra 2 30 11 37 7 18 0.10
Portugal 2 34 11 32 6 18 0.09
Honduras 1 21 6 29 5 17 0.07
México 1 22 6 27 5 17 0.07
Japón 1 25 6 24 4 17 0.06
España 1 26 10 38 4 10 0.06
Rusia 1 30 8 27 3 12 0.05
Nigeria 1 30 13 43 3 8 0.05
Bosnia-Herzegovina 1 36 13 36 3 8 0.04
Grecia 0 20 6 30 0 0
Irán 0 17 4 24 0 0
Camerún 0 30 3 10 0 0

Que encabece Argelia es intrigante pero no del todo descabellado. Al fin y al cabo estamos intentando medir efectividad y en sus dos partidos Argelia logró un 83% de tiros al arco convertidos en gol. De resto la tabla parece reiterar las sospechas que tenemos sobre la efectividad de holandeses y alemanes. Chile es obviamente otra sorpresa pero tampoco tanto. Hasta el segundo partido llevaba solo victorias. Recuerden que no estamos considerando en esta tabla su derrota ante Holanda. Muy seguramente al final de la ronda de grupos los equipos cambiarán bastante de posición. Me intriga dónde terminará Argentina después de los dos goles de Messi.

Prometo revisión de esta tabla en pocos días.

8 comentarios en “Índice de Huertas

  1. ¿Cómo haría uno para incluir el efecto del rival? Por ejemplo si uno quiere decir que hacer un gol a un equipo que defienda más (digamos medido por tiros al arco permitidos) debe valorarse más.

    1. Ni idea. En principio el número de tiros (o tiros al arco) habla de debilidades del rival. Un rival con defensa fuerte reduce los tiros (o tiros al arco), pensaría uno. Pero como aquí lo usamos esos números como denominadores y no los relativizamos dependiendo del partido entonces la medida es bastante bruta. Supongo que lo que tocaría hacer para considerar el efecto del rival es mirar puntajes relativos por partido. Y de pronto después de eso agregar. Complicado. Seguiré jugando.

  2. De pronto habría que probar creando un índice basado en posesión del balón, tiempo que dura el balón en el campo del rival, y el hecho de que los remates sean fuera o dentro del área.

    1. No cuento con datos que involucren tiempo ni localización (esos los atesoran celosamente quienes tienen los medios para conseguirlos). Sólo tengo conteos de diferentes variables para cada jugador (pases, goles, duelos aéreos, dribbles, tiros, fueras de lugar, bloqueos, etc.). Parte de la gracia de estos ejercicios es intentar entender qué tanto dicen esos datos individuales sobre un juego tan esencialmente grupal.

  3. Para separar el efecto de la defensa, harían falta muchos más datos. Se me ocurre que se podría hacer una matriz de índices por partido (filas: defensor, columnas: atacante) y descomponerla en una para atacante y una para defensor con factorización no-negativa. Y sumar filas y columnas respectivamente.

No más comentarios.