"La medición de la puntuación Elo de un individuo podría compararse con la estimación de la posición de un corcho que se mueve hacia arriba y hacia abajo sobre la superficie del agua agitada con un palo atado a una cuerda y que se balancea con el viento."
Árpád Élö
Arpad Elo alcanzó la fama mundial con su sistema de cálculo de calificaciones individuales. En 1959, el presidente Jerry Spann le pidió que se uniera a la comisión de revisión y mejora del sistema de coeficientes individuales que utilizaba la federación para calcular la fuerza relativa de cada jugador.
Photographer unknown
Arpad Elo and Fred Cramer
c 1970s-1980s
Collection of the World Chess Hall of Fame |
El sistema Elo
El sistema fue adoptado por la Federación de Ajedrez de los Estados Unidos en 1960 y por la FIDE en 1970. El método era lo suficientemente sencillo como para hacer cálculos sin máquinas. Al principio, Arpad Elo calculó las calificaciones de todos los jugadores de ajedrez desde que estuvo al frente de la comisión de calificaciones de la FIDE durante 15 años. El sistema del profesor Elo es utilizado por la FIDE hasta el día de hoy, con modificaciones menores.
Mientras tanto, Elo instó a otros a no atribuir aplicabilidad universal a su sistema. "Muy a menudo, las personas que no están familiarizadas con las limitaciones naturales de las estadísticas esperan demasiado de las calificaciones. Las calificaciones solo comparan los logros, nada más y nada menos … determinar la calificación de un jugador de ajedrez es similar a determinar la posición de un flotador en las olas o una línea atada a una caña de pescar movida por el viento", escribió en 1962 en un artículo para Chess Life.
En 1988, el profesor Arpad Elo fue incluido en el Salón de la Fama de la Federación Estadounidense de Ajedrez. Murió el 5 de noviembre de 1992.
Mi primera aproximación al sistema ELO de puntuación de la FIDE fue a través del conocido libro "Mosaico ajedrecístIco" de Karpov y Guik.
Nuevamente leo el capítulo ¿Cuál es su rating? y recuerdo que, con la información del libro, conseguimos elaborar un sistema para los jugadores del Consejo Provincial de Pichincha de Ecuador y medir nuestros avances y retrocesos, en los años 80-90 del siglo pasado.
Ahora, los torneos de ajedrez se celebran con frecuencia simultáneamente no sólo en varios países, sino incluso en varias ciudades de un mismo país.
En competiciones internacionales participa un buen millar de ajedrecistas, muchos de los cuales se conocían apenas de oídas. En tales condiciones, comparar la fuerza de los ajedrecistas se hizo mucho más difícil. Como es natural, nació la idea de abordar este problema con ayuda de la matemática.
Los primeros intentos de crear un sistema matemático para valorar la fuerza de los ajedrecistas se remontan a comienzos de siglo. A fines de los años 50 empezaron a ponerse en práctica varios sistemas basados en que cada ajedrecista recibe coeficiente individual o rating (del inglés: calificación), el cual varía de competición en competición y depende de los resultados obtenidos. Después de estudiar durante muchos años diferentes sistemas (que no se distinguen cardinalmente entre sí), la Federación Internacional de Ajedrez (FIDE) en 1970 adoptó un sistema de coeficientes elaborado por el profesor norteamericano Arpad Elo (ahora es secretario del Comité de Calificación de la FIDE).
Mostraremos primero cómo se calcula el rating por el sistema Elo y luego estudiaremos algunas de sus particularidades. Si su rating antes de empezar las competiciones equivale a:
Cv (coeficiente viejo), después de ellas él Cn (coeficiente nuevo) equivaldrá a: Cn: Cv + 10 (N-Ne) donde N es número de puntos que Ud obtuvo y Ne es número esperado de puntos (luego explicaremos cómo se determina). Si el resultado coincidió con el esperado, su rating después del torneo no cambiará; si Ud acumuló más o menos puntos que los establecidos, correspondientemente aumentará o disminuirá. De la fórmula se infiere que un punto del torneo corresponde a 10 unidades de rating. Así, pues, nos queda hallar el número esperado de puntos Ne. Empecemos por el caso más simple, cuando se juega un match. Supongamos que su rating coincide con el del adversario. Entonces cabe aguardar que el match terminará empatado y Ud obtendrá el 50%" de puntos. Si su rating es superior (inferior) que el de su adversario, es de suponer que Ud acumulará más (menos) del 50% de puntos, con la particularidad de que cuanto mayor la diferencia de coeficientes tanto mayor para uno y menor para otro debe ser el porcentaje. En estas consideraciones se basa la tabla que hizo Elo.
Impreso en la URSS
Clasificación por Elo
La siguiente es la tercera lista internacional de rating que ahora cubre el periodo desde enero de 1966 hasta la primavera de 1969. Esta lista es con mucho la más extensa de las tres e incluye a todos los maestros, con o sin títulos de la FIDE, que participaron en al menos dos eventos durante el periodo indicado. Debido a la ampliación de la lista, se utilizó un mayor número de partidas en la evaluación de las clasificaciones de los jugadores individuales, por lo que cabe esperar una mayor precisión con respecto a las listas anteriores. Esta es también la primera lista que en gran parte está informatizada. Para unos 200 jugadores, cuyas clasificaciones están marcadas con un asterisco (*), las clasificaciones se calcularon mediante el método de aproximaciones sucesivas descrito en el folleto sobre el Sistema de Clasificación de la Federación de Ajedrez de Estados Unidos y distribuido previamente a los representantes de la FIDE. Las clasificaciones así obtenidas para el grupo constituyen un conjunto autoconsistente. En la mayoría de los casos del grupo seleccionado, es decir, los jugadores muy activos, el tamaño de la muestra de partidas se aproximó o superó las 100 partidas y en pocos casos incluso las 300 partidas. Por tanto, la omisión involuntaria de resultados de torneos menores no debería tener un efecto significativo.
Las puntuaciones deben considerarse evaluaciones de los resultados medios de los maestros durante el periodo de tres años y nada más. Cualquier asociación de las puntuaciones con los puntos fuertes de los jugadores se deja a los prejuicios individuales de los lectores. Las evaluaciones se expresan en la escala de puntuación de la U.S.C.F., una escala arbitraria en la que el nivel 2000 representa el límite inferior de la categoría de experto o candidato a maestro y 2200 el límite inferior de la categoría de maestro. Así pues, 200 puntos representan el intervalo de clase, que también se define en términos del concepto estadístico de desviación típica. Las puntuaciones se redondean a los 10 puntos más próximos, ya que no se puede pretender una mayor precisión. La probabilidad de error en la evaluación oscila entre 10 y 30 puntos, dependiendo del tamaño de la muestra de juego utilizada en los cálculos.
Se agradece al Sr. James Warren de Western Springs, Illinois, que escribió el programa informático para el método de aproximaciones sucesivas y realizó el cálculo para los 200 jugadores seleccionados.
Dice Arpad Elo: "Esta lista es una revisión de la publicada en la primavera de 1969 e incluye los resultados de los torneos completados o iniciados durante 1969. (g) después del nombre indica gran maestro internacional; (m) después del nombre, maestro internacional./
ÁRPÁD IMRE ÉLŐ25-08-1903- 5-11-1992 Salón de la FamaIncluido en 1988 |
Arpad Elo, profesor de física en la Universidad de Marquette, creó el sistema de puntuación Elo basado en estadísticas. Nacido en Hungría, se trasladó a Estados Unidos con su familia en 1913. Elo fue jugador de nivel maestro y nueve veces campeón o co-campeón de Wisconsin entre 1935 y 1961. Fue presidente de la American Chess Federación Americana de Ajedrez, que se fusionó con la Federación Nacional de Ajedrez de Estados Unidos para formar la USCF en 1935.
Participó activamente en esta última organización tras su creación, desarrollando y popularizando el sistema que ahora lleva su nombre. Ilmars Didrichson Arpad Elo at Banquet for 1969 Lincoln, Nebraska, U.S. Open Chess Championship 1969 Collection of the World Chess Hall of Fame, gift of John Donaldson |
Arpad Elo y el sistema de puntuación Elo
Por Daniel RossUniversidad Indiana de Pensilvania
Matemáticas 563 – Estadística Matemática I
Otoño 2007
Pregunte por su 'Elo' a cualquier miembro de la Federación de Ajedrez de Estados Unidos (USCF) y probablemente obtendrán una respuesta inmediata y precisa. Luego pregunte a ese mismo miembro de la USCF de donde procede la palabra "Elo". Algo del estilo "No me acuerdo... alguien me dijo alguna vez de que eran esas siglas, pero no soy capaz de recordarlo" es más probable que la respuesta correcta. Aunque el sistema de puntuación en ajedrez más ampliamente usado en todo el mundo lleva su nombre, pocos tienen más que una vaga idea de cómo funciona el sistema y aún menos son conocedores de la existencia del propio estadístico Dr. Arpad Elo.
A. Elö |
...
Aunque su sistema de puntuación sigue siendo la más importante de sus contribuciones, el Dr. Elo también realizó valiosas observaciones relacionadas con el desarrollo de los ajedrecistas en función de datos demográficos como la edad, el lugar de nacimiento y el género. Además, Elo aplicó su sistema de puntuación a resultados de torneos históricos, remontándose a comienzos del siglo XIX. Con ello hizo posible, por primera vez, comparar la fuerza relativa de cualesquiera dos ajedrecistas de fuerza significativa a lo largo de siglo y medio. Aunque refutadas con vehemencia, estas puntuaciones aún son consideradas por algunos la forma más exacta de puntuar ajedrecistas anteriores a cualquier sistema formal de puntuación.
Al ser nombrado presidente del comité de puntuaciones de la USCF en 1959, a Arpad Elo se le asignó la sobrecogedora tarea de poner a punto el sistema de puntuación entonces vigente. Desarrollado por Kenneth Harkness a comienzos de los años 1950, el sistema (ahora conocido habitualmente como "sistema Harkness"), fue adoptado en principio por los miembros de la comunidad ajedrecística, quienes por primera vez tenían una forma de cuantificar sus habilidades. Al cabo de pocos años, sin embargo, resultó evidente que el sistema Harkness ) era insuficiente por su simplicidad. Aunque las puntuaciones Harkness a menudo eran consideradas justas en los casos habituales, determinadas circunstancias extremas daban resultados estadísticamente inexactos. En aras de la tradición y, lo que es más importante, y de los miembros de la USCF, Elo mantuvo intactas dos partes importantes del sistema Harkness: la escala de puntuación y las categorías de clase en dicha escala.
La escala de puntuaciones, que tiene un límite mínimo en 0, sitúa el corte para los candidatos a maestros (también conocidos como expertos) en 2000. Aunque el máximo de la escala no está técnicamente limitado, sería inaudito que un jugador excediera la puntuación de 3000. Debido a que la magnitud de esas cifras es arbitraria, Elo pensó que sería lo mejor dejar que la gente mantuviera sus puntuaciones en aquel momento tanto por el bien de la comunidad ajedrecística (que podía seguir ignorando los cambios en el sistema de cálculo) como de la USCF (que en caso contrarío debería recalcular la puntuación de todos y cada uno de sus miembros) El concepto más importante y que fácilmente se pasa por alto que Elo adoptó del sistema Harkness fue el concepto de "categoría" del jugador que se define como un salto de 200 puntos en la clasificación. Por medio de la observación de los resultados de torneos anteriores, Elo encontró que una categoría representaba con precisión la desviación estándar (σ) en términos de fuerza de rendimiento para un jugador dado a lo largo de una serie de partidas.
...
Más allá de dichas debilidades están las posibles explotaciones, la más común de las cuales es el hecho de que solo los jugadores activos tengan una puntuación activa. A menudo un joven ajedrecista prometedor deja de jugar torneos durante un amplio periodo de tiempo, pero sigue mejorando su capacidad. Esta persona podría circunstancialmente apuntarse en un gran torneo con importantes bolsas de premios para cada categoría, por lo que aumenta sus opciones de ganar gran cantidad de dinero, jugando contra rivales que teóricamente tienen menor capacidad. Otra forma de sacar partido bastante común (que se da sobre todo en el juego por Internet) es el emparejamiento selectivo. Un jugador con puntuación más alta solo retará o aceptará retos de oponentes apreciablemente más débiles. Debido a que las variantes del sistema Elo en Internet permiten una ganancia mínima de un punto para el jugador que vence, una derrota excepcional se compensa con un gran número de victorias relativamente fáciles.
A pesar de esos puntos débiles, se han realizado muy pocos cambios en el sistema Elo durante los últimos 47 años. Como ya se mencionó, debido a los avances informáticos, la USCF ahora emplea un factor K dinámico que es mayor para los jugadores con menos experiencia y menos puntuación. El empleo de ordenadores también permite que cada partida se puntúe de forma individual e independientemente de los torneos en que se jueguen. Esto resulta claro para los miembros de la USCF ya que las puntuaciones oficiales ya no se publican cada trimestre, sino que se tabulan continuamente (sin necesidad de redondeo al punto más próximo) lo que redunda en favor de la exactitud. El último cambio realizado por la USCF (que también fue posible por el uso de ordenadores cada vez mayor) es la transición de una distribución normal a una distribución logística. Con la observación de gran cantidad de resultados, la USCF determinó que una distribución logística ofrece unas extrapolaciones más precisas. La FIDE aún emplea la distribución normal que Elo puso en práctica al principio.
A pesar de todo, los principios generales del sistema Elo han resistido la prueba del tiempo, lo que es aún más impresionante cuando se tiene en cuenta que el Dr. Elo carecía de la potencia de procesamiento de los ordenadores actuales. Me parece decepcionante que tanta gente pueda usar algo sin apreciarlo incluso a un nivel básico. Así que la próxima vez que un ajedrecista le pregunte a que corresponden las siglas “ELO”, al menos hágale saber que en realidad se trata del apellido de alguien.
Las ventajas del sistema ELO
El sistema de Elo sustituyó la estimación estadística por un sistema de recompensas competitivas. Es decir, tiene más valor ganar una partida contra un Gran Maestro que hacerlo contra un jugador amateur.
De este modo, los jugadores pueden sentir que están siendo recompensados y “castigados” en función de sus buenos o malos resultados.
Además, el sistema de Arpad proponía un método sencillo para estimar las variables en su modelo (es decir, la verdadera habilidad de cada jugador). Uno podría calcular de forma relativamente fácil, a partir de las tablas, cuántas partidas se espera que gane un jugador basándose en una comparación de sus resultados con la de sus oponentes.
Si un jugador ganara más partidas de las que se esperaba que ganara, su calificación se ajustaría al alza, mientras que si ganara menos de lo esperado, su calificación se ajustaría a la baja. Además, ese ajuste tenía que ser en proporción lineal exacta al número de victorias por las cuales el jugador había excedido o no había alcanzado su número esperado de victorias.
Para finalizar veamos como un matemático nos describe el funcionamiento del Sistema que Elö desarrolló.
Encontramos un artículo que contempla el funcionamiento de dos sistemas de evaluación, del cual hemos transcrito el correspondiente al sistema que nos interesa.
Los amigos interesados podrán seguir el texto completo en el link correspondiente, al final del posteo.
Para utilizarla, hay que considerar la función logística. Es la distribución normal del éxito en la valoración de la diferencia de puntuación del jugador.
En este caso, la diferencia de puntuación entre los jugadores es de 400 puntos. Por cada 400 puntos de diferencia, el jugador con mayor puntuación tiene diez veces más probabilidades de ganar la partida. Esto significa que un jugador con una puntuación de 2400 tiene 100 veces más probabilidades de ganar a un jugador con una puntuación de 1600.
Esta probabilidad de ganar se puede expresar con la fórmula
La aproximación lineal es
Si la salida de probabilidad es 1, entonces la victoria es segura. Por otro lado, una probabilidad de 0 es una pérdida inevitable. Definiendo 1 como una victoria y 0 como una derrota, la probabilidad puede utilizarse como la puntuación esperada. Sin embargo, ¿qué ocurre si un jugador supera las probabilidades de perder? Si el jugador lo hace mejor de lo esperado, la puntuación aumentará. Cuanto más sorprendente sea la victoria, más aumentará la puntuación. Cuanto más inesperada sea la derrota, más puntos se restarán a la valoración. La fórmula de "actualización de la valoración" para varios partidos en un periodo se define como:
o
Para partidos individuales. W son las victorias, L son las derrotas, 𝐷𝑖 es la diferencia de valoración, C es una constante de 400 y K es el factor K, el aumento o disminución potencial total. 𝑆f es la puntuación final (0,0,5,1) mientras que 𝑆𝑒 es la puntuación esperada.
Consideremos al jugador A y al jugador B, ambos con una puntuación de 1600. Si el jugador A gana, su nueva puntuación será:
El factor k es 32 según la normativa actual de la federación de ajedrez.
Si un nuevo jugador se une sin ningún historial de juego, su clasificación será preestablecida en 1500. No empieza en 0, ya que podría llevar demasiado tiempo que alguien alcanzara su clasificación real si ese fuera el caso.
Para aplicar un algoritmo de clasificación, se trata una colección de partidas dentro de un "periodo de clasificación". Los periodos de clasificación pueden durar varios meses. La clasificación final actualizada con una desviación estándar mínima se obtendría al final de estos periodos de clasificación. Esta es una de las razones por las que los videojuegos competitivos tienen "temporadas" de clasificación como periodos para determinar la habilidad de sus jugadores.
Sin embargo, el sistema de clasificación sólo es muy preciso para las partidas 1 contra 1. Es más difícil aplicarlo a las partidas multijugador. Es más difícil de aplicar a juegos con varios jugadores, como las damas chinas o el monopoly.