Un chercheur de Toulouse propose une nouvelle approche, plus juste que la méthode Elo, pour classer les plus grands maîtres d'échecs.

Sur le ring, sur un terrain ou autour d’un plateau de jeu, un match permet de déterminer qui est le meilleur à un instant donné. Mais comment intégrer ces résultats isolés dans un classement global ? Les fédérations sportives utilisent une foule de systèmes différents. L’univers très rationnel et mathématisé des échecs a majoritairement adopté, dans les années 1970, la méthode du Hongrois Arpad Elo (1903-1992). Les points s’y accumulent sans limites selon les résultats et augmentent avec le niveau des compétiteurs. L’actuel champion du monde Magnus Carlsen est ainsi monté jusqu’à 2 882 points en mai 2014, le plus haut score jamais atteint. Est-il pour autant forcément le meilleur joueur de l’histoire ?

Les limites du classement Elo

Certains remettent en effet en cause ce système et proposent de nouveaux types de classement. Dans des travaux publiés dans la revue de l’International Computer Games Association, Jean-Marc Alliot, de l’IRIT , s’applique ainsi à trouver une manière de trier les joueurs en fonction de leur talent plutôt que par leur seul bilan en compétition. On pourrait penser que le palmarès reflète fidèlement les capacités de chacun, mais un match ne se résume pas à une victoire.

« La méthode Elo est basée sur l’idée que les points évoluent en fonction du résultat d’une partie et du classement de l’adversaire, explique le directeur de recherche. Elle marche très bien, mais ne prend pas en compte la qualité des coups. On peut parfaitement gagner en jouant mal, à condition que votre challenger joue encore plus mal. »



La méthode Elo marche très bien, mais ne prend pas en compte la qualité des coups. La différence de classement Elo entre deux compétiteurs permet, grâce à des tables préétablies, d’estimer les chances de victoire de chacun. Un joueur qui a 100 points de plus qu’un autre a ainsi 64 % de chances de le battre, 95 % s’il en a 500. Si quelqu’un fait mieux que prévu, il remporte des points. S’il fait moins bien, il en perd.

Les anciens classements qui cohabitaient avant la méthode Elo partaient d’ailleurs du même principe, y compris le système Ingo dans lequel les meilleurs joueurs avaient le plus petit score. La qualité du jeu n’est à aucun moment évaluée. Les chiffres sont également soumis à une forme d’inflation et de dérive, qui empêchent de s’en servir pour comparer des compétiteurs d’époques différentes.

Le problème est encore plus flagrant dans d’autres sports. Le fameux classement ATP du tennis accorde ainsi des points en fonction des résultats en tournois sur les 52 dernières semaines. Qu’un joueur ratatine le numéro 1 mondial ou qu’une série de forfaits le débarrasse de la concurrence, remporter un tournoi du grand chelem lui rapporte quoiqu’il arrive 2 000 points.



Prendre en compte les mouvements plutôt que les matchs

Le système de Jean-Marc Alliot préfère donc classer les joueurs selon la qualité de l’ensemble de leurs coups. Il s’est pour cela appuyé sur un maître d’un genre particulier : Stockfish. Libre et gratuit, le meilleur logiciel d’échecs du monde surpasse aujourd’hui largement les humains les plus talentueux. Ses choix peuvent donc être considérés comme « presque » parfaits, ce qui permet de juger la valeur des décisions d’un compétiteur à leur écart par rapport à celles de Stockfish.



Quand la victoire est déjà assurée, beaucoup préfèrent jouer le coup le plus simple plutôt que le meilleur. Des comparaisons statistiques entre les hommes et une intelligence artificielle ont déjà été tentées à plusieurs reprises dans le passé, mais elles manquaient de la force de calcul aujourd’hui disponible. L’intégralité des 26 000 matchs disputés par tous les champions du monde depuis le règne de Wilhelm Steinitz (1836-1900), fondateur des échecs modernes, a ici été extraite. Installé sur le supercalculateur toulousain OSIRIM , Stockfish a évalué en 62 000 heures de calcul ces plus de 2 millions de positions.

« Il faut alors déjouer un écueil, précise Jean-Marc Alliot. Quel est le meilleur entre celui qui joue en général mieux, mais commet parfois des erreurs importantes, et celui qui ne joue jamais exactement le meilleur coup, mais ne commet pas d’erreur sérieuse. Quand la victoire est déjà assurée, de nombreux compétiteurs préfèrent également jouer le coup le plus simple plutôt que le meilleur. »

Le programme jauge chaque position en termes de points, selon les pièces d’avance ou de retard sur l’adversaire. Le coup parfait ne dégrade pas cette position et l’on peut calculer à quel point les champions s’en écartent ou pas.

Un classement plus prédictif

Ces statistiques établissent la probabilité qu’a un joueur de commettre une erreur dans une situation donnée, ce qui permet de simuler des matchs entre tous les membres de l’échantillon. Comme beaucoup des compétiteurs retenus dans l’étude se sont réellement affrontés, ces estimations ont pu être confrontées aux résultats officiels. La méthode fonctionne non seulement très bien, mais elle dépasse même les prédictions basées sur le classement Elo.

Les travaux de Jean-Marc Alliot comparent des couples de joueurs, sans encore offrir d’ordre global. Les choses se compliquent en effet quand les experts se battent entre eux, sans moyen de les intercaler précisément dans un ensemble cohérent. Le sommet est par contre clair : donné gagnant contre les dix-neuf autres champions, Magnus Carlsen peut être légitimement considéré comme le meilleur de tous les temps. Un résultat qui conforte l’idée que le niveau a bien augmenté, même si Bobby Fisher (1943-2008) est troisième et devance des joueurs contemporains comme Viswanathan Anand.

« Le système Elo est perfectible, mais il est stable depuis longtemps, simple à mettre en œuvre et fonctionnel, avoue Jean-Marc Alliot. Il faudrait présenter des avantages importants aux fédérations pour qu’elles changent de paradigme et modifient leurs classements. Un système comme le mien nécessite encore de nombreuses vérifications et certainement des améliorations. L’augmentation des puissances de calcul devrait cependant permettre de le généraliser à tous les joueurs et de concurrencer le système Elo. »