Vous n'êtes pas identifié(e).

#1 Le 10/04/2021, à 12:47

P'skhal
Explorateur
Lieu : Au-delà du portail
Inscription : Le 18/08/2016,
Messages : 37 468

Leela Chess Zero

Avec plus de 320 millions de parties d’échecs au compteur, Leela Chess Zero (Lc0) ne joue pas aux échecs comme les autres. Disponible sous licence GPL-3.0, ce programme a un Elo autour de 3 000, et côtoie les sommets de la (petite) planète échecs.

Introduction

Depuis de nombreuses années, les jeux d’échecs et de go ont vu des affrontements entre humains et ordinateurs. En ce qui concerne les échecs, le tournant qui va entériner la domination des machines sur les hommes est la série de matchs Deep Blue - Kasparov de 1996 à 1997. Pour le jeu de go, les humains ont longtemps conservé un avantage, le match entre AlphaGo et Lee Sedol de 2016 marquant probablement le passage à la domination des machines sur les humains.

Développé chez DeepMind, société spécialisée dans l’intelligence artificielle, AlphaGo est un logiciel s’appuyant sur l’apprentissage supervisé. Des parties de go ont donc été choisies et utilisées pour entraîner un réseau de neurones profond. L’hégémonie de AlphaGo va cependant être de courte durée : fin 2017, une équipe de Deepmind publie un article dans Nature décrivant AlphaGo Zero, un logiciel s’appuyant sur l’apprentissage non supervisé. Le réseau de neurones commence par jouer des coups aléatoires et devient un peu plus fort après chaque partie. Après en avoir joué près de 5 millions, AlphaGo Zero écrase purement et simplement ses concurrents, avec notamment une victoire cent à zéro contre la version de AlphaGo ayant vaincu Lee Sedol. Le roi est mort, vive le roi !

Fin 2017, un second article de DeepMind présente le logiciel AlphaZero, adaptation de AlphaGo Zero aux jeux d’échecs et de shogi, jeux dans lesquels il remporte des victoires contre les meilleurs programmes. Quelques parties d’échecs entre AlphaZero et Stockfish sont montrées. De nouvelles stratégies sont ainsi esquissées, ouvrant la voie à de nouvelles ouvertures et à des avancées théoriques dans la compréhension de ce jeu millénaire. Malheureusement, le logiciel développé par DeepMind n’est pas accessible à tous, au grand dam des passionnés. C’est dans ce contexte qu’arrivent Leela Zero (initié par Gian-Carlo Pascutto) et Leela Chess Zero. Basés sur les publications de DeepMind, les deux logiciels sous licence libre aspirent à dominer les jeux de go et d’échecs.

La clé de voûte d’un logiciel jouant aux échecs est l’évaluation d’une position donnée, ainsi que la sélection des coups jouables. Les évaluations les plus simples sont linéaires : les probabilités de gain associées à l’avantage matériel — la tour est plus forte que le pion —, à l’avantage positionnel — le pion qui atteint la dernière ligne est plus fort que la tour — et à l’initiative — simplifions en assimilant l’initiative à l’attaque — sont combinées linéairement à travers une somme pondérée. Les réseaux de neurones s’affranchissent d’une telle hypothèse et ont une évaluation de la position qui est non-linéaire. En ce qui concerne Lc0, le réseau de neurones est chargé de l’évaluation. À partir d’une position donnée, des coups jouables sont sélectionnés aléatoirement (recherche arborescente Monte-Carlo) et évalués. Pour des raisons d’efficacité, la sélection des coups jouables n’est pas totalement aléatoire : elle s’appuie sur une variante de la stratégie UCT, elle-même inspirée du problème du bandit manchot.

Pour les jeux de go et d’échecs, les machines ont atteint un niveau considérable. En ce qui concerne les échecs, les adversaires redoutables des années 90 sont désormais les partenaires et les enseignants des joueurs professionnels, et ils assistent les plateformes de jeu en ligne dans la détection des tricheurs (point abordé vers 1h03 cet article). Stockfish a longtemps été caricaturé comme un prodige de calcul et un défenseur sans égal, la promesse d’un jeu soporifique à haut niveau. Certaines des parties opposant AlphaZero et Lc0 à Stockfish ont chamboulé cette conception, les réseaux de neurones n’hésitant pas à sacrifier des pièces pour obtenir une position avantageuse à long terme, échappant ainsi à la ligne Maginot qu’avait dressée Stockfish. À n’en pas douter, AlphaZero et Lc0 sont disruptifs.

La suite de l'article sur DLFP


“ Aujourd'hui plus qu'hier et bien moins que demain „

P'skhal

#1 Le 10/04/2021, à 12:47

Explorateur
Lieu : Au-delà du portail
Inscription : Le 18/08/2016,
Messages : 37 468

Avec plus de 320 millions de parties d’échecs au compteur, Leela Chess Zero (Lc0) ne joue pas aux échecs comme les autres. Disponible sous licence GPL-3.0, ce programme a un Elo autour de 3 000, et côtoie les sommets de la (petite) planète échecs.

Introduction

Depuis de nombreuses années, les jeux d’échecs et de go ont vu des affrontements entre humains et ordinateurs. En ce qui concerne les échecs, le tournant qui va entériner la domination des machines sur les hommes est la série de matchs Deep Blue - Kasparov de 1996 à 1997. Pour le jeu de go, les humains ont longtemps conservé un avantage, le match entre AlphaGo et Lee Sedol de 2016 marquant probablement le passage à la domination des machines sur les humains.

Développé chez DeepMind, société spécialisée dans l’intelligence artificielle, AlphaGo est un logiciel s’appuyant sur l’apprentissage supervisé. Des parties de go ont donc été choisies et utilisées pour entraîner un réseau de neurones profond. L’hégémonie de AlphaGo va cependant être de courte durée : fin 2017, une équipe de Deepmind publie un article dans Nature décrivant AlphaGo Zero, un logiciel s’appuyant sur l’apprentissage non supervisé. Le réseau de neurones commence par jouer des coups aléatoires et devient un peu plus fort après chaque partie. Après en avoir joué près de 5 millions, AlphaGo Zero écrase purement et simplement ses concurrents, avec notamment une victoire cent à zéro contre la version de AlphaGo ayant vaincu Lee Sedol. Le roi est mort, vive le roi !

Fin 2017, un second article de DeepMind présente le logiciel AlphaZero, adaptation de AlphaGo Zero aux jeux d’échecs et de shogi, jeux dans lesquels il remporte des victoires contre les meilleurs programmes. Quelques parties d’échecs entre AlphaZero et Stockfish sont montrées. De nouvelles stratégies sont ainsi esquissées, ouvrant la voie à de nouvelles ouvertures et à des avancées théoriques dans la compréhension de ce jeu millénaire. Malheureusement, le logiciel développé par DeepMind n’est pas accessible à tous, au grand dam des passionnés. C’est dans ce contexte qu’arrivent Leela Zero (initié par Gian-Carlo Pascutto) et Leela Chess Zero. Basés sur les publications de DeepMind, les deux logiciels sous licence libre aspirent à dominer les jeux de go et d’échecs.

La clé de voûte d’un logiciel jouant aux échecs est l’évaluation d’une position donnée, ainsi que la sélection des coups jouables. Les évaluations les plus simples sont linéaires : les probabilités de gain associées à l’avantage matériel — la tour est plus forte que le pion —, à l’avantage positionnel — le pion qui atteint la dernière ligne est plus fort que la tour — et à l’initiative — simplifions en assimilant l’initiative à l’attaque — sont combinées linéairement à travers une somme pondérée. Les réseaux de neurones s’affranchissent d’une telle hypothèse et ont une évaluation de la position qui est non-linéaire. En ce qui concerne Lc0, le réseau de neurones est chargé de l’évaluation. À partir d’une position donnée, des coups jouables sont sélectionnés aléatoirement (recherche arborescente Monte-Carlo) et évalués. Pour des raisons d’efficacité, la sélection des coups jouables n’est pas totalement aléatoire : elle s’appuie sur une variante de la stratégie UCT, elle-même inspirée du problème du bandit manchot.

Pour les jeux de go et d’échecs, les machines ont atteint un niveau considérable. En ce qui concerne les échecs, les adversaires redoutables des années 90 sont désormais les partenaires et les enseignants des joueurs professionnels, et ils assistent les plateformes de jeu en ligne dans la détection des tricheurs (point abordé vers 1h03 cet article). Stockfish a longtemps été caricaturé comme un prodige de calcul et un défenseur sans égal, la promesse d’un jeu soporifique à haut niveau. Certaines des parties opposant AlphaZero et Lc0 à Stockfish ont chamboulé cette conception, les réseaux de neurones n’hésitant pas à sacrifier des pièces pour obtenir une position avantageuse à long terme, échappant ainsi à la ligne Maginot qu’avait dressée Stockfish. À n’en pas douter, AlphaZero et Lc0 sont disruptifs.

La suite de l'article sur DLFP


“ Aujourd'hui plus qu'hier et bien moins que demain „

Hors ligne

Hors ligne

#2 Le 11/04/2021, à 09:50

M'lou
MétalWoman
Lieu : Quelque part dans la Galaxie
Inscription : Le 18/08/2016,
Messages : 41 807

Re : Leela Chess Zero

smile    cool


L'amour est comme un jardin, il doit se cultiver chaque  jour pour donner le meilleur de lui-même

M'lou

#2 Le 11/04/2021, à 09:50

MétalWoman
Lieu : Quelque part dans la Galaxie
Inscription : Le 18/08/2016,
Messages : 41 807

smile    cool


L'amour est comme un jardin, il doit se cultiver chaque  jour pour donner le meilleur de lui-même

Hors ligne

Hors ligne

#3 Le 11/04/2021, à 10:02

P'skhal
Explorateur
Lieu : Au-delà du portail
Inscription : Le 18/08/2016,
Messages : 37 468

Re : Leela Chess Zero

smile


“ Aujourd'hui plus qu'hier et bien moins que demain „

P'skhal

#3 Le 11/04/2021, à 10:02

Explorateur
Lieu : Au-delà du portail
Inscription : Le 18/08/2016,
Messages : 37 468

smile


“ Aujourd'hui plus qu'hier et bien moins que demain „

Hors ligne

Hors ligne

Pied de page des forums