Le résultat final : 4 à 1 pour la machine. Lee Sedol n'a donc réussi qu'une seule partie sur les cinq, l'avant dernière. Pour les amateurs de go comme moi, ce fut un spectacle époustouflant. La machine a sorti des coups d'une rare beauté : par exemple le coup 37 de la
deuxième partie, un coup à l'épaule sur la quatrième ligne, a tout pour devenir mythique chez les joueurs de go, car c'est un coup qui va à l'encontre des théories établies et pourtant se montre d'une efficacité redoutable. Un peu comme le fameux coup du jeune Shusaku qui fit
rougir les oreilles de Honinbo Gennan Inseki un beau jour de 1846, ou encore le
shicho contre nature joué il y a 13 ans par un autre jeune joueur génial, Lee Sedol - oui, le même Lee Sedol que la machine vient de surpasser.
Et puis c'est quand même rare que
LO parle du jeu de go !
le 16 mars 2016 LO a écrit :L’ordinateur conçu par l’entreprise Deep Mind a donc battu le champion coréen de jeu de go, Lee Sedol, par quatre parties à une. Cela donne lieu à bien des commentaires sur le thème « l’homme sera-t-il dépassé par la machine ? »
Mais si un homme peut rivaliser avec un ordinateur moderne capable de calculer une quantité considérable de coups à l’avance, cela signifie que l’intelligence humaine ne se résume pas à de simples calculs et qu’elle est bien plus complexe.
Quant à la victoire de l’ordinateur, il y a aussi derrière elle toute l’intelligence humaine. Il s’agit de l’intelligence cumulée de scientifiques et d’ingénieurs venant de domaines très variés, capables de fabriquer une machine sophistiquée, mais c’est de l’intelligence humaine et rien d’autre.
Les machines ne sont rien d’autre que le produit des femmes et des hommes qui les conçoivent et il n’y a aucune angoisse à avoir devant la victoire de la machine dans un jeu inventé, lui aussi, par l’être humain.
La science-fiction aime imaginer des machines dont le contrôle échapperait à l’humanité. Mais aujourd’hui, ce ne sont pas les machines qui lui échappent, c’est son organisation sociale. Celle-ci n’est pourtant rien d’autre que le produit de sa propre activité. Et la prouesse qu’il lui faut réaliser, c’est celle de maîtriser consciemment son organisation économique et sociale, en l’organisant rationnellement, en la planifiant. Cette prouesse s’appelle le communisme et une chose est sûre, il ne faut pas compter sur les machines pour l’accomplir à notre place.
Une remarque : le programme AlphaGo ne s'est pas contenté de "calculer une quantité considérable de coups à l’avance", ça c'est ce que font tous les logiciels d'échecs mais pour AlphaGo c'est un peu plus fin que ça. Voici ce que j'en ai compris (en même temps je ne suis pas expert) :
- Il choisit "au hasard" les coups qu'il va lire et lit donc plusieurs parties de go à la suite pour évaluer la valeur d'un coup en explorant l'arbre des coups non pas de façon exhaustive mais "au hasard". C'est la partie du programme qu'on appelle "algorithme de Monte-Carlo".
- J'écris "au hasard" entre guillemets car en fait ce n'est pas un hasard total : il donne plus de poids à certains coups que d'autres, et pour évaluer la valeur de ces coups il les soumet à un "réseau de neurones", lequel s'est forgé en analysant une base de données de parties de go entre joueurs forts (voir la vidéo de Yann LeCun au Collège de France postée plus haut pour comprendre ce qu'est un "réseau de neurones", il l'explique fort bien.
- Enfin, un autre réseau de neurones, lui aussi construit à partir de la même base de données, lui permet d'évaluer la situation.
- Ensuite, le programme a longtemps joué contre lui-même, puis les parties qu'il a jouées lui-mêmes ont à nouveau servi de base de données pour refaire les réseaux de neurones, etc. C'est ce qu'on appelle un "apprentissage par renforcement".