Principal Innover L'intelligence artificielle de Google 'Alpha Go Zero' vient d'appuyer sur la réinitialisation sur la façon d'apprendre

L'intelligence artificielle de Google 'Alpha Go Zero' vient d'appuyer sur la réinitialisation sur la façon d'apprendre

Votre Horoscope Pour Demain

Rappelez-vous (vaguement) comment vous avez appris à marcher, à parler, à faire du vélo ou à conduire ? C'était désordonné et plein d'erreurs, mais les compétences que vous avez acquises de cette façon sont restées. En dehors des systèmes vivants, il a été difficile de structurer des algorithmes suffisamment puissants pour prendre en compte «l'expérience de la vie réelle» et développer des comportements collants et adaptables pour l'intelligence artificielle.

Eh bien, Alpha Go Zero vient de le faire.

«Cela part d'une ardoise vierge et ne se calcule que pour lui-même, uniquement à partir d'un jeu personnel, et sans aucune connaissance humaine, ou aucune donnée humaine, ou caractéristiques, ou exemples, ou intervention humaine. Il découvre comment jouer au jeu de Go à partir des premiers principes », explique David Silver, professeur de DeepMind.

L'IA a eu plusieurs itérations, chacune plus intelligente et plus performante que la précédente. La version précédente utilisait une énorme base de données de jeux précédents ainsi qu'un tas d'algorithmes qui la dirigeaient vers la victoire. Cette approche a conduit à la défaite du joueur professionnel de Go, champion du monde en titre. Au poker, AI Libratus a récemment écorché les meilleurs joueurs de poker du monde de près de 2 millions de dollars, également en apprenant par l'auto-jeu au lieu de données de jeu humaines.

princesse et ray j valeur nette

Maintenant, dans cette dernière version d'Alpha Go, le programme d'intelligence artificielle a enseigné lui-même comment jouer au Go - sans aucune formation humaine.

En exécutant des millions de simulations de jeu contre lui-même, il lui a fallu 40 jours pour apprendre, à partir de zéro, comment battre la version championne du monde de lui-même. Cela change vraiment la donne, non seulement pour le Go, mais aussi pour la façon dont de nouvelles connaissances sont découvertes. Dans quelle mesure votre expertise du domaine est-elle précise ou complète ? Il y a beaucoup plus à découvrir, c'est ce que nous dit cette fascinante expérience d'apprentissage avec Alpha Go Zero.

'L'idée d'Alpha Go n'est pas de sortir et de vaincre les humains, mais en fait de découvrir ce que signifie faire de la science - pour qu'un programme puisse apprendre de lui-même ce qu'est la connaissance', selon Silver dans un article YouTube sur la réalisation.

L'équipe d'Alpha Go Zero Deep Mind appelle cela l'apprentissage du premier principe, 'tabula rasa' (ardoise vierge).

'Si vous pouvez atteindre table rase l'apprentissage, vous avez un agent qui peut être transplanté du jeu de Go vers n'importe quel autre domaine, et les spécificités du jeu dans lequel vous vous trouvez, vous proposez un algorithme qui est si général qu'il peut être appliqué n'importe où », dit-il . C'est une idée provocatrice quand vous étendez le concept. Pensez simplement à ce que nous pourrions faire avec un ensemble d'algorithmes d'apprentissage puissants qui pourraient systématiquement résoudre des problèmes difficiles et apprendre plus rapidement que la connaissance collective de notre civilisation. . . en jours, pas en décennies.

combien d'enfants a julie chrisley

Pour l'instant, le gros point à retenir est que 'les algorithmes comptent beaucoup plus que l'informatique ou les données disponibles', a déclaré Silver. Cela seul change la donne dans la façon dont nous approchons de l'extension du monde connu. Alors qu'Alpha Go fonctionne avec environ 25 millions de dollars de matériel - ce n'est pas exactement un système léger - vous savez que les gourous de l'IA travaillent depuis longtemps à la création d'ensembles de données plus propres et meilleurs. Aujourd'hui, de nombreux grands ensembles de données sont considérés comme trop bruyants - pleins de mauvaises données - pour former avec précision une intelligence artificielle. Si l'IA apprend à partir de données et que les données sont mauvaises, elle n'apprend pas. Gros problème.

Et si vous n'aviez pas besoin de données propres, mais juste de l'expérience, et que l'intelligence artificielle pouvait s'entraîner ?

C'est la réalisation passionnante d'Alpha Go Zero. Même s'il s'agit d'un monde de niche basé sur des règles, il a de grandes implications dans toutes les industries travaillant à partir de règles physiques - pensez à la chimie, au trafic, à la biologie, à la pharmacologie, aux voyages, à la logistique et à la fabrication. Si nous pouvons concevoir des règles si flexibles qu'elles puissent fonctionner à partir d'une expérience plus large, et si directionnelles qu'elles créent toujours des compétences plus fortes - comme Alpha Go Zero - alors il est possible de réaliser une intelligence artificielle qui dirige les systèmes. Ces systèmes n'auraient besoin d'aucune donnée extérieure, n'auraient aucun problème de nettoyage des données et n'auraient besoin d'aucun ralentissement intempestif. C'est en partie pourquoi la société mère de Google, Alphabet, mise l'entreprise sur l'intelligence artificielle et investit dans l'intelligence artificielle à un rythme rapide. (Amazon investit également dans l'intelligence artificielle, comme sa dernière acquisition d'IA, BodyLabs.)

quel âge a kate bassich

Le professeur de Deep Mind, David Silver, déclare : « le fait que nous ayons vu un programme atteindre des performances de haut niveau … devrait signifier que nous pouvons maintenant commencer à nous attaquer à certains des problèmes les plus difficiles et les plus percutants pour l'humanité ».

Cet article a été mis à jour pour préciser que AI Libratus a récemment battu les meilleurs joueurs de poker en utilisant une stratégie qui implique un jeu personnel plutôt que des données saisies par l'homme.