London Die unschlagbare Maschine

London · Ein intelligenter Computer hat sich das chinesische Brettspiel Go selbst beigebracht. Er ist nicht mehr zu schlagen.

Die Entwickler von künstlicher Intelligenz verbuchen einen weiteren Erfolg. Sie haben einen Computer konstruiert, der beim asiatischen Brettspiel Go selbst von Profi-Spielern nicht besiegt werden kann. Die Maschine und ihre Rechenalgorithmen stammen von DeepMind, einer Tochter von Google, die sich mit dem Aufbau von künstlicher Intelligenz (KI) befasst.

Bereits im März 2016 hatte der mehrfache Go-Weltmeister Lee Sedol im Duell Mensch gegen Maschine keine Chance gegen den Rechner von DeepMind. Doch die damalige Version AlphaGo hatte ihre Spielstärke dadurch erreicht, dass sie die Partien von Spitzenspielern analysiert hatte. Der Nachfolger AlphaGo Zero kommt ohne menschliche Hilfe aus. Er hat sich das Spiel selbst beigebracht, denn Zero kannte nur die Regeln - mehr nicht. Der Computer spielte nur gegen sich selbst, belohnte die Ergebnisse der Algorithmen, die ihm einen Sieg gebracht hatten und strafte die anderen ab. Zu Beginn spielte der Rechner wie ein Anfänger, doch er lernte schnell, welche Züge vielversprechend sind. Das Netzwerk berechnet auf der Basis der gespielten Spiele für jeden möglichen Zug die Gewinnwahrscheinlichkeit. Schon nach drei Trainingstagen habe Zero komplizierte Strategien gewählt, die auch von menschlichen Profispielern verwendet werden, berichtet Chef-Entwickler Demis Hassabis.

Nach seiner Einschätzung ähnelt das Vorgehen der künstlichen Intelligenz zumindest zu Beginn des Lernprozesses noch dem Verhalten des Menschen. Letztlich sei der Lernerfolg wesentlich größer, weil Zero wesentlich mehr Spiele als Grundlage verwenden kann. Der Rechner ist so schnell, dass er durchschnittlich nur 0,4 Sekunden zum Nachdenken benötigt. Nach vier Wochen Training mit 30 Millionen Spielen trat Zero gegen den bis dahin besten Go-Computer, AlphaGoMaster, an, der noch mit menschlichen Spielen geschult wurde. Die Partie verlief sehr einseitig und endete 100 zu 0. "Die Ergebnisse zeigen, dass eine KI, die auf sich allein gestellt ist, bei Lernprozessen besser abschneidet als diejenige, die auf menschlichem Wissen basiert", schreibt Satinder Singh von der Universität Michigan in einem Kommentar in der Wissenschaftszeitung "Nature".

KI-Experten, die die Spielweise von AlphaGo Zero analysiert haben, gewinnen überraschende Erkenntnisse. Sie zeigen auf, wie eigenständig der Computer sein Wissen erworben hat, und wie er es verwertet. "Man sieht, dass AlphaGo Zero menschliche Züge nicht gut vorhersagen kann", hebt Markus Liwicki hervor. Trotzdem spiele die neue Version stärker als ihre Vorgänger, die menschliche Züge besser vorhersagen konnten. Der Leiter der "Mindgarage" an der TU Kaiserlautern vermutet, dass die Schulung mit menschlichen Go-Partien das System zu stark eingeschränkt habe. "Menschliche Experten haben sich aufgrund natürlich gegebener Kapazitätsgrenzen auf einer Einbahnstraße des Spielwissens befunden, während das neuronale Netz durch ein vielfaches Ausprobieren von Spielvarianten tatsächlich mehr 'Expertenwissen' lernen konnte", sagt Liwicki.

"Wenn man so möchte, konnte das Programm ganz unvoreingenommen lernen, wie Go gespielt werden sollte", erklärt Christian Bauckhage, Professor für Medieninformatik und Mustererkennung am Fraunhofer-Institut in St. Augustin. Folgt man diesem Gedanken, stellt sich die Frage, ob der Mensch die Schönheit des Brettspiels und die möglichen Strategien beim Go erst durch den Computer gänzlich überblicken kann. Dass Rechner bestimmte Aufgaben besser lösen können als Menschen, wissen wir schon seit der Erfindung des Taschenrechners. Dieser Sichtweise folgend ist die Überlegenheit der künstlichen Intelligenz keine Bedrohung, sondern ein Werkzeug, das dem Menschen ein Wissen verschafft, dass er allein nicht gewinnen könnte. So könnte die KI Probleme lösen, die so komplex sind, dass sie das menschliche Gehirn überfordern. Doch dann müsste man akzeptieren, dass Maschinen durch das menschliche Einbahnstraßen-Denken behindert werden und die zur Verfügung stehenden Informationen nach eigenen Methoden auswerten.

"Die Leistungen des Programms sind durchaus auf andere Problemstellungen übertragbar, bei denen der Rahmen klar definiert ist", erklärt Liwicki. Entscheidend dafür sei, dass das System Millionen von Tests durchführen könne und deren Bewertung klar und eindeutig sei. "Das ist bei vielen praktischen Problemen jedoch nicht der Fall", sagt der Wissenschaftler. Auch Christian Bauckhage ist skeptisch. "In welcher Situation in der echten Welt kennen wir schon alle Regeln?", fragt er. In solchen Fällen ist der Mensch noch immer überlegen.

Auch für die Angst, dass Google die Entwicklung von künstlicher Intelligenz dominiere, liefert AlphaGo Zero keine neue Nahrung. Rein technisch gesehen sei das neue System gar nicht so innovativ, urteilt Christian Bauckhage. Die Entwickler hätten mehrere bekannte Verbesserungen im Bereich der künstlichen Intelligenz gemeinsam eingesetzt. "Was hier gemacht wurde, ist einfach eine besonders clevere Fortentwicklung der Ideen aus dem letzten Jahr, das heißt eine elegante neue Kombination von neuronalen Netzen und Algorithmen zur sogenannten stochastischen Exploration möglicher Spielzüge", erklärt der Experte. Mit Geld ist Google allerdings besser ausgestattet als deutsche Universitäten - allein die Hardware für AlphaGo Zero kostet 25 Millionen US-Dollar.

(rai)
Meistgelesen
Neueste Artikel
Zum Thema
Aus dem Ressort