Zet Game Changer de schaakwereld op zijn kop?

Intro

In Wijk aan Zee werd eind januari, tijdens het Tata Steel Chess Tournament, het boek ‘Game Changer’ gepresenteerd. Game changer met AlphaZero’s groundbreaking Chess Strategies and the Promise of AI. Volgens oud-wereldkampioen Kasparov trilt het schaakspel op haar grondvesten sinds de komst van AlphaZero. En Kasparov zou Kasparov niet zijn als hij zichzelf geen schouderklop zou geven. Volgens uitgever New in Chess is dit het boek waar het meest naar is uitgekeken. Ongekend in het bestaan van de uitgeverij, zo liet men weten.

Komt er nu een geheel nieuwe kijk op ons eeuwenoude koninklijke schaakspel?  Is het schaakspel nu definitief opgelost? Wint wit of zwart altijd bij perfect spel van beide zijden of eindigt iedere partij in remise? Kunnen schakers (amateurs en professionals) iets van AlphaZero leren of is het alleen voorbehouden aan supersnelle computers met superslimme programma’s? Begrijpen schakers het spel van AlphaZero of staat de uitleg nog in de kinderschoenen en heb je nog steeds mensen nodig zoals Matthew Sadler en Natasha Regan om het te duiden? Kan de toptien van de wereld, als ze de partijen en concepten van AlphaZero bestuderen, nog een grote stap voorwaarts maken in hun rating? Kunnen zij hiermee bij voorbeeld binnen drie jaar 250 ratingpunten of meer winnen en kunnen zij de 3000-barrière definitief slechten? Moeten onze schaakjournalisten naar een Zero-bijscholingscursus? Wat moet Schaakmagazine er mee? Moet Van Wijgerden zijn Stappenmethode herzien?

Zo maar een paar vragen die spontaan opkomen. De vraag is of de (erwten)soep wel zo heet wordt gegeten in de schaakwereld? Afgaand op de eerste reacties van de wereldtoppers niet. We weten toch al langer dat de bolides in de Formule 1 (met nog mensen aan het stuur) iets anders kunnen dan Usain Bolt of Daphne Schippers! Reken maar dat de wereldtoppers en hun secondanten het materiaal serieus zullen bekijken. Niemand wil de boot missen. Voor de amateurs is er altijd wel iets te leren.

AlphaGo

Toen ik drie jaar geleden op onze site voor het eerst publiceerde over AlphaGo waren er lezers die zich serieus afvroegen of dit onderwerp wel op onze site thuishoorde. Het ging toch over het spel Go en niet over het schaakspel? Dus weg ermee. Nu ziet men in dat het de voorbode was. Meerdere artikelen zouden volgen. Zoek zelf met ‘Alpha’ als zoekopdracht op onze site.

De eerste versie

Begin 2014 nam het grote Google het kleine bedrijf DeepMind over. Een van de oprichters van DeepMind was Demis Hassabis, een naam om te onthouden. Door deze overname kwamen de ontwikkelingen bij DeepMind in een stroomversnelling. Door toevallige omstandigheden werd besloten om een programma te maken die de wereldkampioen Go zou kunnen verslaan. Insiders waren toen nog van mening, ook in Nederland, dat het nog minstens tien tot vijftien jaar zou duren eer de mens hierin zou slagen. Het spel Go was te complex. Het aantal mogelijke stellingen is een 10 met 170 nullen! Hier staat tegenover dat er nieuwe technieken zijn zoals neurale netwerken (deeplearning), zelflerende algorithmen (kunstmatige intelligentie) geavanceerde zoektechnieken (Monte Carlo Tree Search) en supersnelle computers.

Men pakte het aanvankelijk op de klassieke manier aan door de ‘computer’ te voeden met de menselijke kennis en ervaring van het Go-spel. Duizenden gespeelde partijen werden ingevoerd, kennis uit de vele boeken, tips & trucs etc. De ‘computer’ moest dit naspelen en zichzelf verbeteren. Daarna ging de ‘computer’ tegen zichzelf spelen om nog beter te worden. In oktober 2015 speelde AlphaGo tegen Fan Hui, de Europese Go-kampioen,  en won met 5-0. Een grote schok ging door de Go-wereld. Men verwachtte niet dat de Go-wereldkampioen verslagen zou kunnen worden. Het programma werd verbeterd en in maart 2016 werd meervoudig wereldkampioen Lee Sedol met 4-1 verslagen en kreeg de ‘computer’ de hoogste Go-graad, de negende dan. Naar deze match keken wereldwijd meer dan 200 miljoen mensen en men was verbaasd dat de ‘computer’ al zo bovenmenselijk sterk was. In januari 2017 verschenen er op internet de spelers Master en Magister  die snelle partijtjes Go speelden. Master en Magister werden ontmaskerd en bleken AlphaGoMaster te zijn, een nieuwe versie van AlphaGo.

AlphaGoZero

Hierna ging het roer om. Men verliet de klassieke aanpak en begon aan een geheel nieuw experiment. De computer werd geheel geschoond van alle kennis van het Go-spel en alleen de spelregels bleven nog over. De ‘computer’ moest tegen zichzelf spelen en spelenderwijs beter worden. Per seconde werden 60.000 partijen gespeeld, dagen achtereen. Ongelofelijk. Het programma kreeg de toevoeging Zero omdat geen menselijke kennis van het Go-spel werd gebruikt, alleen de spelregels! De eerste match was AlphaGoZero tegen het sterke AlphaGo (de oude versie die de wereldkampioen versloeg). De uitslag was 100-0 voor de Zero-versie. Ook de bestaande computerprogramma’s die Go speelden waren al eerder verpletterend verslagen. (Crazy Stone en andere)

AlphaGoZero ontdekte nieuwe kennis, onconventionele strategieën en creëerde nieuwe onverwachte zetten.

AlphaZero

De volgende stap was om hetzelfde AlphaZero-concept, naast Go, ook toe te passen op Shogi (Japans schaak) en op onze internationale versie van het schaakspel.

In december 2017 verscheen er een eerste publicatie en eind 2018 een gedegen wetenschappelijk artikel in Science. Google DeepMind opende ramen en deuren en gespeelde partijen werden ter beschikking gesteld.

London Chess Classic december 2017. Demis Hassabis van Google’s Deepmind doet de eerste zet.

Al in 1997 had de IBM-computer Deep Blue gewonnen van wereldkampioen Kasparov. Nadien werden de computerprogramma’s sterker en sterker. De mens is definitief verslagen. De (jonge) schaker kan steeds beter worden door een goede samenwerking met de computer, een concept dat Kasparov vaak bepleitte. Laptops vergezellen de wereldtop onafscheidelijk, thuis en tijdens hun toernooien. De schaakprogramma’s op onze mobieltjes en tablets zijn sterker dan destijds Deep Blue.

AlphaChessZero leerde zichzelf schaken met alleen de spelregels als bagage. Dit is uniek en nog nooit vertoond Toen het programma sterk genoeg werden er matches met het sterke schaakprogramma Stockfish gespeeld, de wereldkampioen van het computerschaak. AlphaChessZero won op overtuigende wijze een van die matches die over 1000 partijen ging.

AlphaStar

Bij DeepMind ging men in hoog tempo verder en men wilde een nieuwe uitdaging op een nog hoger niveau. Zij ontwikkelden AlphaStar en betraden hiermee een geheel nieuw terrein, dat van de geavanceerde computergames. Bij het videospel Starcraft II moeten spelers een kamp en een leger opzetten en het kamp van de tegenstander vernietigen. Aan zo’n spel kunnen acht spelers tegelijk meedoen. Starcraft is van het bedrijf Blizzard dat zijn medewerking verleende en een database ter beschikking stelde met bijna 70.000 gespeelde games. Zijn het aantal mogelijkheden bij Go een 10 met 170 nullen, bij Starcraft gaat het om een 10 met bijna 300 nullen. De eerste versie Alphastar versloeg de professionele e-sporters met 10-1, onder hen ‘s werelds sterkste professional ‘MaNa’. Naast spelintelligentie speelt snelheid van handelen een grote rol bij dit spel.

De geschiedenis herhaalde zich. Niemand in de gamewereld had verwacht dat dit nu al mogelijk zou zijn.

Game Changer

Voor ons ligt nu het kloeke boek Game Changer samengesteld door GM Matthew Sadler en WIM Natasha Regan, uitgegeven door New in Chess. Met medewerking van medewerkers van DeepMind. Waarom deze twee auteurs? Een simpele reden. Zij kenden Demis Hassabis uit hun jeugd toen hij nog actief was als jeugdspeler. Op veertienjarige leeftijd behoorde Demis met Judit Polgar tot de top bij de jeugd. Matthew en Natasha lieten Demis hun boek Chess or Life zien en van het een kwam het ander.

Het boek beslaat 415 pagina’s en laat zich in willekeurige volgorde lezen. Garry Kasparov schreef het voorwoord, Demis Hassabis een introductie en de auteurs een korte inleiding en introductie van het boek. Matthew Lai, waarmee we al in augustus 2016 kennis hebben gemaakt, was ook een van de belangrijke gesprekspartners van de auteurs. Matthew Lai had, voor hij werd ingelijfd bij DeepMind, al een spraakmakend zelflerend schaakprogramma gemaakt. Lees het artikel er nog maar eens op na.

Het eerste deel van Game Changer gaat in vogelvlucht over de geschiedenis van het computerschaak, over Zero en maken we uitgebreider kennis met Demis Hassabis en zijn DeepMind.

In het tweede deel mogen we onder de motorkap kijken van AlphaZero. De delen drie en vier gaan over schaken, in deel drie gaat het over schaakthema’s en de wijze waarop AlphaZero deze behandeld en in deel vier gaat het over de openingskeuzes die zijn gemaakt. Deel vijf gaat over conclusies met een epiloog en een technische noot.

DeepMind’s missie

Het gaat DeepMind natuurlijk niet om het oplossen van spelletjes maar om het vinden van bijdragen aan oplossingen voor grote problemen waarvoor de mensheid zich gesteld ziet. Of dit nu de gezondheidszorg is, de klimaatverandering, de mobiliteit, de energietransitie, het onderwijs, de defensie, het ontwikkelen van medicijnen of andere onderwerpen.

Steven Strogatz, een Amerikaanse professor in de Toegepaste Wiskunde aan de Cornell Universiteit in Ithaca (New York), gaf zo’n algemeen programma, dat op diverse terreinen een oplossing kan bieden, de naam AlphaInfinity.

Google’s Deepmind heeft aangetoond een uitstekend team van onderzoekers te hebben en daarnaast te beschikken over diepe zakken.

Ook de concurrenten van Google’s DeepMind zitten niet stil. Tientallen miljarden worden jaarlijks geïnvesteerd in de nieuwe technologische ontwikkelingen.

Nog een game changer

Drie jaar geleden publiceerde ik Tata Steel speelt Go en hierin kwam het begrip game changer in een ander verband langs. Ook hier waren zeer recent nieuwe ontwikkelingen te melden waarover meer in de komende aflevering van de serie Schaken op het Europese Staalschaakbord.

Een nieuwe uitdaging voor onze bezoekers van schaaksite.nl

Welke partij of welke zet van AlphaZeroChess kan karakteristiek worden genoemd voor het nieuwe schaakdenken?

Bij Go heeft men op deze vraag al een eenduidig antwoord gevonden.

In match 2 tegen Lee Sedol speelde AlphaGo een zet (de 37ste) die een mens waarschijnlijk nooit zou spelen. Tijdens het volgen van deze live-game schrokken de professionals van deze zet. Dit zou verlies betekenen voor AlphaGo. Het pakte anders uit.

Wordt vervolgd.

 

2 Comments

  1. Avatar
    Jaap Amesz februari 07, 2019

    Dank je wel voor je overzicht.

    De eerste verpletterende match tegen Stockfish is veel kritiek op geweest, oa in New in Chess uitgebreid besproken wat er mis was met de condities door schaaksoftware programmeur GM Kaufman. Het was een opzetje om zo AlphaZero met een grote knal de wereld in te storten. Slimme marketing! Toen de persgolf eenmaal op gang was leek het haast wel alsof niemand van die bezemwagen meer wou springen. De heilig verklaring is er nu eenmaal.

    Schaakregels in een zelflerend programma zetten is zeg maar ‘vrij recht toe aan’. Geen idee hoe je een kwantum computer de genezing voor kanker gaat laten vinden. Dan ga je van een paar schaakregels op een a4tje naar zeer complexe biologische systemen. Waar begin je dan? Hoe zet je de basis neer waarna er zinvol geoefend kan gaan worden?

     

  2. Avatar
    Koorevaar februari 07, 2019

     

    @JaapAmesz

    Bedankt voor je reactie. Gelukkig zijn de omstandigheden meer gelijk getrokken en bleef AlphaZeroChess (AZC) winnen.Wel indrukwekkend wat Deepmind de afgelopen 5 jaren heeft gepresteerd. En dit is nog maar het begin. Wat gaan de ontwikkelingen snel. Dat men op de trom roert is wel te begrijpen. Het was wel een voordeel dat Demis Hassabis en Matthew Lai ook schaakliefhebbers zijn. Anders was het boek er niet gekomen denk ik. Bestaande schaakprogramma’s zullen meer en meer de technieken van AZC gaan overnemen en er komen al nieuwe schaakprogramma’s met de nieuwe technieken. Als de quantum-computer er komt met de qubits dan betreden we een geheel nieuw terrein en gaan we nog een paar ‘divisies’ hoger spelen. In Delft wordt samengewerkt op dit terrein met Microsoft.Maar de hamvraag blijft of AZC  werkelijk creatief en aanvallend speelt en dit geheel anders doet dan de mens in de afgelopen drie eeuwen? Dit is nog niet bewezen denk ik, rekening houdend met de rekenkracht van mens en  beest. Hier ligt nog een uitdaging om dit eens te onderzoeken, misschien ook iets voor jou?

     

Only ingelogde gebruikers kunnen een reactie achterlaten.