AlphaZero - Google bevisar genombrott för AI med Schackspel
AlphaZero. Vad är AlphaZero? Vad är det som är så speciellt med Googles artificiella intelligens som gör att den kan slå världens bästa schackprogram?
Enligt The Guardian tog det bara 4h för Googles AlphaZero att lära sig schack så bra att det lyckades slå schackprogrammet StockFish 8, av många ansett som världens bästa och mest avancerade schackprogram.
Videoklipp: AlphaZero vs Stockfish
Här kan du se en video som visar hur AlphaZero dominerar i schack. Kommenterat av en schackexpert. Du måste se detta om du är det minsta schackintresserad!
Det kanske mest anmärkningsvärde tecknet på artificiell intelligens hos AlphaZero, och något som tyder på en väldigt mänsklig egenskap, är att bryta mot en närmast helig regel inom schack.
Det som alla nybörjare får lära sig att inte göra, men som människan gärna VILL göra. Vad är det för mystiskt jag pratar om? Det är givetvis regeln att du ska inte röra samma spelpjäs flera gånger under öppningen av spelpartiet!
Men här kommer AlphaZero och visar att man kan uppnå övertag genom att göra just detta! AlphaZero känner inte till den regeln eftersom den inte fått lära sig några strategier så den tänker som en mänsklig nybörjare som inte kan schack så bra! Ett verkligt tecken på intelligens med andra ord.
Kanske en tankeställare till schacklärare också att människans hjärna kanske var något på spåret där tills barnet fick lära sig att.. aja baja inte flytta samma pjäs flera gånger! Hmm, den otränade mänskliga hjärnan kanske är smartare än en "fel"tränad hjärna? Hur många sådana här "felaktiga" regler och förhållningssätt lär vi oss i skolan kan man fråga sig?
Kanske borde AlphaZero få gå grundskolan i Sverige och peka ut exakt vilka fel i inlärningen som skolsystemet uppvisar?
Men nu åter till schackpartiet AlphaZero vs Stockfish. Detta är magi, se och lär:
Vilka är DeepMind?
Det är ett av Googles inköpta dotterbolag, DeepMind, som lyckats med den imponerande bedriften att utveckla något som skulle kunna sägas vara AI på riktigt. AlphaZero fick bara instruktioner om hur Schack fungerar och dess grundläggande regler, men inga andra mänskliga strategier eller annan hjälp matades in. DeepMinds AI-program lyckades alltså lära sig själv schack så bra på bara 4 timmar att den uppnådde en schackmästares nivå.
DeepMind beskriver själva sitt företag så här:
DeepMinds AI-program lärde sig bara spelreglerna för 3 spel, japanska Shogi, GO och Schack.
Tidigare lyckades Googles robot även slå Europamästaren i spelet GO, trots att AlphaZero inte alls var tänkt eller specifikt anpassat för att spela detta spel som ansetts mycket svårt för datorer att bemästra.
Nu har man alltså uppnått en sådan nivå att det kan dominera Schack efter bara 4 timmars träning. Då ställer man sig snabbt frågan, vad kan man mer låta denna artificiella skapelse göra?
AlphaZero undersöker ålder
Diverse medicinska undersökningar kanske man kan låta den utföra, kontrollera röntgenbilder, koppla in den till magnetröntgen och avgöra om den ensamkommande våldtäktsmannen, förlåt "barnet", från Afghanistan verkligen är ett barn eller en vuxen?
Det som tagit Socialförseningsstyrelsen och Massimmigrationsverket flera år att försöka fastslå kan antagligen AlphaZero lära sig inom ett par minuter. Är det ett barn eller en vuxen vi ser? Vi kör en simulering med magnetröntgen av knäleder.
AlphaZero:
2,14 min träning.
Analyserar..
Barn: 19%
Vuxna: 81%
Där ser man, tandläkarna och Interpol hade rätt.
AlphaZero vs StarCraft
Nästa utmaning är enligt Newsweek att försöka få AlphaZero att lära sig spela StarCraft. Här har dock mänskliga motståndare mycket större möjligheter att göra diverse tjuvtricks och lurendrejerier som kan vara väldigt svårt för en dator att förstå sig på. Sunt förnuft är en akilleshäl hos datorprogram (och politiker..), vilket AlphaZero antagligen inte helt kan komma ifrån. Ni kan själva se hur jag själv sopar banan med motståndarna som Protoss här, eller jag visar i alla fall bra exempel på hur en människa spelar..hmm. För en människa har det också betydelse vilken dag man spelar. Min egen toppform är tydligen under tisdagar och torsdagar enligt statistiken. Klockan 16 och 23 har jag också en signifikant högre vinstchans än övriga tider på dygnet. Sådana variationer slipper AlphaZero.
StarCraft en för stor utmaning?
StarCraft kan nog bli en betydligt större utmaning än man kanske först tror nu när DeepMinds AI- program lyckats dominera i schackspelandet på ett mycket imponerande sätt. Det är mycket lättare att lura ett datorprogram att man tänker göra den ena eller andra manövern än det är att lura en mänsklig motståndare. Fast en del människor verkar förstås inte vara smartare än brödrosten i köket heller för den delen, så det är väl rätt stor variation bland de mänskliga spelarna.
Däremot kommer naturligtvis AlphaZero vara snuskigt snabb och effektiv på att bygga rätt saker med minimala tidsförluster. Men att bygga en optimal bas för snabb produktion kan givetvis lämna dörren öppen för den mänskliga motståndaren att bara vandra in i basen på olika sätt, eftersom man inte bara behöver bygga optimalt och effektivt, man ska samtidigt bygga så att man förstärker försvaret -samtidigt. En kombination som kan vara svårare än man tror för en AI-robot att lära sig, eller?
Vi kommer garanterat få se helt sjuka build-orders och olika faser med massproduktioner av vissa speciella enheter för att snabbt bytta till All-in av något annat, vilket också gör att det i alla fall till en början kommer vara relativt lätt för en människa att lura skiten ut AlphaZero. Men med en längre tids övning så kommer den naturligtvis bli väldigt svårslagen även i StarCraft.
Föredrar du schack mot mänskliga motståndare?
Om du inte gillar att spela mot datorer så kan du möta slumpmässiga mänskliga motståndare live här.