DeepMinds kunstige intelligens-program AlphaZero viser nu tegn på menneskelignende intuition og kreativitet, i det udviklere har hyldet som 'vendepunkt' i historien.
Computersystemet forbløffet verden sidste år når det mestrede skakspelet fra bunden inden for kun fire timer, selvom det ikke var programmeret, hvordan man vinder.
Men nu, efter et år med test og analyse af skakmestre, har maskinen udviklet en ny spilstil i modsætning til nogensinde set før, hvilket antyder, at programmet nu improviserer som et menneske.
I modsætning til verdens bedste skakmaskine - Stockfish - som beregner millioner af mulige resultater, mens den spiller, lærer AlphaZero af sine tidligere succeser og fiaskoer, hvilket gør sine bevægelser baseret på en 'tåget fornemmelse af, at det hele kommer til at fungere i det lange løb , ifølge eksperter hos DeepMind.
Da AlphaZero blev tappet mod Stockfish i 1,000-spil, tabte den kun seks, vandt overbevisende 155 gange og trak de resterende kampe.
Alligevel var det den måde, det spillede, der har forbløffet udviklere. Mens skakcomputere overvejende kan lide at holde fast i deres stykker, ofrede AlphaZero let sine soldater for en bedre position i trefningen.
I en tale med The Telegraph sagde prof David Silver, der leder forskningsgruppen for forstærkende læring på DeepMind: ”Det har en meget subtil følelse af intuition, der hjælper den med at afbalancere alle de forskellige faktorer.
”Det har et neuralt netværk med millioner af forskellige indstillelige parametre, som hver især lærer sine egne regler for, hvad der er godt i skak, og når du sætter dem alle sammen, har du noget, der på en ganske hjernelignende måde udtrykker vores menneskelige evne til at kig på en position og sig 'ah ha dette er den rigtige ting at gøre'.
”Min personlige tro er, at vi har set noget ved et vendepunkt, hvor vi begynder at forstå, at mange evner, som intuition og kreativitet, som vi tidligere troede var inden for det menneskelige sindes domæne, faktisk er tilgængelige for maskinintelligens såvel. Og jeg synes, det er et virkelig spændende øjeblik i historien. ”
AlphaZero startede som et 'tabula rasa' eller et tomt skifersystem, programmeret med kun de grundlæggende regler for skak og lærte at vinde ved at spille millioner af spil mod sig selv i en proces med prøve og fejl, kendt som forstærkningslæring.
Det er på samme måde, som den menneskelige hjerne lærer, og justerer taktik baseret på en tidligere sejr eller tab, som gør det muligt for den at søge på bare 60 tusind positioner pr. Sekund sammenlignet med de cirka 60 millioner stockfisk.
I løbet af få timer havde programmet uafhængigt opdaget og spillet almindelige menneskelige åbninger og strategier, før de gik videre til at udvikle sine egne ideer, såsom hurtigt at sværme rundt om modstanderens konge og placere langt mindre værdi på individuelle stykker.
Den nye spillestil er analyseret Chess Grandmaster Matthew Sadler og Women's International Master Natasha Regan, der siger det i modsætning til enhver traditionel skakmotor.
”Det er som at opdage de hemmelige notesbøger fra en eller anden stor spiller fra fortiden,” sagde Sadler.
Regan tilføjede: ”Det var fascinerende at se, hvordan AlphaZeros analyse adskiller sig fra topskakmotorer og endda top Grandmasterspil. AlphaZero kunne være et kraftfuldt undervisningsværktøj for hele samfundet. ”
Garry Kasparov, tidligere verdenschackmester, som berømt tabte skaksmaskinen Deep Blue i 1997, sagde: ”I stedet for at behandle menneskelige instruktioner og viden i enorm hastighed, som alle tidligere skakmaskiner, genererer AlphaZero sin egen viden.
"Det spiller med en meget dynamisk stil, ligesom min egen. Implikationerne går langt ud over mit elskede skakbræt."