Umělá inteligence už dokázala porazit hráče v dámě, šachu nebo japonské hře go. Poker se od nich liší především tím, že jde o hru s neúplnou informací – hráči během ní nemají všichni stejný pohled na hru, protože nedisponují stejnými informacemi. Tým výzkumníků z Univerzity Karlovy, Českého vysokého učení technického Praze a Albertské univerzity v Kanadě vyvinul počítačový program DeepStack. Během prosince 2016 se DeepStack utkal se skupinou třiceti profesionálních hráčů pokeru. A porazil je s obrovskou převahou!
Jak se učí počítač
Doposud převládal přístup, kdy musel program předem uvažovat o celé hře najednou. DeepStack je převratný v tom, že vypočítává strategii vhodnou pro konkrétní herní situaci teprve ve chvíli, kdy ona situace nastane. Umožnil mu to i rozvoj strojového učení pomocí hlubokých neuronových sítí.
DeepStack využívá neuronovou síť k vyhodnocování jednotlivých situací, které během hry nastanou. Pracuje přitom i s jistou formou "intuice", kterou si stejně jako lidský hráč zlepšuje s počtem odehraných partií.
Zápasení s počítačem
Pokerové klání probíhalo na internetu. Každý z třiceti profesionálních hráčů pocházejících ze 17 různých zemí světa měl měsíc na to, aby se připojil a s programem odehrál 3 000 partií dvouhráčové verze populárního Texas hold’em pokeru. Na tři nejlepší čekala slušná finanční odměna, takže měli dobrou motivaci vyhrát. Požadovaný počet partií dohrálo 11 hráčů. Každého z nich DeepStack porazil i individuálně. V pokerových kláních byl přitom rychlejší než jeho lidští protihráči – na jedno rozhodnutí mu stačily v průměru tři sekundy.
Uplatnění v praxi
DeepStack byl předveden na pokeru, ale aplikovat se dá mnohem šířeji. Protože jeho algoritmus spadá do oblasti teorie her, dá se aplikovat na problémy z běžného života, které se tváří jako hra. "Když se podíváte na černé pasažéry a revizory v metru, je to také taková hra. Černí pasažéři se snaží revizorům vyhýbat a revizoři se je na oplátku snaží nachytat, když zrovna nemají lístek," vysvětluje Viliam Lisý z Fakulty elektrotechnické ČVUT. Obdobně se dá algoritmus aplikovat třeba na "hry" mezi hackery a správci sítí nebo mezi správci chráněných parků a pytláky.
Turnaj v přímém přenosu
S podobnými algoritmy přicházíme do styku každý den. "Ať už si v mobilu hledáte MHD nebo si pouštíte videa na YouTube, který vám navrhuje, jaká videa by se vám mohla líbit, někde pod pokličkou těchto aplikací fungují podobné algoritmy, jako využívá DeepStack," doplňuje Martin Schmid z Matematicko-fyzikální fakulty UK. Pokud byste chtěli vidět v akci přímo DeepStack, výzkumníci plánují během pár týdnů sdílet jeho zápasy proti profesionálům přes herní streamovací platformu Twitch.
DeepStack můžete sledovat na Twitteru @DeepStackAI nebo na www.deepstack.ai
Texas hold’em poker
Na začátku hry jsou každému hráči rozdány dvě karty, které jsou jen jeho a které nikomu neukazuje. V následujících kolech se vyloží na stůl dalších pět karet lícem vzhůru. Cílem je samozřejmě z karet složit tu nejvýhodnější kombinaci. Jde o nejrychlejší a nejakčnější variantu pokeru. Snad proto je také nejoblíbenější!
Mozek UI
Neuronové sítě jsou modely napodobující propojení neuronů v lidském mozku. Učí se strojovým způsobem, kdy si z milionů podobných dat vyvodí nějaký závěr. Ukážete jim složku s obrázky koček a druhou s obrázky psů. Na základě sdílených rysů všech koček a všech psů na těchto fotkách potom bude počítač schopen určit, zda se jedná o kočku nebo psa i na obrázku, který nikdy předtím neviděl. Své znalosti neuronová síť využívá. Vytváří jejich kombinace a pamatuje si, které z nich jej dovedly k požadovanému výstupu. Na základě zkušeností pak také dokáže odhadnout nový výsledek nebo zvolit vhodný postup.