Најдобриот играч на покер

Научнициците го создадоа најдобриот играч на покер во светот, условно кажано, со тоа што се работи за програма која практично не може да биде поразена. Научниот труд од предметните научници е објавен во „Журнал Сајнс“ и покажува дека програмата не може да загуби, барем не од еден човечки живот.

Постојат програми кои се така програмирани што нема да можете да ги победите на различни игри, кои се поедноставни од покер – четири последователни или дама на пример. Но за комплексната игра на покерот, ова не е направено претходно. Во конкретниов случај машината е експерт за Texas Hold ’em покер. Неизбежно е да се запрашаме,  како успеале научниците, со оглед на тоа што успехот зависи од многу различни фактори – несигурни податоци, случајност, среќа, блеф и така натаму.

Зошто сепак предметната програма не може да биде поразена и како е постигнато тоа?

Олеснетата варијанта на Texas Hold ’em, вклучува ограничено наддавање, само двајца играчи и уште неколку други правила, што ја олеснуваат играта. И покрај сè, по пишувањето на програмата, на неа и биле потребни два месеци и 4000 централни процесорски, што е еквивалентно на 1000 години компјутерска работа, за да игра сама против себе, да го подобри начинот на игра и да изучи нови решенија за победа. Токму така – компјутерот се учи како да игра и да не губи, чувајќи информации за претходни слични делења или некое конкретно. Потоа програмата пресметува кое е најдобро оптимално решение на предметниот потег, за да има најголеми шанси за победа. Тоа не значи дека таа го разработува секое една раздавање, туку само дека дури и да имавте време да одиграте 60 милиони делења со компјутерот, пак немаше да победите на играта .

Сето ова го надградува на веќе воспоставениот алгоритам counterfactual regret minimization (CFR), со што се намалува шансата за губење на некоја рака.

Но, сето ова не е само една игра – научниците веруваат дека нивната работа може да помогне иден развој на програми кои помагаат софтверски асистенти на аеродромите или пак донесувањето на важни одлуки за кратко време.

- Реклама -