Искусственный интеллект выиграл в покер почти $2 млн благодаря необычной стратегии

AOinformIT 19.12.2017 в 13:148980
Искусственный интеллект выиграл в покер почти $2 млн благодаря необычной стратегии
© Pixabay
Искусственный интеллект выиграл в покер благодаря необычному алгоритму игры
Исследователи из американского университета Карнеги-Меллон, разработали алгоритм, который выиграл почти $2 млн в одной из разновидностей покера. Программа, которая получила название Libratus, победила четырех лучших профессиональных игроков в покер в безлимитном Техасском Холдеме, пишет EurekAlert!.

В своей статье авторы программы подробно объяснили, как ей удалось добиться сверхчеловеческой производительности, разбивая игру на управляемые части и, основываясь на игре своих оппонентов, устранять возможные недостатки в своей стратегии во время соревнований. Libratus использует трехсторонний подход для учета скрытой информации.

Как отмечают разработчики, их версия искусственного интеллекта умеет находить общие черты в различных комбинациях карт, ставок и прочих элементов игры, и считать их примерно одним и тем же вариантом развития событий. Такой подход сильно упрощает игру и позволяет находить простые решения для самых очевидных комбинаций карт и вариантов ходов соперника.

"Приемы, которые разработаны нами при создании этой системы искусственного интеллекта, не специфичны для покера, их можно применять в любых ситуациях, когда нет полной информации для принятия решений", - заявил Ной Браун из Университета Карнеги-Меллон.

Libratus состоит из трех модулей. Первый вычисляет так называемую абстракцию игры, основываясь на общих чертах между ставками и комбинациями. Это позволяет программе разработать подробную стратегию на первые раунды торговли и грубую стратегию для последующих раундов.

В ходе игры второй модуль изменяет стратегию в зависимости от действий противника. Это делается с помощью суперкомпьютера Bridges. Каждый раз, когда соперник делает ход, который не предусматривался изначальной стратегией, модуль делает соответствующие вычисления. Третий модуль предназначен для улучшения стратегии в ходе партии.
Аватар nomid Дмитрий Вовчок / nomid
Главред AOinform

19.12.2017 в 13:14 898 IT
0.0
Сегодня читают
Комментариев: 0
Войдите, чтобы оставить комментарий.