Статья Дэвида Сирлина разбирает проблему решаемости (solvability) в соревновательных стратегиях: как сделать систему понятной, но при этом такой, чтобы игроки не могли вывести единственно верный способ игры и всегда следовать ему.
Чистое и смешанное решение
Чистая стратегия — полный набор инструкций «что делать в каждой ситуации». Если существует лучшая чистая стратегия, это чистое решение. Узнав его, игрок перестаёт принимать решения: он просто исполняет скрипт.
Смешанная стратегия — распределение вероятностей по нескольким чистым стратегиям («против X я делаю Y в 30% случаев и Z в 70%»). Оптимальная смешанная стратегия — смешанное решение (Nash equilibrium). В отличие от чистого решения, даже зная смешанное, игроку всё ещё нужно подстраиваться под оппонента и его отклонения.
Оптимальная игра = наименее эксплуатируемая
Сирлин подчёркивает математическое определение «оптимальности»: это не «максимальный винрейт вообще», а минимальная эксплуатируемость.
На примере «камень–ножницы–бумага»: играть камень 100% — полностью эксплуатируемо (бумага 100% даёт вам 0% побед). Наименее эксплуатируемая стратегия — 33/33/33. Против любой стратегии оппонента вы не будете в минусе.
Почему «оптимально» не всегда «лучше»
В турнире против соперника, который жмёт камень 100%, игра по теории (33/33/33) даёт вам 33% шанса проиграть каждый раунд. Игрок, который жмёт бумагу 100%, выигрывает намного чаще. То есть эксплуатация чужой не-оптимальности может быть лучше для победы, чем игра строго по теории.
Можно частично смещаться от оптимума (например, с 33% бумаги до 40%), чтобы сильнее наказывать оппонента, оставаясь относительно неэксплуатируемым. Важен навык: заметить отклонение соперника и корректно его наказать.
Donkeyspace: пространство субоптимальной игры
Donkeyspace (термин Фрэнка Ланца) — пространство всех субоптимальных стратегий. Хороший игрок осознанно входит в donkeyspace, чтобы эксплуатировать других, кто тоже играет субоптимально. При этом оба могут «танцевать» по разным областям donkeyspace, подстраиваясь друг под друга.
На практике почти никто не играет строго оптимально, даже в таких играх, как Poker. В играх Сирлина Pandante (вариация покера) и Yomi (карточная игра про чтение оппонента) знать точный оптимум ещё сложнее. Все игроки находятся в donkeyspace и спорят, чьи приближения к оптимуму лучше.
Почему реализовать смешанное решение почти невозможно
Даже если бы оптимальная смешанная стратегия была известна, люди:
- плохо рандомизируют (сложно воспроизводить, например, 42,3% выбора);
- имеют неосознаваемые паттерны, которые можно эксплуатировать;
- проявляют личностные склонности к риску/осторожности;
- в реальном времени ограничены скиллом исполнения (комбо, прицеливание и т.п.).
Исследования Левицки (1997, 1998) показывают, что люди подсознательно учат паттерны и используют их, отрицая их существование. Это значит, что игроки будут невольно отклоняться от идеального рандома, а соперники — эксплуатировать это, часто тоже неосознанно.
Почему игры с чистым решением вырождаются
В игре с чистым решением знание оптимального скрипта полностью убирает необходимость учитывать оппонента. По мере приближения комьюнити к решению, всё больше участков игры превращаются в чистую меморизацию.
Пример: в Chess (классические шахматы) решённые эндшпили и всё более жёстко структурированные дебютные книги — это зоны, где решает знание, а не адаптация. В Chess 2 (вариант Сирлина) правило «midline invasion» не даёт этим решённым эндшпилям возникать.
В играх со смешанным решением, вроде Poker, Pandante или Yomi, даже по мере роста знаний игра не сводится к заученным линиям: она остаётся про чтение оппонента и реакцию на его отклонения.
Дизайн: как избегать чистых решений
Игры с полной информацией и без рандома интуитивно кажутся «максимально скилл-зависимыми», но на самом деле гарантируют наличие чистого решения и со временем смещают мету в сторону заучивания.
Сирлин рекомендует сознательно добавлять:
- скрытую информацию;
- случайность;
- одновременный выбор (double blind);
- реальное время и ограничения на исполнение.
Пример: Kongai
Kongai — игра Сирлина, вдохновлённая Pokemon. На каждый ход игрок делает два решения, оба — double blind (одновременное раскрытие). Это ломает полную информацию.
Дополнительно введены:
- рандом в шансах попадания (hit rates);
- рандом в шансах срабатывания эффектов (proc rates).
Это резко усложняет просчёт дерева состояний. Попытки игроков вывести оптимум даже в сильно упрощённых эндгеймах (1 на 1, фиксированные персонажи и предметы, без смены и перехватов) требовали десятков страниц анализа. Для полной игры это практически нереализуемо.
Выводы
- «Оптимальная» (минимально эксплуатируемая) стратегия не всегда лучшая для победы: важно уметь входить в donkeyspace и эксплуатировать чужие ошибки.
- Чистые решения ведут к вырождению в меморизацию; смешанные решения дольше сохраняют необходимость адаптации к оппоненту.
- Реализовать идеальное смешанное решение людям практически невозможно, что само по себе поддерживает глубину игры.
- Чтобы избежать решаемости, дизайну нужны скрытая информация, рандом, одновременные ходы и/или реальное время.
- Проектируя соревновательную игру, стоит целиться в пространство смешанных решений, а не в «чистую» детерминированность.