Авторы рассматривают, насколько существующие жанровые ярлыки видеоигр действительно передают ожидаемый игровой опыт. Они предлагают количественный метод оценки «коммуникативной эффективности» жанровой системы и применяют его к данным Steam.
Проблема жанров
Традиционные жанры (action, adventure, RPG и т.п.) создавались для простых игр с ограниченным набором механик и плохо масштабировались к современным гибридным и «открытым» играм. В итоге очень разные игры получают одинаковые ярлыки:
- Super Mario Bros и Grand Theft Auto оба помечены как action.
- Call of Duty (киношный военный шутер) и Portal (пространственные головоломки от первого лица) делят ярлыки first-person, shooter, arcade, различаясь лишь puzzle.
- Fallout 4, Far Cry 3 и Skyrim в рецензиях описываются как «Skyrim с пушками», хотя разработчики относят их к разным жанрам.
Это вводит в заблуждение игроков, усложняет подбор игр под исследовательские задачи (например, для когнитивных экспериментов) и снижает полезность жанров как инструмента поиска опыта.
Данные и метод
Источник — Steam, где есть два параллельных слоя описаний:
- Разработческие ярлыки — классические жанры, задаются студией.
- Пользовательские ярлыки — теги, которые выставляют игроки; их много, они более детальны и неоднородны.
Выборка: 208 самых продаваемых «безопасных для работы» игр (без age-gate) по состоянию на 23.02.2019.
Разработческие ярлыки: всего 11 жанров (indie, action, simulation, adventure, strategy, RPG, early access, casual, massively multiplayer, sports, racing; free to play отброшен как единичный случай). В среднем 2.64 ярлыка на игру.
Пользовательские ярлыки: из 265 исходных после очистки синонимов и удаления единичных тегов осталось 186. В среднем 15 ярлыков на игру.
Шаги анализа:
- Построение бинарной матрицы «игра × ярлык».
- Расчёт (не)сходства игр по индексу Жаккара для бинарных признаков.
- MDS (SMACOF) для уменьшения размерности и получения «карты» расстояний между играми.
- Иерархическая кластеризация (метод Уорда) по матрице расстояний и построение дендрограмм.
Качество MDS оценивали по stress и normalized stress; число измерений подбирали по дифференциальному графику stress.
Результаты
Разработческие ярлыки
Оптимальное решение — 6 измерений (stress = 0.13, normalized stress = 0.002). Дендрограмма дала 3 кластера.
Метод технически работает: игры с почти совпадающими наборами ярлыков оказываются рядом. Например, BeamNG.drive (реалистичный автосимулятор) и Species: Artificial Life, Real Evolution (эволюционный симулятор жизни) совпадают по 10 из 11 ярлыков и попадают в один кластер. Но их фактический игровой опыт радикально различен. При 11 жанрах на 208 игр система теряет различающую способность: слишком мало ярлыков, чтобы отделять разные опыты.
Пользовательские ярлыки
Оптимальное решение — 11 измерений (stress = 0.091, normalized stress = 0.008). Схожие игры (например, Total War: Warhammer и Total War: Warhammer II) логично кластеризуются: 179/186 совпадающих тегов.
Однако и здесь есть проблемные пары: VR Kanojo (VR-симулятор отношений) и Call of Cthulhu (хоррор от первого лица по Лавкрафту) делят 166/186 ярлыков и оказываются близкими, хотя их опыт несопоставим. Здесь обратная проблема: слишком много разнородных ярлыков, что ведёт к «искусственным» кластерам.
Интерпретация и ограничения
Метод (Jaccard + MDS + кластеризация) показал:
- Он способен объективно группировать игры по сходству ярлыков.
- При этом обе текущие системы ярлыков (разработческая и пользовательская) плохо передают игровой опыт: либо ярлыков слишком мало, либо слишком много и они шумные.
Анализ описательный: не все игры Steam учтены, MDS не даёт строгих статистических выводов, а отсутствие ярлыка трактуется как ещё один общий признак (что может усиливать ложное сходство).
Авторы предлагают использовать этот подход как тестовый стенд для альтернативных систем категоризации: по механикам (MDA), пользовательскому опыту, когнитивным эффектам и т.п., а также рассматривать улучшения ярлыков (веса, разделение на механические/тематические/стилевые).
Выводы
- Жанровые ярлыки в текущем виде слабо отражают реальный игровой опыт: либо их слишком мало (разработчики), либо они чрезмерно раздуты (пользователи).
- Комбинация индекса Жаккара, MDS и иерархической кластеризации даёт рабочий способ количественно оценивать качество любой системы ярлыков.
- Даже при корректной кластеризации по ярлыкам внутри кластеров оказываются игры с радикально разным опытом.
- Метод можно использовать как объективный тест для новых систем классификации (по механикам, UX, когнитивным эффектам и др.).
- Индустрии и исследователям нужны пересмотренные, более структурированные и проверяемые количественно системы описания игр.