Геймплей и системы · game

papers.cool11 мая 2026

Continual Harness для самоулучшающихся игровых агентов

Статья описывает Continual Harness — оболочку для foundation agents, которая позволяет агенту улучшать себя во время одного длинного прохождения без сброса эпизода. Авторы исходят из экспериментов Gemini Plays Pokemon, где агент проходил длинные игры Pokemon с памятью, инструментами, планированием и human-in-the-loop доработкой harness. Новый подход убирает человека из цикла: агент сам чередует действия в среде с рефакторингом собственного prompt, sub-agents, skills и memory на основе прошлых траекторий. В отличие от prompt-optimization методов, которым нужны повторные эпизоды и reset, Continual Harness адаптируется онлайн внутри одной непрерывной партии. На Pokemon Red и Emerald метод снижает стоимость в button-press относительно минимального baseline и частично догоняет hand-engineered expert harness. Также описан цикл process-reward co-learning, где rollout open-source агента переоценивается frontier teacher и используется для обновления модели без сброса окружения.

Ключевая идея — не просто хранить state, а позволять агенту менять prompt, skills и memory во время длинного run.
Метод ориентирован на long-horizon partial-observability задачи, где нельзя удобно перезапускать эпизод.
Прошлые trajectory data используются как материал для самоанализа и улучшения стратегии.
Для игрового агента важна разница между минимальным raw interface и expert harness с доменными подсказками.
Process-reward teacher loop можно отделить от основного gameplay loop и применять как post-run улучшение.

papers.cool

continual-harness agents

scirate.com12 мая 2026

NARRA-Gym: бенчмарк для интерактивных нарративных агентов

NARRA-Gym предлагает исполняемую среду оценки для LLM-агентов, которые ведут интерактивную историю на много ходов. В отличие от статических промптов и разовых генераций, бенчмарк логирует полный цикл: построение сюжета, обновления памяти, планирование, темп повествования и опциональные артефакты. Авторы стартуют со sparse emotional seed и проверяют, может ли модель развернуть его в полноценный адаптивный эпизод. В работе сравниваются девять frontier LLM на восьми benchmark personas через LLM-as-judge и human evaluation. Главный вывод: хорошая литературная плавность не гарантирует устойчивость, хороший UX, персонализацию и сохранение границ персонажа. Для long-horizon AI Game Master это полезно как внешний пример того, какие оси качества стоит мерить отдельно, а не сводить всё к красоте текста.

Бенчмарк оценивает не отдельный ответ, а всю траекторию интерактивной истории
В логи попадают memory updates, planning, pacing interventions и story construction
Модели могут писать гладко, но проваливаться по robustness и user experience
Оценка делится по персонам и измерениям, а не по одному общему баллу

scirate.com

llm-agents narrative-eval

startuphub.ai12 мая 2026

GitHub Dungeons: репозиторий как процедурный roguelike

GitHub Dungeons превращает кодовую базу в терминальный roguelike-данж с уникальной картой для каждого репозитория. Карта генерируется процедурно через Binary Space Partitioning: пространство рекурсивно делится на комнаты, затем комнаты соединяются коридорами. Один и тот же commit даёт одну и ту же карту, а изменения в коде меняют структуру подземелья. Игрок перемещается по карте, сражается с «bugs», ищет выход и при смерти начинает заново из-за permadeath. Автор использовал GitHub Copilot CLI и команду /delegate, чтобы быстрее реализовывать игровые фичи вроде усложняющихся уровней и cheat codes. Главная идея для геймдизайна здесь не Copilot, а детерминированная генерация мира из стабильного seed, который меняется только при изменении источника данных.

BSP даёт структурные, читаемые и переигрываемые карты вместо хаотичного рандома
Детерминированный seed позволяет сохранять консистентность: один вход всегда даёт один результат
Изменение исходных данных может естественно менять карту или сценарий без ручной пересборки
AI-инструмент использовался как ускоритель реализации, а не как runtime Game Master

startuphub.ai

procedural-generation roguelike

startupheist.com13 мая 2026

Графовая память для NPC как слой долговременного лора

Статья описывает идею Discord-бота для roleplay-серверов, где главная ценность не в генерации реплик, а в долговременной памяти NPC. Автор предлагает хранить историю отношений, конфликтов, фракций и событий так, чтобы персонажи могли вспоминать действия игроков через недели и связывать их с текущими сценами. Ключевой технический тезис — обычного vector search недостаточно для ролевых миров, потому что он плохо фиксирует причинные и социальные связи. Вместо этого предлагается graph-aware memory: сущности, отношения, семантический поиск и provenance в одном слое. В качестве примеров названы Cognee и Zep Cloud, которые комбинируют графовую память, векторное извлечение и реляционное хранение источников. Для игрового проекта полезна сама архитектурная идея: NPC должен помнить не только факт, но и кто кому что сделал, при каких обстоятельствах и как это изменило отношение.

Память NPC становится продуктовой механикой, а не просто удобством для чата.
Граф лучше подходит для лора, отношений и последствий, чем чистый vector search.
Важно хранить provenance: откуда взялся факт и в каком событии он появился.
NPC должен вспоминать прошлые действия игрока через текущие цели, фракции и конфликты.
Для long-form roleplay ценность дает не объем памяти, а связность событий.

startupheist.com

npc-memory graph-memory

apkcombo.com10 мая 2026

AI Tales делает мобильную AI-RPG через текст, кубики и карты

AI Tales: Dungeon Story RPG позиционируется как мобильная AI-driven text RPG для Android с бесконечными фэнтези-приключениями. Игрок может вводить любые действия, диалоги и идеи, а AI Game Master продолжает историю в реальном времени. В описании выделены создание собственных миров, настройка NPC, беседы с персонажами и длинные приключения без фиксированного сценария. Для геймплея используются дополнительные механики: dice rolling, card flipping и context-aware options, чтобы разбавлять свободный текст структурированными выборами. Есть rewind для отката ошибок, free-to-play без рекламы и premium Game Master mode. Статья рекламная и не раскрывает архитектуру памяти, state management или способы борьбы с нарративным дрейфом.

Мобильная AI text RPG делает ставку на свободный ввод действий и AI Game Master.
Кубики и карты используются как простые процедурные механики поверх текста.
Rewind подается как обязательная UX-функция для исправления неудачных веток.
NPC-диалоги и world builder вынесены в явные пользовательские возможности.
Технических деталей про long-term consistency и JSON state в статье нет.

apkcombo.com

ai-game-master mobile-rpg

xix.ai11 мая 2026

v3RPG как пример AI Game Master с кубиками и пользовательскими сюжетами

v3RPG описан как AI-powered RPG, совмещающая настольную ролевую структуру с текстовым AI Game Master. Центральная роль отдана AI-мастеру Bob, который ведет приключение, реагирует на выбор игрока и помогает уточнять происходящее через чат. Игрок выбирает героя, совершает действия, влияет на сюжет и получает результаты через броски кубиков. Важная особенность — возможность создавать собственные сюжетные заготовки, которые затем могут проходить другие игроки. Также заявлен мультиплеер, где несколько игроков участвуют в одном приключении. Технических деталей про память, long-term consistency, state management или архитектуру LLM в статье почти нет.

AI Game Master подан как персонаж-ведущий, а не безличный генератор текста.
Кубики используются как явный слой неопределенности между действием игрока и исходом.
Пользовательские plot templates повышают replayability без полной генерации мира с нуля.
Мультиплеер упомянут как социальный слой, но без описания синхронизации состояния.
Статья маркетинговая: нет деталей про JSON state, память или контроль нарративного дрейфа.

xix.ai

ai-game-master text-rpg

github.blog12 мая 2026

Процедурная генерация roguelike через детерминированный seed

GitHub Blog описывает эксперимент GitHub Dungeons: терминальный roguelike, который генерирует подземелье на основе текущего репозитория. Карта строится процедурно через Binary Space Partitioning и сидируется latest commit SHA, поэтому один и тот же commit даёт стабильный layout, а изменения в коде меняют структуру подземелья. В статье подчёркнута связка replayability с детерминизмом: каждый запуск может отличаться, но результат воспроизводим при том же seed. Автор использовал GitHub Copilot CLI не только для генерации кода, но и для асинхронной команды /delegate, где coding agent сам делал PR с фичами вроде прогрессии сложности. Для нашего проекта ценна не сама терминальная игра, а принцип: сценарий должен быть процедурным, но привязанным к явному seed и сохранённому state, чтобы LLM не «переизобретала» мир на длинной партии.

BSP используется как простая схема генерации комнат и коридоров с контролируемой структурой.
Latest commit SHA выступает seed: одинаковый вход даёт одинаковую карту.
Replayability строится на изменяемом, но воспроизводимом генераторе контента.
Copilot CLI /delegate показан как способ отдавать отдельные игровые фичи агенту и ревьюить результат через PR.

github.blog

procedural-generation roguelike

dev.to12 мая 2026

Двухпроходный AI Game Master с жёсткими правилами

Автор описывает TaleWeaver — self-hosted RPG-движок, где LLM не ведёт механику напрямую, а разделена на два прохода. Первый проход работает как Rule Engine: проверяет действие игрока по текущему состоянию, делает скрытые D20-броски, валидирует инвентарь, считает урон и выдаёт строгий JSON GameEvent для изменения базы. Второй проход получает уже зафиксированный результат и превращает его в атмосферный ответ Game Master. Такой подход решает проблему LLM Amnesia: состояние, HP, инвентарь и перемещения NPC не доверяются свободному тексту модели. Стек проекта — FastAPI, SQLite, Vue.js, Docker, LiteLLM, BYOK, экспериментальная поддержка Ollama. Отдельно упомянуты live graph map через Rough.js и TTS через Gemini 3.1 Flash TTS / ElevenLabs.

Механику и нарратив стоит разделять на разные проходы модели.
Состояние меняется только через строгий JSON GameEvent, а не через прозу.
Rule Engine сначала фиксирует факты: HP, инвентарь, NPC, лут, переходы.
Narrator получает готовый outcome и не решает игровые правила сам.
Локальные модели хуже держат сложный nested JSON, поэтому нужен жёсткий валидатор.

dev.to

ai-gamemaster rule-engine