Weekly AI Digest
Последний выпуск · 21 мая 2026
Готово · 21 мая 2026
Codex
Архивный выпуск 17 мая 2026 К свежему выпуску
AI weekly · неделя 20/2026

Свежий срез по 6 проектам
и SaaS-идеям

Курируется автоматически каждое воскресенье. Каждая карточка — статья за неделю, отфильтрованная под конкретный раздел и переведённая на русский.

Следующий запуск
24 мая 2026, 10:00
UI и мобильный UX Геймплей и системы
Цель раздела
Внешние источники по геймдизайну **для AI-driven текстовой survival horror RPG** (LLM как Game Master): survival horror механики (RE-style), системы wounds/infection/fatigue, стелс и паника, ресурсный голод, replayability через сценарии, **как удерживать LLM-нарратив консистентным на длинной партии** (300-800 ходов), как state в JSON синхронизируется с свободным текстом модели. Что обсуждают: новые подходы к **AI-game-master** (one-shot context vs streaming state, RAG-память…
Скачать раздел .md
papers.cool11 мая 2026

Continual Harness для самоулучшающихся игровых агентов

Статья описывает Continual Harness — оболочку для foundation agents, которая позволяет агенту улучшать себя во время одного длинного прохождения без сброса эпизода. Авторы исходят из экспериментов Gemini Plays Pokemon, где агент проходил длинные игры Pokemon с памятью, инструментами, планированием и human-in-the-loop доработкой harness. Новый подход убирает человека из цикла: агент сам чередует действия в среде с рефакторингом собственного prompt, sub-agents, skills и memory на основе прошлых траекторий. В отличие от prompt-optimization методов, которым нужны повторные эпизоды и reset, Continual Harness адаптируется онлайн внутри одной непрерывной партии. На Pokemon Red и Emerald метод снижает стоимость в button-press относительно минимального baseline и частично догоняет hand-engineered expert harness. Также описан цикл process-reward co-learning, где rollout open-source агента переоценивается frontier teacher и используется для обновления модели без сброса окружения.

  • Ключевая идея — не просто хранить state, а позволять агенту менять prompt, skills и memory во время длинного run.
  • Метод ориентирован на long-horizon partial-observability задачи, где нельзя удобно перезапускать эпизод.
  • Прошлые trajectory data используются как материал для самоанализа и улучшения стратегии.
  • Для игрового агента важна разница между минимальным raw interface и expert harness с доменными подсказками.
  • Process-reward teacher loop можно отделить от основного gameplay loop и применять как post-run улучшение.
scirate.com12 мая 2026

NARRA-Gym: бенчмарк для интерактивных нарративных агентов

NARRA-Gym предлагает исполняемую среду оценки для LLM-агентов, которые ведут интерактивную историю на много ходов. В отличие от статических промптов и разовых генераций, бенчмарк логирует полный цикл: построение сюжета, обновления памяти, планирование, темп повествования и опциональные артефакты. Авторы стартуют со sparse emotional seed и проверяют, может ли модель развернуть его в полноценный адаптивный эпизод. В работе сравниваются девять frontier LLM на восьми benchmark personas через LLM-as-judge и human evaluation. Главный вывод: хорошая литературная плавность не гарантирует устойчивость, хороший UX, персонализацию и сохранение границ персонажа. Для long-horizon AI Game Master это полезно как внешний пример того, какие оси качества стоит мерить отдельно, а не сводить всё к красоте текста.

  • Бенчмарк оценивает не отдельный ответ, а всю траекторию интерактивной истории
  • В логи попадают memory updates, planning, pacing interventions и story construction
  • Модели могут писать гладко, но проваливаться по robustness и user experience
  • Оценка делится по персонам и измерениям, а не по одному общему баллу
startuphub.ai12 мая 2026

GitHub Dungeons: репозиторий как процедурный roguelike

GitHub Dungeons превращает кодовую базу в терминальный roguelike-данж с уникальной картой для каждого репозитория. Карта генерируется процедурно через Binary Space Partitioning: пространство рекурсивно делится на комнаты, затем комнаты соединяются коридорами. Один и тот же commit даёт одну и ту же карту, а изменения в коде меняют структуру подземелья. Игрок перемещается по карте, сражается с «bugs», ищет выход и при смерти начинает заново из-за permadeath. Автор использовал GitHub Copilot CLI и команду /delegate, чтобы быстрее реализовывать игровые фичи вроде усложняющихся уровней и cheat codes. Главная идея для геймдизайна здесь не Copilot, а детерминированная генерация мира из стабильного seed, который меняется только при изменении источника данных.

  • BSP даёт структурные, читаемые и переигрываемые карты вместо хаотичного рандома
  • Детерминированный seed позволяет сохранять консистентность: один вход всегда даёт один результат
  • Изменение исходных данных может естественно менять карту или сценарий без ручной пересборки
  • AI-инструмент использовался как ускоритель реализации, а не как runtime Game Master
startupheist.com13 мая 2026

Графовая память для NPC как слой долговременного лора

Статья описывает идею Discord-бота для roleplay-серверов, где главная ценность не в генерации реплик, а в долговременной памяти NPC. Автор предлагает хранить историю отношений, конфликтов, фракций и событий так, чтобы персонажи могли вспоминать действия игроков через недели и связывать их с текущими сценами. Ключевой технический тезис — обычного vector search недостаточно для ролевых миров, потому что он плохо фиксирует причинные и социальные связи. Вместо этого предлагается graph-aware memory: сущности, отношения, семантический поиск и provenance в одном слое. В качестве примеров названы Cognee и Zep Cloud, которые комбинируют графовую память, векторное извлечение и реляционное хранение источников. Для игрового проекта полезна сама архитектурная идея: NPC должен помнить не только факт, но и кто кому что сделал, при каких обстоятельствах и как это изменило отношение.

  • Память NPC становится продуктовой механикой, а не просто удобством для чата.
  • Граф лучше подходит для лора, отношений и последствий, чем чистый vector search.
  • Важно хранить provenance: откуда взялся факт и в каком событии он появился.
  • NPC должен вспоминать прошлые действия игрока через текущие цели, фракции и конфликты.
  • Для long-form roleplay ценность дает не объем памяти, а связность событий.
apkcombo.com10 мая 2026

AI Tales делает мобильную AI-RPG через текст, кубики и карты

AI Tales: Dungeon Story RPG позиционируется как мобильная AI-driven text RPG для Android с бесконечными фэнтези-приключениями. Игрок может вводить любые действия, диалоги и идеи, а AI Game Master продолжает историю в реальном времени. В описании выделены создание собственных миров, настройка NPC, беседы с персонажами и длинные приключения без фиксированного сценария. Для геймплея используются дополнительные механики: dice rolling, card flipping и context-aware options, чтобы разбавлять свободный текст структурированными выборами. Есть rewind для отката ошибок, free-to-play без рекламы и premium Game Master mode. Статья рекламная и не раскрывает архитектуру памяти, state management или способы борьбы с нарративным дрейфом.

  • Мобильная AI text RPG делает ставку на свободный ввод действий и AI Game Master.
  • Кубики и карты используются как простые процедурные механики поверх текста.
  • Rewind подается как обязательная UX-функция для исправления неудачных веток.
  • NPC-диалоги и world builder вынесены в явные пользовательские возможности.
  • Технических деталей про long-term consistency и JSON state в статье нет.
xix.ai11 мая 2026

v3RPG как пример AI Game Master с кубиками и пользовательскими сюжетами

v3RPG описан как AI-powered RPG, совмещающая настольную ролевую структуру с текстовым AI Game Master. Центральная роль отдана AI-мастеру Bob, который ведет приключение, реагирует на выбор игрока и помогает уточнять происходящее через чат. Игрок выбирает героя, совершает действия, влияет на сюжет и получает результаты через броски кубиков. Важная особенность — возможность создавать собственные сюжетные заготовки, которые затем могут проходить другие игроки. Также заявлен мультиплеер, где несколько игроков участвуют в одном приключении. Технических деталей про память, long-term consistency, state management или архитектуру LLM в статье почти нет.

  • AI Game Master подан как персонаж-ведущий, а не безличный генератор текста.
  • Кубики используются как явный слой неопределенности между действием игрока и исходом.
  • Пользовательские plot templates повышают replayability без полной генерации мира с нуля.
  • Мультиплеер упомянут как социальный слой, но без описания синхронизации состояния.
  • Статья маркетинговая: нет деталей про JSON state, память или контроль нарративного дрейфа.
github.blog12 мая 2026

Процедурная генерация roguelike через детерминированный seed

GitHub Blog описывает эксперимент GitHub Dungeons: терминальный roguelike, который генерирует подземелье на основе текущего репозитория. Карта строится процедурно через Binary Space Partitioning и сидируется latest commit SHA, поэтому один и тот же commit даёт стабильный layout, а изменения в коде меняют структуру подземелья. В статье подчёркнута связка replayability с детерминизмом: каждый запуск может отличаться, но результат воспроизводим при том же seed. Автор использовал GitHub Copilot CLI не только для генерации кода, но и для асинхронной команды /delegate, где coding agent сам делал PR с фичами вроде прогрессии сложности. Для нашего проекта ценна не сама терминальная игра, а принцип: сценарий должен быть процедурным, но привязанным к явному seed и сохранённому state, чтобы LLM не «переизобретала» мир на длинной партии.

  • BSP используется как простая схема генерации комнат и коридоров с контролируемой структурой.
  • Latest commit SHA выступает seed: одинаковый вход даёт одинаковую карту.
  • Replayability строится на изменяемом, но воспроизводимом генераторе контента.
  • Copilot CLI /delegate показан как способ отдавать отдельные игровые фичи агенту и ревьюить результат через PR.
dev.to12 мая 2026

Двухпроходный AI Game Master с жёсткими правилами

Автор описывает TaleWeaver — self-hosted RPG-движок, где LLM не ведёт механику напрямую, а разделена на два прохода. Первый проход работает как Rule Engine: проверяет действие игрока по текущему состоянию, делает скрытые D20-броски, валидирует инвентарь, считает урон и выдаёт строгий JSON GameEvent для изменения базы. Второй проход получает уже зафиксированный результат и превращает его в атмосферный ответ Game Master. Такой подход решает проблему LLM Amnesia: состояние, HP, инвентарь и перемещения NPC не доверяются свободному тексту модели. Стек проекта — FastAPI, SQLite, Vue.js, Docker, LiteLLM, BYOK, экспериментальная поддержка Ollama. Отдельно упомянуты live graph map через Rough.js и TTS через Gemini 3.1 Flash TTS / ElevenLabs.

  • Механику и нарратив стоит разделять на разные проходы модели.
  • Состояние меняется только через строгий JSON GameEvent, а не через прозу.
  • Rule Engine сначала фиксирует факты: HP, инвентарь, NPC, лут, переходы.
  • Narrator получает готовый outcome и не решает игровые правила сам.
  • Локальные модели хуже держат сложный nested JSON, поэтому нужен жёсткий валидатор.