LLM Wiki Андрея Карпати: коротко о главном
Андрей Карпати предложил концепцию LLM Wiki: между пользователем и исходными документами создается постоянно обновляемая база знаний в формате Markdown — со ссылками, краткими выжимками и пометками о противоречиях. В этой статье — сжатый пересказ оригинальной заметки и объяснение того, как эта идея применима к корпоративным базам знаний.
В чём отличие от «обычного RAG»

В типичном сценарии RAG вы загружаете файлы, система разбивает их на фрагменты и при каждом запросе ищет подходящие отрывки. Ответ генерируется заново, а знания не накапливаются. Подход LLM Wiki предполагает, что модель постепенно формирует постоянную вики — набор связанных Markdown-страниц, выступающих прослойкой между пользователем и исходниками. Каждый новый документ не просто добавляется в индекс, а глубоко анализируется: модель выделяет ключевые сущности, обновляет сводки, актуализирует перекрёстные ссылки и отмечает противоречия с уже известными фактами.
Ключевая мысль оригинала
Вики — это не побочный артефакт чата, а самостоятельный накапливаемый слой знаний. В нём уже проставлены связи, сводки отражают всю прочитанную информацию, а база обогащается с каждым новым источником и ответом на вопрос.
Три слоя архитектуры
В оригинальной концепции выделяются три уровня. Их можно сопоставить с архитектурой WikiAgent, где поведение системы задаётся через файл AGENTS.md в корне рабочей папки, а сами знания хранятся в Git-репозиториях.
- Исходные источники — ваши оригинальные материалы. В классическом подходе они остаются неизменными и служат опорой для проверки фактов.
- Вики — каталог страниц, которые создаёт и обновляет LLM: оглавления, карточки сущностей и тематические сводки.
- Схема — главный документ, фиксирующий правила структуры вики, стиль оформления, алгоритм загрузки источников и формат ответов. В экосистеме AI-агентов его обычно называют AGENTS.md или CLAUDE.md.
Три режима работы: загрузка, запрос, проверка
Карпати выделяет три циклических режима работы. На практике их удобно зафиксировать как регламент в AGENTS.md, чтобы разные сессии AI-агента действовали согласованно.
- Загрузка (Ingest) — при добавлении нового источника модель читает его, сверяет факты, обновляет страницы вики, оглавление и, при необходимости, журнал изменений.
- Запрос (Query) — при ответе на вопрос пользователя модель находит релевантные страницы, анализирует их и выдаёт ответ со ссылками на источники. Наиболее удачные и полные ответы полезно сохранять как новые страницы вики, а не оставлять исключительно в истории чата.
- Проверка (Lint) — периодический аудит базы знаний. Модель ищет противоречия между страницами, выявляет устаревшие данные, находит страницы без входящих ссылок и обнаруживает пробелы в темах.
Роль index.md и log.md
Для удобной навигации по растущей базе знаний Карпати рекомендует использовать два служебных файла.
- index.md — корневой каталог: содержит ссылки на страницы, краткие описания и метаданные. При поиске ответа модель сначала обращается к индексу, а затем углубляется в нужные разделы. На небольших объёмах данных это позволяет обойтись без сложной векторной инфраструктуры.
- log.md — журнал изменений: фиксирует загруженные источники, внесённые правки и даты проверок. Служит наглядной хронологией развития базы знаний.
Границы применимости и связь с WikiAgent
Оригинальная концепция намеренно абстрактна: оптимальную структуру папок и форматы страниц вы определяете вместе с нейросетью под специфику вашей предметной области. Однако в корпоративной среде к этому добавляются требования к правам доступа, аудиту, совместному редактированию и строгому разделению личных черновиков и общих репозиториев. Все эти задачи в WikiAgent решает связка: персональное рабочее пространство + Git-базы знаний + корпоративный файл AGENTS.md.
Первоисточник
Полный текст концепции на английском языке доступен в заметке Андрея Карпати «LLM Wiki» на GitHub Gist (llm-wiki.md). Прямая ссылка приведена в блоке материалов ниже.
Подробный разбор устройства файловой системы агента в Wikilect, а также принципы подключения репозиториев и навыков (SKILLS), читайте в отдельной статье нашего блога (см. блок «Читайте дальше»).
FAQ
Это замена RAG?
Это скорее смещение акцента. Вместо классического «поиска по фрагментам» формируется постоянно актуализируемый слой структурированных знаний. При больших объёмах данных по-прежнему может требоваться полноценный векторный поиск и строгий контроль качества — эти подходы разумно комбинировать.
Кто пишет страницы вики?
В подходе Карпати основную работу по созданию и актуализации страниц выполняет языковая модель. Роль человека сводится к курированию источников, формулированию запросов и фиксации правил в схеме.
Нужна база знаний под AI в компании?
Поможем спроектировать хранение в Git, правила в AGENTS.md и безопасный доступ сотрудников через WikiAgent.
Читайте дальше
Выберите смежное решение Wikilect, чтобы сравнить сценарии внедрения и подобрать подходящий формат AI-автоматизации.