Самообучающийся AI-агент: трёхуровневая память, самооценка и генерация инструментов на лету

Почему стандартные чат-боты забывают всё после закрытия вкладки

Большинство AI-ассистентов работают в рамках одной сессии. Закрыл чат — контекст исчез. Даже те, что «помнят», обычно хранят плоский список фактов без структуры и приоритетов. Это работает для разовых вопросов, но разваливается, когда нужен агент, который адаптируется под конкретного пользователя и наращивает компетенции со временем.

Проект Odigos — open-source агент, который подходит к проблеме памяти архитектурно. Три отдельных слоя памяти, механизм самооценки после каждого ответа и способность генерировать новые инструменты из кода, который он пишет в процессе работы. Всё это на одном VPS, одном процессе, одной базе SQLite.

Три уровня памяти: от фактов до графа сущностей

Уровень 1: эксплицитная память

Первый слой — прямые факты, которые пользователь сообщает явно. «Я использую Python 3.12», «Мой продакшн-сервер на Hetzner», «Предпочитаю FastAPI, не Django». Агент сохраняет их как структурированные записи и применяет при генерации ответов.

Это базовый уровень, который есть у многих. Разница — в том, что здесь он не существует изолированно.

Уровень 2: профилирование через анализ диалогов

Второй слой работает в фоне. Агент анализирует историю разговоров и строит профиль пользователя: какие задачи решает чаще, какой уровень детализации предпочитает, какие технологии использует регулярно, на каком языке общается по каким темам.

Это не просто статистика. Профиль влияет на стиль, глубину и структуру ответов. После десятка разговоров агент понимает, нужно ли объяснять, что такое Docker Compose, или можно сразу давать готовый YAML.

Уровень 3: векторный поиск и граф сущностей

Третий слой — долгосрочная память на основе векторного поиска и графа сущностей. Эмбеддинги генерируются локально через nomic-embed-text на CPU, без внешних API-вызовов. Граф сущностей связывает людей, проекты, технологии и события в единую структуру.

Когда агент получает новый запрос, он ищет релевантные фрагменты во всех трёх слоях одновременно. Факт, что на прошлой неделе обсуждалась миграция с PostgreSQL на SQLite, может быть релевантен вопросу о выборе базы данных для нового проекта — даже если об этом явно не упомянули.

Самооценка и самосовершенствование

После каждого ответа агент запускает внутреннего оценщика (evaluator), который скорит качество взаимодействия. Была ли информация точной? Соответствовал ли уровень детализации профилю пользователя? Не было ли лишней воды?

В периоды простоя агент анализирует накопленные оценки, ищет паттерны деградации или роста, предлагает изменения в собственном поведении и маршрутизации запросов. Затем запускает ограниченные по времени эксперименты: применяет изменение, замеряет результат, продвигает успешные стратегии.

Фактически это замкнутый цикл улучшения без участия человека. Никакого ручного тюнинга промптов — агент сам находит, что работает лучше.

Генерация инструментов: от разового кода к переиспользуемой библиотеке

Когда агент пишет код для решения задачи — парсит CSV, генерирует отчёт, вызывает внешний API — он может сохранить этот код как переиспользуемый инструмент. При следующей похожей задаче инструмент уже доступен, вызывается без генерации нового кода.

Со временем у каждого пользователя формируется уникальная библиотека возможностей, заточенная под его рабочие процессы. Это принципиально отличается от фиксированного набора плагинов: инструменты растут вместе с задачами.

Из коробки агент поддерживает плагины для Google Workspace, браузерной автоматизации, Telegram, голосового ввода/вывода (Moonshine и Piper TTS — всё на CPU, без облачных сервисов).

Архитектурные решения

Один процесс, одна база. Никакого Redis, Kafka или очередей сообщений. SQLite + один процесс. Радикальное упрощение, которое работает для персонального агента. Не нужно администрировать кластер, чтобы получить умного ассистента.

Локальные эмбеддинги. Все операции с памятью — без API-вызовов. Nomic-embed-text работает на CPU. Это и про скорость (нет сетевых задержек на каждый поиск по памяти), и про приватность (ваши данные не уходят на чужой сервер).

Совместимость с OpenAI API. Для генерации подключается любой провайдер: облачные модели, локальный Ollama, что угодно. Модель памяти и модель генерации разделены.

MIT-лицензия. Полностью открытый код. Docker или установка на голое железо.

Что это меняет в подходе к AI-ассистентам

Odigos интересен не как очередной «ChatGPT у себя дома», а как демонстрация архитектурного подхода к трём фундаментальным проблемам:

Персистентная память — не костыль с файлом фактов, а многоуровневая система с профилированием и графом сущностей.
Автономное улучшение — замкнутый цикл оценки и оптимизации без участия пользователя.
Наращивание возможностей — агент создаёт себе инструменты, а не ждёт, пока разработчик напишет плагин.

Каждый из этих компонентов существует в отдельных проектах. Ценность Odigos — в том, что все три объединены в одном self-hosted решении, которое реально можно поднять за полчаса на минимальном VPS.

Ограничения и вопросы

Самомодификация поведения без контроля — палка о двух концах. Если оценщик настроен некорректно, агент может оптимизироваться в неправильном направлении. Прозрачность этих процессов — критически важная характеристика, которую стоит проверять при развёртывании.

Масштабирование имеет потолок. Один процесс с SQLite — элегантно для персонального использования, но если нужен агент на команду из 50 человек, архитектура потребует пересмотра.

Наконец, качество автоматически сгенерированных инструментов зависит от качества базовой модели. На слабой модели инструменты будут ломаться чаще, чем помогать.

Итог

Odigos — один из первых open-source проектов, где память, самооценка и генерация инструментов собраны в единую рабочую архитектуру на одном сервере. Это не замена коммерческим ассистентам для enterprise-задач, но это серьёзная заявка на то, как должен быть устроен персональный AI-агент: помнит, учится, наращивает возможности — и полностью под вашим контролем.