Как голосовой AI-агент в n8n заменил 80 часов ручной работы в ремонтной мастерской
Владелец ремонтной мастерской собрал в n8n систему из роутера и четырёх подагентов, которая обрабатывает 90% обращений через WhatsApp и голос. Продал бизнес — покупатель без технических знаний продолжил работать с этой системой.
80 часов в месяц. Столько владелец ремонтной мастерской с 16-летним стажем тратил на ответы в WhatsApp и звонки. Одни и те же вопросы: «Сколько стоит замена экрана?», «Когда забирать?», «Есть ли деталь на складе?»
Он собрал AI-агента в n8n. Система работает в production больше года, обрабатывает 90% обращений без участия человека. Стоимость — менее €200/мес. А потом он продал бизнес, и покупатель без единого дня технического опыта продолжил работать с этой системой как ни в чём не бывало.
Разберём архитектуру.
Проблема: один человек на все каналы
Типичная ремонтная мастерская — это WhatsApp как основной канал связи, входящие звонки и десятки одинаковых вопросов в день. Клиенту нужно быстро: узнать цену, записаться, проверить статус.
Владелец тратил 80+ часов в месяц — это две полные рабочие недели — просто на переписку и звонки. Не на ремонт, не на развитие бизнеса. На рутину.
Решение: multi-agent роутер в n8n
Архитектура построена на принципе специализации. Вместо одного гигантского промпта — роутер и четыре узких подагента, каждый делает одно дело хорошо.
Роутер
Точка входа. Получает сообщение (текст из WhatsApp или транскрибированный голос), классифицирует намерение и передаёт нужному подагенту. Критически важная деталь: на роутере включён «think tool» — агент рассуждает перед выбором цепочки инструментов. По словам автора, это сократило ошибки маршрутизации примерно вдвое.
Подагент 1: Запись на визит
Проверяет реальное расписание, предлагает свободный слот, подтверждает запись. Использует дешёвую и быструю модель — для парсинга «в следующий вторник в 15:00» GPT-4 не нужен.
Подагент 2: Цены и расценки
Ищет модель устройства и тип ремонта в базе данных, выдаёт точную цену. Здесь модель дороже — нужна аккуратность. Одна ошибка в цене стоит доверия клиента.
Подагент 3: Склад
Проверяет наличие запчастей в реальном времени. Если детали нет — автоматически размещает внутренний заказ. Полный цикл от вопроса клиента до заказа поставщику без участия человека.
Подагент 4: Эскалация
Когда запрос не укладывается в стандартные сценарии, агент передаёт разговор человеку. Ключевое: передаёт с полным контекстом переписки, а не просто «клиент хочет поговорить».
Голосовой канал: Whisper + ElevenLabs
Звонки обрабатываются через тот же pipeline. Голос транскрибируется (Whisper), передаётся роутеру, ответ озвучивается через ElevenLabs. Подагенты не знают, пришёл запрос текстом или голосом — одна логика, разные точки входа.
Это правильный архитектурный выбор. Дублирование логики для голоса и текста — ловушка, в которую попадают многие.
Airtable как единый источник данных
Все данные — цены, расписание, наличие на складе — живут в Airtable. Каждый подагент обращается туда напрямую. Нет отдельных баз, нет синхронизации, нет рассинхрона.
Airtable как backend для малого бизнеса — решение спорное в теории, но рабочее на практике. Для мастерской с одной точкой это ровно тот уровень сложности, который нужен.
Три инженерных приёма, которые стоит украсть
1. Разные модели для разных агентов
Booking-агент работает на дешёвой быстрой модели. Quote-агент — на мощной и точной. Это прямое следствие специализации: когда каждый агент делает одно дело, вы точно знаете, какая модель ему нужна. У монолитного агента такой роскоши нет.
2. Псевдо-стриминг в WhatsApp
Вместо одного длинного сообщения ответ разбивается на предложения и отправляется последовательно. Клиент видит индикатор набора текста и ощущает живое общение. Технически примитивно, по восприятию — разница колоссальная.
3. Think tool на роутере
Принудительное рассуждение перед маршрутизацией. Агент не просто классифицирует — он объясняет себе, почему выбирает именно этот подагент. Сокращение ошибок в два раза — серьёзный результат для одной строчки в промпте.
Метрики за 12+ месяцев в production
- ~90% обращений обработаны без участия человека
- ~80 часов/мес высвобождено
- < €200/мес стоимость работы системы
- 0 дней простоя после продажи бизнеса
Последний пункт — самый важный. Покупатель не разбирается в технологиях. Система работает автономно уже после смены владельца. Это настоящий тест на прочность архитектуры.
Чему это учит
Первое: «тупые» решения часто важнее «умных». Выбор модели, формат отправки сообщений, структура данных — эти решения дали больше, чем любой промпт-инжиниринг.
Второе: multi-agent архитектура работает не потому, что это модно. Она работает потому, что позволяет каждому агенту быть простым. Простой агент — предсказуемый агент. Предсказуемый агент — надёжный агент.
Третье: если систему нельзя передать человеку без технического фона — она не готова к production. Настоящая автоматизация не требует постоянного присмотра инженера.
Что автор сделал бы иначе сегодня
Два изменения. Роутер — на Claude вместо GPT: лучше работает со structured tool calling. И observability с первого дня: логи выполнения n8n недостаточны для production-диагностики.
Оба замечания точные. Observability — это то, что все откладывают и все потом жалеют.
Итог
Ремонтная мастерская. Один человек. n8n, WhatsApp webhook, четыре подагента, Airtable. 90% автоматизация за €200/мес. Система пережила продажу бизнеса.
Это не история про AI-хайп. Это история про то, что multi-agent архитектура в 2026 году — зрелый инструмент для малого бизнеса. Если вы всё ещё отвечаете на одинаковые сообщения руками — пора задуматься.
Исходный пост и open-source воркфлоу: https://reddit.com/r/n8n/comments/1sc3i30/i_built_a_whatsapp_voice_ai_agent_in_n8n_that/