Инструкции

Как голосовой AI-агент в n8n заменил 80 часов ручной работы в ремонтной мастерской

Владелец ремонтной мастерской собрал в n8n систему из роутера и четырёх подагентов, которая обрабатывает 90% обращений через WhatsApp и голос. Продал бизнес — покупатель без технических знаний продолжил работать с этой системой.

6 апреля 2026 г.
5 мин чтения
n8nAI-агентыWhatsAppголосовой ИИавтоматизациямультиагентные системыElevenLabsWhisperAirtable

80 часов в месяц. Столько владелец ремонтной мастерской с 16-летним стажем тратил на ответы в WhatsApp и звонки. Одни и те же вопросы: «Сколько стоит замена экрана?», «Когда забирать?», «Есть ли деталь на складе?»

Он собрал AI-агента в n8n. Система работает в production больше года, обрабатывает 90% обращений без участия человека. Стоимость — менее €200/мес. А потом он продал бизнес, и покупатель без единого дня технического опыта продолжил работать с этой системой как ни в чём не бывало.

Разберём архитектуру.

Проблема: один человек на все каналы

Типичная ремонтная мастерская — это WhatsApp как основной канал связи, входящие звонки и десятки одинаковых вопросов в день. Клиенту нужно быстро: узнать цену, записаться, проверить статус.

Владелец тратил 80+ часов в месяц — это две полные рабочие недели — просто на переписку и звонки. Не на ремонт, не на развитие бизнеса. На рутину.

Решение: multi-agent роутер в n8n

Архитектура построена на принципе специализации. Вместо одного гигантского промпта — роутер и четыре узких подагента, каждый делает одно дело хорошо.

Роутер

Точка входа. Получает сообщение (текст из WhatsApp или транскрибированный голос), классифицирует намерение и передаёт нужному подагенту. Критически важная деталь: на роутере включён «think tool» — агент рассуждает перед выбором цепочки инструментов. По словам автора, это сократило ошибки маршрутизации примерно вдвое.

Подагент 1: Запись на визит

Проверяет реальное расписание, предлагает свободный слот, подтверждает запись. Использует дешёвую и быструю модель — для парсинга «в следующий вторник в 15:00» GPT-4 не нужен.

Подагент 2: Цены и расценки

Ищет модель устройства и тип ремонта в базе данных, выдаёт точную цену. Здесь модель дороже — нужна аккуратность. Одна ошибка в цене стоит доверия клиента.

Подагент 3: Склад

Проверяет наличие запчастей в реальном времени. Если детали нет — автоматически размещает внутренний заказ. Полный цикл от вопроса клиента до заказа поставщику без участия человека.

Подагент 4: Эскалация

Когда запрос не укладывается в стандартные сценарии, агент передаёт разговор человеку. Ключевое: передаёт с полным контекстом переписки, а не просто «клиент хочет поговорить».

Голосовой канал: Whisper + ElevenLabs

Звонки обрабатываются через тот же pipeline. Голос транскрибируется (Whisper), передаётся роутеру, ответ озвучивается через ElevenLabs. Подагенты не знают, пришёл запрос текстом или голосом — одна логика, разные точки входа.

Это правильный архитектурный выбор. Дублирование логики для голоса и текста — ловушка, в которую попадают многие.

Airtable как единый источник данных

Все данные — цены, расписание, наличие на складе — живут в Airtable. Каждый подагент обращается туда напрямую. Нет отдельных баз, нет синхронизации, нет рассинхрона.

Airtable как backend для малого бизнеса — решение спорное в теории, но рабочее на практике. Для мастерской с одной точкой это ровно тот уровень сложности, который нужен.

Три инженерных приёма, которые стоит украсть

1. Разные модели для разных агентов

Booking-агент работает на дешёвой быстрой модели. Quote-агент — на мощной и точной. Это прямое следствие специализации: когда каждый агент делает одно дело, вы точно знаете, какая модель ему нужна. У монолитного агента такой роскоши нет.

2. Псевдо-стриминг в WhatsApp

Вместо одного длинного сообщения ответ разбивается на предложения и отправляется последовательно. Клиент видит индикатор набора текста и ощущает живое общение. Технически примитивно, по восприятию — разница колоссальная.

3. Think tool на роутере

Принудительное рассуждение перед маршрутизацией. Агент не просто классифицирует — он объясняет себе, почему выбирает именно этот подагент. Сокращение ошибок в два раза — серьёзный результат для одной строчки в промпте.

Метрики за 12+ месяцев в production

  • ~90% обращений обработаны без участия человека
  • ~80 часов/мес высвобождено
  • < €200/мес стоимость работы системы
  • 0 дней простоя после продажи бизнеса

Последний пункт — самый важный. Покупатель не разбирается в технологиях. Система работает автономно уже после смены владельца. Это настоящий тест на прочность архитектуры.

Чему это учит

Первое: «тупые» решения часто важнее «умных». Выбор модели, формат отправки сообщений, структура данных — эти решения дали больше, чем любой промпт-инжиниринг.

Второе: multi-agent архитектура работает не потому, что это модно. Она работает потому, что позволяет каждому агенту быть простым. Простой агент — предсказуемый агент. Предсказуемый агент — надёжный агент.

Третье: если систему нельзя передать человеку без технического фона — она не готова к production. Настоящая автоматизация не требует постоянного присмотра инженера.

Что автор сделал бы иначе сегодня

Два изменения. Роутер — на Claude вместо GPT: лучше работает со structured tool calling. И observability с первого дня: логи выполнения n8n недостаточны для production-диагностики.

Оба замечания точные. Observability — это то, что все откладывают и все потом жалеют.

Итог

Ремонтная мастерская. Один человек. n8n, WhatsApp webhook, четыре подагента, Airtable. 90% автоматизация за €200/мес. Система пережила продажу бизнеса.

Это не история про AI-хайп. Это история про то, что multi-agent архитектура в 2026 году — зрелый инструмент для малого бизнеса. Если вы всё ещё отвечаете на одинаковые сообщения руками — пора задуматься.

Исходный пост и open-source воркфлоу: https://reddit.com/r/n8n/comments/1sc3i30/i_built_a_whatsapp_voice_ai_agent_in_n8n_that/

Автор: Алик Завалишев

Эксперт по ИИ и автоматизации процессов

Больше статей