К содержимому
Завалищев
База знаний
Инструменты 5 мин чтения

MiroThinker 1.7: как запустить свой deep research агент и забыть про Perplexity

Open source агент MiroThinker 1.7 обходит веб-страницы, выполняет многоуровневый анализ и объясняет источники — и всё это работает локально на одной видеокарте. Разбираю, стоит ли менять подписку на Perplexity Pro на свой инстанс.

Зачем вообще запускать research-агента локально

Deep research — одна из самых востребованных функций современных AI-продуктов. Perplexity Pro, ChatGPT Deep Research, Claude Research — все они делают одно: принимают сложный вопрос, декомпозируют его, обходят десятки источников и собирают структурированный ответ с цитатами.

Проблема в том, что каждый ваш исследовательский запрос уходит на чужие серверы. Если вы занимаетесь конкурентным анализом, патентным поиском или работаете с чувствительными данными — это не абстрактный риск, а конкретная утечка контекста. Ваши запросы сами по себе — ценная информация.

MiroThinker 1.7 — open source агент от MiroMind AI, который решает эту задачу локально. Модель крутится на вашем железе, данные не покидают машину, а каждый шаг рассуждения прозрачен и проверяем.

Что такое MiroThinker и как он работает

MiroThinker — это не просто LLM с поиском. Это полноценный research-агент с многошаговым reasoning-циклом:

  • Декомпозиция запроса. Агент разбивает сложный вопрос на подзадачи.
  • Веб-поиск. Для каждой подзадачи формируются поисковые запросы через Google Search API.
  • Скрейпинг и извлечение. Найденные страницы обрабатываются через Jina — извлекается релевантный контент.
  • Многоуровневый анализ. Модель сопоставляет информацию из разных источников, выстраивает цепочку рассуждений.
  • Синтез ответа. Финальный ответ с указанием источников и логики вывода.

Ключевое отличие от RAG-пайплайнов: MiroThinker не просто ищет и вставляет фрагменты. Он рассуждает над найденным, может вернуться к поиску, если первые результаты недостаточны, и объясняет, почему сделал конкретный вывод.

Две версии модели

MiroThinker 1.7 — полноразмерная модель на базе Qwen3 MoE. Требует серьёзного GPU.

MiroThinker 1.7 mini — 3B активных параметров. Работает на потребительском железе, включая одну RTX 4090.

Бенчмарки: почему это не игрушка

BrowseComp (бенчмарк для browsing-агентов)

MiroThinker H1 (облако) — 88.2. MiroThinker 1.7 — 74.0. MiroThinker 1.7 mini — 67.9. Claude 4.5 Opus — 67.8. GPT-5 — 54.9.

GAIA (бенчмарк general AI assistant)

MiroThinker H1 — 88.5. MiroThinker 1.7 mini — 80.3. GPT-5 — 76.4.

Mini-модель с 3B активных параметров обходит GPT-5 на GAIA. Полноразмерная версия на BrowseComp обгоняет Claude 4.5 Opus. Это не маргинальная разница — это системное превосходство в задачах многошагового поиска и синтеза.

Что изменилось в версии 1.7

«Effective interaction scaling»: на 43% меньше раундов взаимодействия для решения задачи и на 17% лучше качество результатов. Меньше шагов = меньше времени GPU = ниже счёт за электричество при self-hosting.

Как развернуть: пошаговый план

Требования к железу

  • Mini-модель: одна RTX 4090 (24 GB VRAM). Подойдёт RTX 3090 с оговорками по скорости.
  • Полная модель: multi-GPU setup, минимум 2× A100 или эквивалент.

Шаг 1: Скачать веса модели

Через huggingface-cli: huggingface-cli download miromind-ai/MiroThinker-1.7-mini --local-dir ./mirothinker-mini

Шаг 2: Развернуть inference-сервер

Установите vLLM и запустите: vllm serve miromind-ai/MiroThinker-1.7-mini --port 8000

Шаг 3: Настроить агентный фреймворк

Клонируйте репозиторий с GitHub: git clone https://github.com/MiroMindAI/MiroThinker.git. Скопируйте config.example.yaml в config.yaml, укажите endpoint модели, ключи Google Search API и Jina.

Шаг 4: Запустить

python run_agent.py --config config.yaml --query "Ваш исследовательский вопрос"

Честные ограничения

Не полностью air-gapped. Модель работает локально, но поиск идёт через Google Search API, а скрейпинг — через Jina. Ваши поисковые запросы уходят наружу. Для полной изоляции — не тот инструмент.

Настройка не тривиальна. Нет единого docker-compose up. Нужно собрать три компонента: inference-сервер, инструменты (search + scraping), агентный фреймворк.

Флагманская версия H1 — только облако. Open source релиз — это 1.7 и 1.7 mini. Они сильные, но без verification layer.

Скорость. Research-запросы по определению медленные: несколько поисков, скрейпинг страниц, рассуждение. На RTX 4090 — приемлемо, но не мгновенно.

Когда MiroThinker — правильный выбор

  • Вы работаете с конфиденциальными исследовательскими запросами
  • Вас раздражают rate limits Perplexity Pro в момент дедлайна
  • Вам важно видеть полную цепочку рассуждений, а не только финальный ответ
  • У вас есть RTX 4090 или аналогичная карта

Когда оставаться на облаке

  • Вам нужен мобильный доступ из любой точки
  • Нет подходящего GPU
  • Скорость ответа критичнее приватности
  • Не хотите тратить время на настройку

Итог

MiroThinker 1.7 — первый open source deep research агент, который на бенчмарках бьёт GPT-5 и стоит рядом с Claude 4.5 Opus. Mini-версия на 3B активных параметров запускается на одной потребительской видеокарте.

Подписка на Perplexity Pro — $240 в год. RTX 4090 у вас, скорее всего, уже есть. Считайте сами.