MiroThinker 1.7: как запустить свой deep research агент и забыть про Perplexity

Зачем вообще запускать research-агента локально

Deep research — одна из самых востребованных функций современных AI-продуктов. Perplexity Pro, ChatGPT Deep Research, Claude Research — все они делают одно: принимают сложный вопрос, декомпозируют его, обходят десятки источников и собирают структурированный ответ с цитатами.

Проблема в том, что каждый ваш исследовательский запрос уходит на чужие серверы. Если вы занимаетесь конкурентным анализом, патентным поиском или работаете с чувствительными данными — это не абстрактный риск, а конкретная утечка контекста. Ваши запросы сами по себе — ценная информация.

MiroThinker 1.7 — open source агент от MiroMind AI, который решает эту задачу локально. Модель крутится на вашем железе, данные не покидают машину, а каждый шаг рассуждения прозрачен и проверяем.

Что такое MiroThinker и как он работает

MiroThinker — это не просто LLM с поиском. Это полноценный research-агент с многошаговым reasoning-циклом:

Декомпозиция запроса. Агент разбивает сложный вопрос на подзадачи.
Веб-поиск. Для каждой подзадачи формируются поисковые запросы через Google Search API.
Скрейпинг и извлечение. Найденные страницы обрабатываются через Jina — извлекается релевантный контент.
Многоуровневый анализ. Модель сопоставляет информацию из разных источников, выстраивает цепочку рассуждений.
Синтез ответа. Финальный ответ с указанием источников и логики вывода.

Ключевое отличие от RAG-пайплайнов: MiroThinker не просто ищет и вставляет фрагменты. Он рассуждает над найденным, может вернуться к поиску, если первые результаты недостаточны, и объясняет, почему сделал конкретный вывод.

Две версии модели

MiroThinker 1.7 — полноразмерная модель на базе Qwen3 MoE. Требует серьёзного GPU.

MiroThinker 1.7 mini — 3B активных параметров. Работает на потребительском железе, включая одну RTX 4090.

Бенчмарки: почему это не игрушка

BrowseComp (бенчмарк для browsing-агентов)

MiroThinker H1 (облако) — 88.2. MiroThinker 1.7 — 74.0. MiroThinker 1.7 mini — 67.9. Claude 4.5 Opus — 67.8. GPT-5 — 54.9.

GAIA (бенчмарк general AI assistant)

MiroThinker H1 — 88.5. MiroThinker 1.7 mini — 80.3. GPT-5 — 76.4.

Mini-модель с 3B активных параметров обходит GPT-5 на GAIA. Полноразмерная версия на BrowseComp обгоняет Claude 4.5 Opus. Это не маргинальная разница — это системное превосходство в задачах многошагового поиска и синтеза.

Что изменилось в версии 1.7

«Effective interaction scaling»: на 43% меньше раундов взаимодействия для решения задачи и на 17% лучше качество результатов. Меньше шагов = меньше времени GPU = ниже счёт за электричество при self-hosting.

Как развернуть: пошаговый план

Требования к железу

Mini-модель: одна RTX 4090 (24 GB VRAM). Подойдёт RTX 3090 с оговорками по скорости.
Полная модель: multi-GPU setup, минимум 2× A100 или эквивалент.

Шаг 1: Скачать веса модели

Через huggingface-cli: huggingface-cli download miromind-ai/MiroThinker-1.7-mini --local-dir ./mirothinker-mini

Шаг 2: Развернуть inference-сервер

Установите vLLM и запустите: vllm serve miromind-ai/MiroThinker-1.7-mini --port 8000

Шаг 3: Настроить агентный фреймворк

Клонируйте репозиторий с GitHub: git clone https://github.com/MiroMindAI/MiroThinker.git. Скопируйте config.example.yaml в config.yaml, укажите endpoint модели, ключи Google Search API и Jina.

Шаг 4: Запустить

python run_agent.py --config config.yaml --query "Ваш исследовательский вопрос"

Честные ограничения

Не полностью air-gapped. Модель работает локально, но поиск идёт через Google Search API, а скрейпинг — через Jina. Ваши поисковые запросы уходят наружу. Для полной изоляции — не тот инструмент.

Настройка не тривиальна. Нет единого docker-compose up. Нужно собрать три компонента: inference-сервер, инструменты (search + scraping), агентный фреймворк.

Флагманская версия H1 — только облако. Open source релиз — это 1.7 и 1.7 mini. Они сильные, но без verification layer.

Скорость. Research-запросы по определению медленные: несколько поисков, скрейпинг страниц, рассуждение. На RTX 4090 — приемлемо, но не мгновенно.

Когда MiroThinker — правильный выбор

Вы работаете с конфиденциальными исследовательскими запросами
Вас раздражают rate limits Perplexity Pro в момент дедлайна
Вам важно видеть полную цепочку рассуждений, а не только финальный ответ
У вас есть RTX 4090 или аналогичная карта

Когда оставаться на облаке

Вам нужен мобильный доступ из любой точки
Нет подходящего GPU
Скорость ответа критичнее приватности
Не хотите тратить время на настройку

Итог

MiroThinker 1.7 — первый open source deep research агент, который на бенчмарках бьёт GPT-5 и стоит рядом с Claude 4.5 Opus. Mini-версия на 3B активных параметров запускается на одной потребительской видеокарте.

Подписка на Perplexity Pro — $240 в год. RTX 4090 у вас, скорее всего, уже есть. Считайте сами.