MiroThinker 1.7: как запустить свой deep research агент и забыть про Perplexity
Open source агент MiroThinker 1.7 обходит веб-страницы, выполняет многоуровневый анализ и объясняет источники — и всё это работает локально на одной видеокарте. Разбираю, стоит ли менять подписку на Perplexity Pro на свой инстанс.
Зачем вообще запускать research-агента локально
Deep research — одна из самых востребованных функций современных AI-продуктов. Perplexity Pro, ChatGPT Deep Research, Claude Research — все они делают одно: принимают сложный вопрос, декомпозируют его, обходят десятки источников и собирают структурированный ответ с цитатами.
Проблема в том, что каждый ваш исследовательский запрос уходит на чужие серверы. Если вы занимаетесь конкурентным анализом, патентным поиском или работаете с чувствительными данными — это не абстрактный риск, а конкретная утечка контекста. Ваши запросы сами по себе — ценная информация.
MiroThinker 1.7 — open source агент от MiroMind AI, который решает эту задачу локально. Модель крутится на вашем железе, данные не покидают машину, а каждый шаг рассуждения прозрачен и проверяем.
Что такое MiroThinker и как он работает
MiroThinker — это не просто LLM с поиском. Это полноценный research-агент с многошаговым reasoning-циклом:
- Декомпозиция запроса. Агент разбивает сложный вопрос на подзадачи.
- Веб-поиск. Для каждой подзадачи формируются поисковые запросы через Google Search API.
- Скрейпинг и извлечение. Найденные страницы обрабатываются через Jina — извлекается релевантный контент.
- Многоуровневый анализ. Модель сопоставляет информацию из разных источников, выстраивает цепочку рассуждений.
- Синтез ответа. Финальный ответ с указанием источников и логики вывода.
Ключевое отличие от RAG-пайплайнов: MiroThinker не просто ищет и вставляет фрагменты. Он рассуждает над найденным, может вернуться к поиску, если первые результаты недостаточны, и объясняет, почему сделал конкретный вывод.
Две версии модели
MiroThinker 1.7 — полноразмерная модель на базе Qwen3 MoE. Требует серьёзного GPU.
MiroThinker 1.7 mini — 3B активных параметров. Работает на потребительском железе, включая одну RTX 4090.
Бенчмарки: почему это не игрушка
BrowseComp (бенчмарк для browsing-агентов)
MiroThinker H1 (облако) — 88.2. MiroThinker 1.7 — 74.0. MiroThinker 1.7 mini — 67.9. Claude 4.5 Opus — 67.8. GPT-5 — 54.9.
GAIA (бенчмарк general AI assistant)
MiroThinker H1 — 88.5. MiroThinker 1.7 mini — 80.3. GPT-5 — 76.4.
Mini-модель с 3B активных параметров обходит GPT-5 на GAIA. Полноразмерная версия на BrowseComp обгоняет Claude 4.5 Opus. Это не маргинальная разница — это системное превосходство в задачах многошагового поиска и синтеза.
Что изменилось в версии 1.7
«Effective interaction scaling»: на 43% меньше раундов взаимодействия для решения задачи и на 17% лучше качество результатов. Меньше шагов = меньше времени GPU = ниже счёт за электричество при self-hosting.
Как развернуть: пошаговый план
Требования к железу
- Mini-модель: одна RTX 4090 (24 GB VRAM). Подойдёт RTX 3090 с оговорками по скорости.
- Полная модель: multi-GPU setup, минимум 2× A100 или эквивалент.
Шаг 1: Скачать веса модели
Через huggingface-cli: huggingface-cli download miromind-ai/MiroThinker-1.7-mini --local-dir ./mirothinker-mini
Шаг 2: Развернуть inference-сервер
Установите vLLM и запустите: vllm serve miromind-ai/MiroThinker-1.7-mini --port 8000
Шаг 3: Настроить агентный фреймворк
Клонируйте репозиторий с GitHub: git clone https://github.com/MiroMindAI/MiroThinker.git. Скопируйте config.example.yaml в config.yaml, укажите endpoint модели, ключи Google Search API и Jina.
Шаг 4: Запустить
python run_agent.py --config config.yaml --query "Ваш исследовательский вопрос"
Честные ограничения
Не полностью air-gapped. Модель работает локально, но поиск идёт через Google Search API, а скрейпинг — через Jina. Ваши поисковые запросы уходят наружу. Для полной изоляции — не тот инструмент.
Настройка не тривиальна. Нет единого docker-compose up. Нужно собрать три компонента: inference-сервер, инструменты (search + scraping), агентный фреймворк.
Флагманская версия H1 — только облако. Open source релиз — это 1.7 и 1.7 mini. Они сильные, но без verification layer.
Скорость. Research-запросы по определению медленные: несколько поисков, скрейпинг страниц, рассуждение. На RTX 4090 — приемлемо, но не мгновенно.
Когда MiroThinker — правильный выбор
- Вы работаете с конфиденциальными исследовательскими запросами
- Вас раздражают rate limits Perplexity Pro в момент дедлайна
- Вам важно видеть полную цепочку рассуждений, а не только финальный ответ
- У вас есть RTX 4090 или аналогичная карта
Когда оставаться на облаке
- Вам нужен мобильный доступ из любой точки
- Нет подходящего GPU
- Скорость ответа критичнее приватности
- Не хотите тратить время на настройку
Итог
MiroThinker 1.7 — первый open source deep research агент, который на бенчмарках бьёт GPT-5 и стоит рядом с Claude 4.5 Opus. Mini-версия на 3B активных параметров запускается на одной потребительской видеокарте.
Подписка на Perplexity Pro — $240 в год. RTX 4090 у вас, скорее всего, уже есть. Считайте сами.
- MiroThinker
- deep research
- self-hosted
- Perplexity
- open source
- vLLM
- AI-агенты
- приватность