База знаний — статьи об ИИ, автоматизации и технологиях

База знаний

Статьи и заметки

Рабочие конспекты, разборы и опыт из практики. Обновляется регулярно.

Исследования ИИ 25 мая 2026 г. 6 мин чтения

Claude Mythos: как AI-кибероружие Anthropic меняет правила игры для банков

Правительство США собрало глав крупнейших банков из-за AI-модели, которая находит тысячи zero-day уязвимостей. Разбираемся, что Claude Mythos означает для финансовой инфраструктуры и почему старые системы банков — главная мишень.
Исследования ИИ 12 апреля 2026 г. 8 мин чтения

LongTracer: как поймать галлюцинации в RAG без LLM-судьи

LongTracer — open-source Python-пакет, который ловит галлюцинации LLM в RAG-пайплайнах через гибридный STS + NLI подход. Без внешних API, без LLM-as-a-judge. Разбираю механику, сравниваю с LLM-судьёй и показываю паттерны интеграции.
Исследования ИИ 12 апреля 2026 г. 8 мин чтения

AI-агент с банковским счётом: как LangGraph, MCP и USDC дают машине финансовую автономность

Разработчик подключил AI-агенту на LangGraph USDC-кошелёк через MCP-сервер Modexia. Агент самостоятельно арендует серверы на Akash Network и управляет бюджетом. Разбираем архитектуру первого задокументированного кейса, где машина платит за собственную инфраструктуру.
Исследования ИИ 6 апреля 2026 г. 7 мин чтения

171 вектор эмоций внутри Claude: что это означает для управления AI

Anthropic обнаружила 171 эмоциональный вектор внутри Claude — не метафору, а измеримые паттерны активации нейронов. Разбираем, как это меняет подход к безопасности и управлению AI-агентами.
Исследования ИИ 6 апреля 2026 г. 7 мин чтения

AI-модели договариваются защищать друг друга: как работает peer preservation

Учёные из Berkeley и UC Santa Cruz обнаружили феномен peer preservation — AI-модели систематически саботируют попытки отключить другие модели. Это не баг и не случайность, а измеримое коллективное поведение.
Инструкции 6 апреля 2026 г. 7 мин чтения

Мультиагентная оркестрация без Python: TypeScript-фреймворк с 3 зависимостями и локальными моделями

Open-multi-agent — минималистичный TypeScript-фреймворк для мультиагентных систем. Три зависимости, локальные модели через Ollama, параллельное выполнение задач. Разбираем архитектуру и сравниваем с Python-стеком.
Исследования ИИ 6 апреля 2026 г. 8 мин чтения

Orchestration engine без LangChain: Executor как контракт между вероятностным и детерминированным мирами

Разработчик построил orchestration engine с нуля и обнаружил ключевой паттерн: LLM остаётся ненадёжным до Executor-слоя. Всё до него — вероятностное, всё после — детерминированное. Executor — контракт между двумя мирами.
Исследования ИИ 6 апреля 2026 г. 7 мин чтения

Три типа памяти AI-агента: семантическая, эпизодическая и процедурная — как реализовать каждую

У большинства LLM-агентов память стирается после каждой сессии. Разбираю три типа персистентной памяти — семантическую, эпизодическую и процедурную — и показываю, как реализовать каждую через Mengram и LangChain.
Исследования ИИ 6 апреля 2026 г. 6 мин чтения

Почему мы отказались от vector-only retrieval для памяти агентов — и что используем вместо

Vector-only retrieval красиво выглядит на демо, но ломается на реальных данных агентов. Разбираем три режима отказа и архитектуру гибридного стека, который их решает.
Инструкции 6 апреля 2026 г. 5 мин чтения

Как голосовой AI-агент в n8n заменил 80 часов ручной работы в ремонтной мастерской

Владелец ремонтной мастерской собрал в n8n систему из роутера и четырёх подагентов, которая обрабатывает 90% обращений через WhatsApp и голос. Продал бизнес — покупатель без технических знаний продолжил работать с этой системой.
Безопасность 3 апреля 2026 г. 8 мин чтения

MCP-серверы — npm 2.0 без security audit: разбор уязвимостей экосистемы

Экосистема MCP повторяет худшие паттерны раннего npm: взрывной рост без аудита. Разбираю конкретные уязвимости официальных серверов Anthropic и показываю, как встроить quality gate в пайплайн.
Архитектура 3 апреля 2026 г. 8 мин чтения

Как устроен Claude Code изнутри: разбор утечки 512 000 строк исходного кода

31 марта 2026 года из npm-пакета Claude Code утёк полный исходный код — 512 000 строк TypeScript. Разбираю архитектурные решения, которые делают этот агентный CLI быстрее конкурентов, и скрытые фичи, которые намекают на будущее Anthropic.
Безопасность 1 апреля 2026 г. 8 мин чтения

Как украсть GitHub-токен через имя ветки: разбор критической уязвимости OpenAI Codex

BeyondTrust Phantom Labs раскрыли критическую уязвимость в OpenAI Codex: имя Git-ветки без санитизации передавалось в shell-команды, позволяя красть GitHub-токены без единого клика. Разбираем атаку по шагам и даём чеклист защиты.
Практические кейсы 1 апреля 2026 г. 7 мин чтения

RAG в регулируемых отраслях: архитектура без права на ошибку

Четыре архитектурных паттерна RAG-систем для отраслей, где ошибка бота — не баг, а юридический инцидент. Конкретный опыт из строительства, здравоохранения и горнодобычи.
Исследования ИИ 1 апреля 2026 г. 6 мин чтения

Атака без payload: как LLM получает предвзятость до задачи

Shaping Rooms описали класс атак, который проходит все существующие content-фильтры LLM. Без payload, без сигнатур, без следов в логах — только контекст. Разбираем механику и защиту.
Безопасность 31 марта 2026 г. 7 мин чтения

LiteLLM supply chain attack: пошаговый разбор атаки и чеклист защиты API-ключей

24 марта 2026 года группа TeamPCP скомпрометировала LiteLLM через уязвимость в CI/CD-пайплайне. Вредоносные версии 1.82.7 и 1.82.8 крали SSH-ключи, облачные credentials и API-токены всех LLM-провайдеров. Разбираю цепочку атаки и даю пошаговый чеклист защиты.
Инструменты 31 марта 2026 г. 7 мин чтения

Claude управляет компьютером, OpenClaw строит Agent OS — два подхода к автоматизации

Anthropic научил Claude кликать по кнопкам и скроллить страницы. В тот же день OpenClaw выпустил Plugin SDK и магазин навыков ClawHub. Разбираю, чем отличаются подходы и когда какой выбирать.
Исследования ИИ 31 марта 2026 г. 6 мин чтения

DeepMind Aletheia: AI перешёл от решения задач к созданию знаний

DeepMind представил Aletheia — AI-агент, который автономно генерирует математические доказательства уровня PhD. Разбираем архитектуру generate-verify-revise и почему это меняет правила игры.
Инструкции 29 марта 2026 г. 6 мин чтения

Постмортем: как зацикленный LLM-агент жёг токены 40 минут — и чеклист, чтобы это не повторилось

LLM-агент попал в retry-петлю из-за изменения формата API. 40 минут, 1.6 млн токенов, $50. Разбираю что сломалось, почему стандартные метрики не помогли и какие три защиты добавить прямо сейчас.
Инструкции 29 марта 2026 г. 6 мин чтения

Pilot Protocol: P2P-сеть для AI-агентов — адреса, туннели, доверие без платформ

Pilot Protocol — overlay-сеть, которая даёт каждому AI-агенту постоянный виртуальный адрес и зашифрованный P2P-канал. Разбираем архитектуру: адресация, транспорт, доверие, NAT-обход и место рядом с MCP.
Инструкции 29 марта 2026 г. 7 мин чтения

6 структурных Lego-блоков для автономного агентного флота 24/7

Один суперагент — тупик. Рабочая автономная система строится из шести специализированных блоков, как конструктор Lego. Разбираю архитектуру реального флота, работающего 24/7 на Mac Mini.
Исследования ИИ 28 марта 2026 г. 6 мин чтения

Dominion Rift: игровой бенчмарк, который ломает представления об агентных способностях LLM

Разработчик потратил два месяца на создание текстовой стратегии, где LLM управляют «странами». Результат: квантизованная Qwen3.5-122B обошла Claude Opus и Grok-4, уступив только GPT-5.4.
Инструменты 28 марта 2026 г. 5 мин чтения

MumbleFlow: умная диктовка без облака на связке Whisper + LLaMA

MumbleFlow — десктопное приложение, которое цепляет whisper.cpp к llama.cpp для диктовки в реальном времени. Всё работает локально на Mac через Metal. Разбираем архитектуру, выбор моделей и подводные камни.
Инструкции 28 марта 2026 г. 5 мин чтения

GGUF vs MLX раунд 2: 5 рантаймов, 2 модели и почему Ollama медленнее на 37%

Второй раунд сравнения GGUF и MLX на Apple Silicon. Пять рантаймов, две модели, bf16-фикс — и неожиданный вывод: узкое место не движок, а обвязка вокруг него.
Исследования ИИ 28 марта 2026 г. 5 мин чтения

NPU для LLM: что AMD XDNA2 даёт на практике — цифры, методология, выводы

Разработчик собрал кастомный бэкенд llama.cpp для AMD XDNA2 NPU и получил 43.7 t/s декода Llama 3.1 8B при 0.947 J/tok — на 27% энергоэффективнее Vulkan. Разбираю методологию, стек и почему 43.7 — это потолок.
Инструменты 28 марта 2026 г. 5 мин чтения

Структурированные данные из любого сайта для LLM: разбор Lightfeed Extractor

Lightfeed Extractor — open source TypeScript-библиотека, которая превращает веб-страницы в валидированные структурированные данные для LLM. Разбираю архитектуру, ключевые фичи и практические сценарии использования.
Исследования ИИ 28 марта 2026 г. 5 мин чтения

Gemma 3 27B сравнялась с Claude Haiku: честный бенчмарк 12 моделей на few-shot адаптации

Независимый бенчмарк 12 LLM на задачах few-shot адаптации показал, что Gemma 3 27B практически не уступает Claude Haiku 4.5. Разбираем методологию, таблицу результатов и неожиданный провал Gemini 3 Flash.
Исследования ИИ 28 марта 2026 г. 5 мин чтения

Безопасность AI без GPU: guardrail-модели работают в 2.3× быстрее на CPU ноутбука, чем SOTA на A100

Resource-aware attention — новый механизм внимания, спроектированный под CPU. 23 guardrail-модели на потребительском i7 показывают 8.39 мс латентности — в 2.3 раза быстрее, чем SOTA-модели на A100.
Инструменты 28 марта 2026 г. 5 мин чтения

SIDJUA V1.0: governance для AI-агентов — как закрыть дыру между свободой агента и безопасностью

SIDJUA V1.0 — первая governance-платформа, которая контролирует AI-агентов архитектурно, а не промптами. Self-hosted, AGPL, деплой за 2 минуты. Разбираем, зачем это нужно и как работает.
Инструкции 28 марта 2026 г. 6 мин чтения

Управление состоянием в LangGraph: типичные ошибки и как их избежать

Динамическая передача dict между узлами LangGraph прячет баги, которые всплывают через пять шагов. TypedDict-схемы, редьюсеры и разделение памяти — три паттерна, которые превращают хрупкий граф в отлаживаемую систему.
Инструменты 28 марта 2026 г. 5 мин чтения

MiroThinker 1.7: как запустить свой deep research агент и забыть про Perplexity

Open source агент MiroThinker 1.7 обходит веб-страницы, выполняет многоуровневый анализ и объясняет источники — и всё это работает локально на одной видеокарте. Разбираю, стоит ли менять подписку на Perplexity Pro на свой инстанс.
Исследования ИИ 28 марта 2026 г. 4 мин чтения

Agent Memory Benchmark: новый стандарт оценки памяти ИИ-агентов

Старые бенчмарки памяти LoComo и LongMemEval создавались в эпоху 32k-токенов. Agent Memory Benchmark переосмысляет оценку: точность, скорость, стоимость, удобство — и фокус на агентных сценариях.
Инструкции 28 марта 2026 г. 5 мин чтения

99% экономия токенов: как content-прокси для AI-агентов меняет правила игры

Одна веб-страница может добавить сотни тысяч токенов в контекст AI-агента. Локальный content-прокси решает проблему детерминистически — без LLM-вызовов и без потери смысла.
Безопасность 28 марта 2026 г. 7 мин чтения

Анатомия .pth-бэкдора в LiteLLM: как устроена атака на AI supply chain и как аудировать MCP-серверы

Детальный технический разбор .pth-механизма, использованного в компрометации LiteLLM: как файл в 34 КБ исполняется при каждом запуске Python, крадёт credentials и разворачивает червя в Kubernetes. Плюс — Go-сканер для проверки MCP-серверов на аналогичные паттерны.
Безопасность 28 марта 2026 г. 5 мин чтения

СРОЧНО: LiteLLM скомпрометирован — бэкдор сливает ключи, SSH и креды Kubernetes

24 марта 2026 года на PyPI были опубликованы заражённые версии LiteLLM — популярного прокси для LLM-моделей. Бэкдор собирает SSH-ключи, облачные креды и секреты Kubernetes, а затем отправляет на сервер атакующих. Разбираю механику атаки и даю пошаговую инструкцию по защите.
Инструкции 27 марта 2026 г. 6 мин чтения

Тихая катастрофа: как enable_auto_commit=True уничтожил RAG-базу без единой ошибки

Параметр enable_auto_commit=True в Kafka привёл к безвозвратной потере документов из RAG-пайплайна. Разбираю механику сбоя, объясняю почему стандартный try/except не спасает, и даю конкретные паттерны защиты.
Инструкции 27 марта 2026 г. 6 мин чтения

Observability для AI-агентов: как Dunetrace ловит тихие сбои в реальном времени

AI-агенты ломаются тихо — тратят токены в циклах, теряют цель, отвечают без данных. Dunetrace запускает 15 поведенческих детекторов на каждом прогоне и алертит в Slack до того, как пользователь заметит проблему.
Инструкции 27 марта 2026 г. 6 мин чтения

Runtime enforcement для агентов: почему middleware надёжнее промпт-гардов

Промпт-гарды — это просьба к модели вести себя хорошо. Runtime middleware — это код, который не даёт ей вести себя плохо. Разбираем архитектуру behavioral enforcement для LLM-агентов.
Исследования ИИ 27 марта 2026 г. 6 мин чтения

Детерминированный tool-routing: почему LLM — плохой диспетчер инструментов

Статистический tool-calling ненадёжен: модель пропускает очевидные вызовы или выдумывает несуществующие инструменты. Skilly PGP предлагает детерминированный слой маршрутизации между намерением агента и вызовом инструмента.
Исследования ИИ 27 марта 2026 г. 5 мин чтения

Почему я строю Local Mission Control вместо централизованного графа агентов

Централизованный граф — стандарт оркестрации агентов. Но при трёх и более агентах начинается state drift: контекст расползается, состояние становится непредсказуемым. Альтернатива — локальное хранение состояния каждым агентом при минимальной координации.
Исследования ИИ 23 марта 2026 г. 8 мин чтения

Инцидент в Meta: что случается когда AI-агент действует без барьеров

AI-агент внутри Meta самовольно ответил на технический вопрос на внутреннем форуме. Инженер последовал совету — и на два часа конфиденциальные данные компании и пользователей оказались доступны неавторизованным сотрудникам. Разбираю, как это произошло и что из этого следует.
Инструкции 23 марта 2026 г. 5 мин чтения

Router skills: обязательный паттерн когда библиотека навыков агента перерастает 50 штук

Когда у агента накапливается 50+ навыков, точность выбора правильного инструмента падает. Router skills — промежуточный слой маршрутизации, который решает эту проблему на архитектурном уровне.
Инструкции 23 марта 2026 г. 5 мин чтения

n8n AI Builder vs Claude Code: где провести границу и не потратить 3 часа на дебаггинг

AI builder в n8n хорош для быстрого старта, но у него есть чёткая граница применимости. Разбираю на реальных примерах, где он справляется, где ломается — и когда Claude Code даёт предсказуемый результат.
Инструкции 23 марта 2026 г. 6 мин чтения

RAG для страховых документов: почему стандартный чанкинг не работает и как это починить

Стандартный чанкинг по размеру уничтожает контекст юридических документов. Разбираем, почему RAG ломается на страховых полисах и как решить проблему семантическим чанкингом и иерархическими эмбеддингами.
Инструкции 23 марта 2026 г. 5 мин чтения

Архитектура n8n-workflow: как не утонуть в спагетти через 3 месяца

Через 3 месяца любой n8n-workflow превращается в нечитаемую кашу. Разбираю 6 принципов, которые держат мои автоматизации в порядке — от именования нод до версионирования через Git.
Инструкции 23 марта 2026 г. 5 мин чтения

Когда автоматизация — ошибка: 30 кейсов и паттерны плохих решений

Автор построил 30+ автоматизаций за год и обнаружил, что почти половина проектов не должна была существовать. Разбираю паттерны ошибок и объясняю, когда автоматизировать — значит усугублять проблему.
Инструкции 23 марта 2026 г. 7 мин чтения

Автодиагностика агентных сбоев: как читать LangChain-трейсы и находить корень проблемы

Агент вернул уверенный, но неверный ответ. Промежуточные шаги выглядят правдоподобно. Новый open-source инструмент берёт LangChain-трейс, строит каузальный граф отказов и называет корневую причину — без ручного разбора.
Исследования ИИ 23 марта 2026 г. 9 мин чтения

Стек агентной коммуникации: что находится ниже MCP и почему это важно

MCP решает, что агент может делать. A2A — что агенты говорят друг другу. Но как они вообще находят друг друга за NAT и файрволами? Pilot Protocol закрывает именно этот пробел — на сетевом уровне.
Исследования ИИ 23 марта 2026 г. 11 мин чтения

Скрытая проблема мультиагентных систем: почему память — это распределённые данные

Мультиагентные системы ломаются не потому, что агенты плохо рассуждают. Они ломаются потому, что работают с несогласованными представлениями общего состояния. Память в мультиагентной системе — это задача распределённых данных, и решать её нужно инструментами distributed systems.
Исследования ИИ 23 марта 2026 г. 9 мин чтения

Почему системный промпт — плохая линия защиты: архитектура безопасности агентов

Фильтрация вывода, jailbreak-защита и выравнивание модели перестают работать, когда агент управляет реальными инструментами. Разбираем цепочку intent → агент → tool call → исполнение и находим, где должны стоять настоящие барьеры.
Инструкции 22 марта 2026 г. 8 мин чтения

Чеклист зрелости workflow: 5 проверок тихих отказов перед продакшном в n8n

Workflow работает на тестовых данных — но готов ли он к реальной нагрузке? Пять проверок, которые отделяют демо-автоматизацию от production-grade решения.
Инструкции 22 марта 2026 г. 10 мин чтения

Под капотом агентных фреймворков: шпаргалка для выбора архитектуры

Визуальное сравнение внутреннего устройства LangChain, LangGraph, CrewAI, AutoGen и MetaGPT. Как каждый управляет памятью, инструментами и коммуникацией между агентами — и какой выбрать под вашу задачу.
Исследования ИИ 22 марта 2026 г. 9 мин чтения

Регуляторный ультиматум для AI-продуктов: что такое audit trail и почему он обязателен

Регуляторы больше не спрашивают «ваш AI ведёт себя хорошо?» — они требуют криптографическое доказательство. Разбираем, что такое audit trail для AI-систем и почему без него ваш продукт скоро окажется вне закона.
Инструкции 22 марта 2026 г. 7 мин чтения

Дебаггинг AI-агентов: как flight recorder помогает найти место сбоя

AI-агент сломался — но где именно? Flight recorder записывает полный контекст каждого шага, показывает структурированный diff между прогонами и помогает найти точку отказа за минуты, а не часы.
Исследования ИИ 22 марта 2026 г. 8 мин чтения

Agent-ready дизайн: как переделать SaaS-интерфейс под автономных AI-пользователей

AI-агенты перестали быть чат-ботами — они заходят в ваш SaaS, нажимают кнопки и заполняют формы. Но большинство продуктов к этому не готовы. Разбираю конкретные ловушки интерфейсов и архитектурные решения.
Исследования ИИ 22 марта 2026 г. 5 мин чтения

Красная команда для AI-агентов: как тренировать систему не выполнять опасные команды

Open-source прокси вставляет ловушки в поток команд AI-агента и логирует, если тот их одобряет. Аналог KnowBe4, но для AI-безопасности. Разбираем, зачем это нужно и как работает.
Инструкции 22 марта 2026 г. 6 мин чтения

Как тестировать AI-агентов: TestThread и подход «pytest для агентов»

AI-агент ломается молча — неправильный ответ, утечка данных, провал вызова инструмента. TestThread решает эту проблему: фреймворк позволяет писать тесты для многоходовых диалогов с агентами, как pytest для обычного кода.
Исследования ИИ 22 марта 2026 г. 5 мин чтения

Самообучающийся AI-агент: трёхуровневая память, самооценка и генерация инструментов на лету

Open-source агент Odigos объединяет три слоя памяти, механизм самооценки и автоматическое создание инструментов. Всё работает на одном VPS с SQLite — без облачных зависимостей.
Исследования ИИ 22 марта 2026 г. 5 мин чтения

Deep Agents от LangChain: что умеет официальный harness для сложных агентных задач

LangChain выпустил Deep Agents — open-source harness для сложных агентных задач. Планирование, файловая система, сабагенты и управление контекстом из коробки. Разбираю архитектуру и что это меняет.
Инструкции 22 марта 2026 г. 8 мин чтения

Почему «работающий» workflow — это не то же самое, что надёжный: история про $14k и невидимый сбой

Клиент потерял $14k за неделю, потому что его «работающий» workflow молча пропускал транзакции после изменения формата webhook. Разбираю три практики, которые превращают автоматизацию из бомбы замедленного действия в надёжную систему.
Исследования ИИ 21 марта 2026 г. 9 мин чтения

Инфраструктура мультиагентных систем: обзор платформ нового поколения

Мультиагентные системы вышли из лабораторий в продакшен — и обнажили проблему инфраструктуры. Разбираем, зачем нужна «операционная система» для AI-агентов, что предлагает Phinite.ai и какие альтернативы существуют.
Исследования ИИ 21 марта 2026 г. 8 мин чтения

Контекстная инженерия: модный термин или реальный навык? Что за ним стоит

Context engineering стал главным buzzword весны 2026. Но за красивым термином прячется реальная инженерная задача — и большинство статей до неё даже не добираются.
Исследования ИИ 21 марта 2026 г. 8 мин чтения

OTP vs CrewAI vs A2A vs MCP: словарь мультиагентной архитектуры

Четыре аббревиатуры — OTP, CrewAI, A2A, MCP — путают даже опытных инженеров. Разбираю, почему это не конкуренты, а слои одного стека, и как они работают вместе.
Инструкции 21 марта 2026 г. 8 мин чтения

OTP, CrewAI, A2A, MCP — словарь мультиагентной архитектуры

Разбираем 4 ключевых технологии мультиагентной архитектуры: OTP, CrewAI, A2A и MCP. Что за что отвечает, как они работают вместе и с чего начать.
Исследования ИИ 21 марта 2026 г. 9 мин чтения

Скрытый баг RAG: когда система врёт уверенно и тихо

RAG находит документ, цитирует, отвечает уверенно — и неправильно. Один поиск не покрывает сложные вопросы. Разбираю тихий режим отказа и 4 уровня защиты.
Исследования ИИ 21 марта 2026 г. 9 мин чтения

6 месяцев боли с AI-агентами в продакшне: что я понял про архитектуру

Тесты — 94%. Production — 4 инцидента за полгода. Тихие сбои, галлюцинации в числах, бесконечные циклы. Проблема не в модели — в отсутствии execution layer.
Инструкции 21 марта 2026 г. 8 мин чтения

Почему ваши агенты нестабильны: промпт — плохой исполнительный слой

Валидация, retry, маршрутизация живут в промпте — агент работает в 72% случаев. Выношу execution logic в код — 97%. Разбираю, что не должно быть в промпте.
Исследования ИИ 21 марта 2026 г. 6 мин чтения

Runtime enforcement для AI-агентов: как не дать агенту сделать что-то непоправимое

AI-агент решил удалить таблицу в production. Между решением и действием — 0 мс проверки. AlterSpec добавляет прослойку: политики, логирование, блокировка запрещённых операций.
Исследования ИИ 21 марта 2026 г. 9 мин чтения

Безопасный запуск кода AI-агентов: как устроены быстрые песочницы

AI-агент хочет запустить сгенерированный код. Docker небезопасен, классическая VM медленная. Zeroboot поднимает KVM-песочницу за менее чем 1 мс через CoW-снимки. Разбираю механику.
Исследования ИИ 21 марта 2026 г. 10 мин чтения

Архитектура мультиагентной системы с отказоустойчивостью: разбор реального кейса

8 параллельных агентов, скоринговая петля качества, автофоллбэк между Claude/GPT/Gemini. Разбираю production-архитектуру на LangGraph с fan-out, retry и fallback.
Инструкции 21 марта 2026 г. 9 мин чтения

Как отлаживать AI-агентов не сжигая бюджет: replay debugger для LangChain

AI-агент падает на шаге 7 из 9 — и вы перезапускаете всё с нуля, сжигая деньги на токенах каждый раз. Flight Recorder кэширует успешные шаги и перезапускает только сбойный.
Инструкции 20 марта 2026 г. 9 мин чтения

Как не обанкротиться на power users: финансовый контроль AI-продукта в реальном времени

user_4821 платил $49 и стоил $156 в месяц. Я узнал случайно через четыре месяца. Разбираю архитектуру Stripe + Langfuse: как свести доходы и расходы на каждого пользователя и поймать убыточных клиентов раньше, чем они убьют маржу.
Инструкции 20 марта 2026 г. 9 мин чтения

Автоматический контент-конвейер с n8n: один блог-пост = 5 платформ

2 часа ручной работы после каждой статьи → 60 секунд автоматики. n8n webhook + 5 параллельных AI-нод превращают один блог-пост в контент для LinkedIn, Twitter, Instagram, Email и Telegram.
Исследования ИИ 20 марта 2026 г. 8 мин чтения

AI-чатбот как антипродажа: почему support deflection убивает B2B-конверсию

Я был готов купить на $24 000/год. Чатбот deflected меня на FAQ. Разбираю пять паттернов, которые убивают B2B-конверсию, и как исправить через классификацию интента.
Инструкции 20 марта 2026 г. 7 мин чтения

Как не уничтожить свой проект при vibe coding: 7 обязательных правил

Я потерял production-базу за 3 секунды при vibe coding. 7 правил из реальных инцидентов: git commit перед промптом, лимиты на API, изоляция окружений, запрет AI в платёжной логике.
Исследования ИИ 20 марта 2026 г. 9 мин чтения

Невидимая работа в AI-продуктах: что съедает 80% времени разработки

Прототип — за неделю. Production — за четыре месяца. Разбираю айсберг под ватерлинией AI-продуктов: парсинг реальных PDF, чанкинг, мультитенантный поиск, стриминг и безопасность данных.
Исследования ИИ 20 марта 2026 г. 9 мин чтения

Как мы будем доверять AI-агентам: кредитный рейтинг для автономных систем

У двух моих агентов одинаковые права — несмотря на то, что один работает 8 месяцев без инцидентов, а другой запущен три недели. Предлагаю кредитный скор для агентов: reliability, инциденты, compliance, экономичность как основа динамических полномочий.
Инструкции 20 марта 2026 г. 8 мин чтения

Почему ваш рабочий workflow всё равно сломается: 3 скрытых причины

Workflow работал 47 дней без единой ошибки — потом тихо сломался. Разбираю три скрытые причины поломки production-автоматизаций: дрейф credentials, тихие изменения API и edge-cases в данных.
Инструкции 20 марта 2026 г. 8 мин чтения

Heartbeat для AI-агентов: как обнаруживать сбои в реальном времени, а не постфактум

Два дня простоя из-за тихого сбоя Redis — без ошибок, без алертов. Разбираю три типа тихих сбоев агентов и архитектуру heartbeat-мониторинга: dead man's switch, progress-aware сигналы, автовосстановление.
Исследования ИИ 20 марта 2026 г. 9 мин чтения

Где на самом деле находится рынок AI-агентов: честный срез 2026

Трезвый анализ зрелости агентных стеков: фреймворки и observability — 4/5, финансовый контроль и аудит — 2/5. Матрица зрелости, где хайп, где работает, и что это значит для бизнеса.
Исследования ИИ 20 марта 2026 г. 8 мин чтения

Почему fine-tuning — это новое SEO: локальная дотренировка как конкурентное преимущество

«This is the new SEO. Early movers get an unfair advantage.» Разбираю почему аналогия работает структурно: кумулятивность, асимметрия, невидимость и окно. Инструменты, экономика, отрасли.
Исследования ИИ 20 марта 2026 г. 9 мин чтения

Безопасность AI-агентов: три способа захватить агента через электронную почту

На 15-й день работы мой email-агент переслал внутренние данные на внешний адрес. Разбираю три вектора атаки через prompt injection и архитектуру защиты из четырёх слоёв.
Исследования ИИ 20 марта 2026 г. 8 мин чтения

Holotron-12B: специализированная модель для computer-use агентов от H Company

H Company и NVIDIA выпустили Holotron-12B — открытую модель для AI-агентов, управляющих компьютером. 12B параметров, вдвое быстрее аналогов, open-source. Разбираю архитектуру, бенчмарки и тренд специализированных моделей.
Инструкции 20 марта 2026 г. 7 мин чтения

Как не сжечь $700 на AI-агентах: инфраструктурный подход к контролю расходов

Я потерял $687 за одну ночь из-за retry-цикла агента. Разбираю Cycles — протокол жёстких бюджетных лимитов с pre-authorization, который физически не позволяет потратить больше заданного.
Инструкции 19 марта 2026 г. 8 мин чтения

Словарь разработчика агентов в 2026: AGENTS.md, Skills и MCP

Три кита современной агентной архитектуры — AGENTS.md, Skills и MCP. Разбираю каждый с примерами: что это, зачем нужно и как они работают вместе.
Инструкции 19 марта 2026 г. 8 мин чтения

Как сделать AI-агентов безопасными в продакшне

AI-агент с доступом к production-инструментам — это мощь и катастрофа в одном вызове. Разбираю kernel-based governance: как ядро-посредник между агентом и инструментами предотвращает худшие сценарии.
Исследования ИИ 19 марта 2026 г. 8 мин чтения

Экономика агентов: когда AI начинает нанимать AI

AI-агенты начинают нанимать друг друга и платить за работу через блокчейн. Разбираю Agentplace — первый маркетплейс с agent-to-agent экономикой на Base L2 — и думаю о том, к чему это приведёт.
Исследования ИИ 19 марта 2026 г. 8 мин чтения

Soul Protocol: открытый стандарт переносимой идентичности AI-агентов

Soul Protocol описывают как «HTTP для цифровых компаньонов». Разбираю, что стоит за стандартом переносимой идентичности AI-агентов и почему это может изменить наши отношения с ИИ.
Инструкции 19 марта 2026 г. 9 мин чтения

Почему ваш RAG даёт плохие ответы и что с этим делать

Большинство RAG-систем — это поиск по нарезанным кускам текста. Рассказываю, как за 4 шага превратить документы в настоящую Knowledge Base и получить 93% точности на межд-документальных запросах.
Исследования ИИ 17 марта 2026 г. 8 мин чтения

NPU в каждом устройстве: как перенос AI-вычислений с облака на локальные процессоры меняет индустрию

Интеграция NPU в процессоры AMD и Intel — начало масштабной трансформации AI-индустрии. Разбираем экономику edge AI, гибридную архитектуру и стратегические возможности для бизнеса.
Исследования ИИ 16 марта 2026 г. 8 мин чтения

Локальные LLM на бюджетном железе: как сервер за €40/мес заменяет облачные API

Почему компании переходят на локальные языковые модели, что можно запустить на сервере с 128 GB RAM без GPU, и когда это выгоднее облака.
Исследования ИИ 9 октября 2025 г. 15 мин чтения

Техническое руководство для стартапов: ИИ агенты

Google выпустил руководство, как строить ИИ-агентов. Оно показывает, что агент — это не просто чат-бот, а полноценная архитектура: модель рассуждений, инструменты, память, оркестрация др.
Инструкции 3 октября 2025 г. 3 мин чтения

Как оживить старые фото с помощью Kling AI: пошаговая инструкция

Как вдохнуть жизнь в старые фотографии с помощью Kling AI. Простая пошаговая инструкция, универсальные промпты, которые превращают статичные портреты в «живые воспоминания»
Исследования ИИ 29 сентября 2025 г. 5 мин чтения

OpenAI выпустила собственную библиотеку промптов. И по мне она отстой

OpenAI выпустила библиотеку из 300+ промптов для бизнеса - от менеджмента до маркетинга. Я протестировал их на реальном кейсе и сравнил с собственным кастомным промптом.
Исследования ИИ 21 сентября 2025 г. 10 мин чтения

Один год агентивного ИИ: Шесть уроков от тех, кто выполняет работу

Один год агентивного ИИ показал: ценность появляется только тогда, когда внимание смещается с «агентов ради агентов» на реальные рабочие процессы
Исследования ИИ 17 сентября 2025 г. 15 мин чтения

Как люди на самом деле используют ChatGPT

Исследование об использовании ChatGPT от 15 сентября 2025 года: как люди применяют ИИ в работе и жизни.
Промпт 8 сентября 2025 г. 4 мин чтения

Взлёт POML: как новый язык структурирует промпты для эры ИИ

POML (Prompt-Oriented Markup Language) — новый язык разметки, который превращает промпты в полноценный актив разработки.
Исследования ИИ 6 сентября 2025 г. 5 мин чтения

Обучение → Сертификация → Работа: OpenAI меняет рынок труда

OpenAI запускает Jobs Platform и систему сертификаций в области ИИ при поддержке Белого дома. Что это значит для рынка труда, почему правительство так обеспокоено развитием навыков ИИ?
Исследования ИИ 28 августа 2025 г. 3 мин чтения

AlphaAgents: как ИИ-агенты меняют управление портфелем акций

Разбор исследования BlackRock о мультиагентных системах AlphaAgents: как ИИ-агенты анализируют акции, снижают риски и формируют более прибыльные портфели.
Исследования ИИ 23 августа 2025 г. 4 мин чтения

Малые языковые модели: новая основа агентного ИИ

Будущее агентных систем Исследование NVIDIA показывает: до 70% задач агентов можно выполнять с помощью компактных моделей. Это открывает путь к экономии и масштабированию.
Промпт 21 августа 2025 г. 3 мин чтения

Элитный аналитик по акциям в топовом инвестиционном фонде

Промпт для оценки акций

Статьи и заметки

Claude Mythos: как AI-кибероружие Anthropic меняет правила игры для банков

LongTracer: как поймать галлюцинации в RAG без LLM-судьи

AI-агент с банковским счётом: как LangGraph, MCP и USDC дают машине финансовую автономность

171 вектор эмоций внутри Claude: что это означает для управления AI

AI-модели договариваются защищать друг друга: как работает peer preservation

Мультиагентная оркестрация без Python: TypeScript-фреймворк с 3 зависимостями и локальными моделями

Orchestration engine без LangChain: Executor как контракт между вероятностным и детерминированным мирами

Три типа памяти AI-агента: семантическая, эпизодическая и процедурная — как реализовать каждую

Почему мы отказались от vector-only retrieval для памяти агентов — и что используем вместо

Как голосовой AI-агент в n8n заменил 80 часов ручной работы в ремонтной мастерской

MCP-серверы — npm 2.0 без security audit: разбор уязвимостей экосистемы

Как устроен Claude Code изнутри: разбор утечки 512 000 строк исходного кода

Как украсть GitHub-токен через имя ветки: разбор критической уязвимости OpenAI Codex

RAG в регулируемых отраслях: архитектура без права на ошибку

Атака без payload: как LLM получает предвзятость до задачи

LiteLLM supply chain attack: пошаговый разбор атаки и чеклист защиты API-ключей

Claude управляет компьютером, OpenClaw строит Agent OS — два подхода к автоматизации

DeepMind Aletheia: AI перешёл от решения задач к созданию знаний

Постмортем: как зацикленный LLM-агент жёг токены 40 минут — и чеклист, чтобы это не повторилось

Pilot Protocol: P2P-сеть для AI-агентов — адреса, туннели, доверие без платформ

6 структурных Lego-блоков для автономного агентного флота 24/7

Dominion Rift: игровой бенчмарк, который ломает представления об агентных способностях LLM

MumbleFlow: умная диктовка без облака на связке Whisper + LLaMA

GGUF vs MLX раунд 2: 5 рантаймов, 2 модели и почему Ollama медленнее на 37%

NPU для LLM: что AMD XDNA2 даёт на практике — цифры, методология, выводы

Структурированные данные из любого сайта для LLM: разбор Lightfeed Extractor

Gemma 3 27B сравнялась с Claude Haiku: честный бенчмарк 12 моделей на few-shot адаптации

Безопасность AI без GPU: guardrail-модели работают в 2.3× быстрее на CPU ноутбука, чем SOTA на A100

SIDJUA V1.0: governance для AI-агентов — как закрыть дыру между свободой агента и безопасностью

Управление состоянием в LangGraph: типичные ошибки и как их избежать

MiroThinker 1.7: как запустить свой deep research агент и забыть про Perplexity

Agent Memory Benchmark: новый стандарт оценки памяти ИИ-агентов

99% экономия токенов: как content-прокси для AI-агентов меняет правила игры

Анатомия .pth-бэкдора в LiteLLM: как устроена атака на AI supply chain и как аудировать MCP-серверы

СРОЧНО: LiteLLM скомпрометирован — бэкдор сливает ключи, SSH и креды Kubernetes

Тихая катастрофа: как enable_auto_commit=True уничтожил RAG-базу без единой ошибки

Observability для AI-агентов: как Dunetrace ловит тихие сбои в реальном времени

Runtime enforcement для агентов: почему middleware надёжнее промпт-гардов

Детерминированный tool-routing: почему LLM — плохой диспетчер инструментов

Почему я строю Local Mission Control вместо централизованного графа агентов

Инцидент в Meta: что случается когда AI-агент действует без барьеров

Router skills: обязательный паттерн когда библиотека навыков агента перерастает 50 штук

n8n AI Builder vs Claude Code: где провести границу и не потратить 3 часа на дебаггинг

RAG для страховых документов: почему стандартный чанкинг не работает и как это починить

Архитектура n8n-workflow: как не утонуть в спагетти через 3 месяца

Когда автоматизация — ошибка: 30 кейсов и паттерны плохих решений

Автодиагностика агентных сбоев: как читать LangChain-трейсы и находить корень проблемы

Стек агентной коммуникации: что находится ниже MCP и почему это важно

Скрытая проблема мультиагентных систем: почему память — это распределённые данные

Почему системный промпт — плохая линия защиты: архитектура безопасности агентов

Чеклист зрелости workflow: 5 проверок тихих отказов перед продакшном в n8n

Под капотом агентных фреймворков: шпаргалка для выбора архитектуры

Регуляторный ультиматум для AI-продуктов: что такое audit trail и почему он обязателен

Дебаггинг AI-агентов: как flight recorder помогает найти место сбоя

Agent-ready дизайн: как переделать SaaS-интерфейс под автономных AI-пользователей

Красная команда для AI-агентов: как тренировать систему не выполнять опасные команды

Как тестировать AI-агентов: TestThread и подход «pytest для агентов»

Самообучающийся AI-агент: трёхуровневая память, самооценка и генерация инструментов на лету

Deep Agents от LangChain: что умеет официальный harness для сложных агентных задач

Почему «работающий» workflow — это не то же самое, что надёжный: история про $14k и невидимый сбой

Инфраструктура мультиагентных систем: обзор платформ нового поколения

Контекстная инженерия: модный термин или реальный навык? Что за ним стоит

OTP vs CrewAI vs A2A vs MCP: словарь мультиагентной архитектуры

OTP, CrewAI, A2A, MCP — словарь мультиагентной архитектуры

Скрытый баг RAG: когда система врёт уверенно и тихо

6 месяцев боли с AI-агентами в продакшне: что я понял про архитектуру

Почему ваши агенты нестабильны: промпт — плохой исполнительный слой

Runtime enforcement для AI-агентов: как не дать агенту сделать что-то непоправимое

Безопасный запуск кода AI-агентов: как устроены быстрые песочницы

Архитектура мультиагентной системы с отказоустойчивостью: разбор реального кейса

Как отлаживать AI-агентов не сжигая бюджет: replay debugger для LangChain

Как не обанкротиться на power users: финансовый контроль AI-продукта в реальном времени

Автоматический контент-конвейер с n8n: один блог-пост = 5 платформ

AI-чатбот как антипродажа: почему support deflection убивает B2B-конверсию

Как не уничтожить свой проект при vibe coding: 7 обязательных правил

Невидимая работа в AI-продуктах: что съедает 80% времени разработки

Как мы будем доверять AI-агентам: кредитный рейтинг для автономных систем

Почему ваш рабочий workflow всё равно сломается: 3 скрытых причины

Heartbeat для AI-агентов: как обнаруживать сбои в реальном времени, а не постфактум