Техническое руководство для стартапов: ИИ агенты

Техническое руководство для стартапов

ИИ-агенты

Введение

Разработка ИИ-агентов представляет собой парадигмальный сдвиг в программной инженерии, позволяя стартапам автоматизировать сложные рабочие процессы, создавать принципиально новые пользовательские сценарии и решать бизнес-задачи, которые ранее были технически невыполнимы.

Однако переход от перспективного прототипа к агенту, готовому к эксплуатации в продакшене, означает решение целого ряда новых задач. Как управлять недетерминированным поведением агентов? Как проверять их сложные цепочки рассуждений? И, что особенно важно, с чего начать?

Это техническое руководство поможет ответить на подобные вопросы.

Оно предлагает систематический, ориентированный на эксплуатацию маршрут для освоения новой области и предназначено для стартапов и разработчиков, стремящихся максимально быстро использовать потенциал агентных систем.

Вы узнаете основные концепции агентных систем — от их ключевых архитектурных компонентов до принципов, обеспечивающих надёжную и ответственную работу в продакшене.

Кроме того, вы познакомитесь со всем спектром инструментов, которые делают создание и использование агентов на Google Cloud более эффективным: от разработки с полным контролем кода с помощью Agent Development Kit (ADK) и автоматизации эксплуатации с помощью Agent Starter Pack до создания агентов без кода через Google Agentspace.

Фокус этого руководства
Экосистема агентного ИИ предлагает множество инструментов, библиотек и подходов для построения когнитивных архитектур. Среди них — открытые фреймворки от Google, такие как Genkit и решения Google Cloud для диалогового ИИ, а также популярные open-source библиотеки вроде LangChain и CrewAI.

Введение

Независимо от того, проверяете ли вы идею, создаёте MVP или поддерживаете продукт в продакшене, это руководство будет полезно на всех этапах вашего проекта.

Как пользоваться этим руководством

Новичок в ИИ-агентах?
Начните с раздела 1, чтобы освоить основные концепции.
Готовы создавать?
Переходите к разделу 2, чтобы создать своего первого агента с помощью ADK.
Агент уже создан?
Погрузитесь в раздел 3, чтобы сделать его безопасным, стабильным и масштабируемым.
Нужна дополнительная поддержка?
Используйте Gemini Kit для ускоренного прототипирования и подайте заявку на участие в программе Google for Startups Cloud Program, чтобы получить экспертную поддержку и до 350 000 долларов США в виде кредитов на Google Cloud.

Это руководство в первую очередь ориентировано на ADK (Agent Development Kit) и раскрывает ключевые концепции и архитектурные паттерны, которые позволяют создавать надёжных и масштабируемых агентов на Google Cloud, сохраняя при этом возможность интеграции с другими предпочитаемыми инструментами и библиотеками.

Раздел 1: Основные концепции ИИ-агентов

Область агентного ИИ стремительно развивается.
Этот раздел даёт базовые знания об ИИ-агентах, объясняя их ключевые концепции, назначение и принципы работы. Он также подробно описывает соответствующие инструменты и сервисы, доступные в Google Cloud.

Этот подкаст был создан с помощью NotebookLM по запросу:
«В роли ведущего подкаста создай разговорный и познавательный эпизод для руководства “Техническое руководство для стартапов: ИИ-агенты”, ориентированный на техническую аудиторию — основателей стартапов и разработчиков.
В подкасте должны быть рассмотрены три основных пути использования ИИ-агентов (создание, использование, партнёрство), с описанием таких инструментов, как Agent Development Kit (ADK) и готовые агенты Gemini.
Далее необходимо объяснить ключевые компоненты агента, включая модели, инструменты, оркестрацию и среду выполнения. Также осветить, как обеспечить доверие и мощность с помощью таких методов, как привязка (grounding) с использованием Retrieval-Augmented Generation (RAG) и применение мультимодальности.
Завершить подкаст кратким резюме и чётким призывом к действию — направить слушателей к ресурсам Google».

Предпочитаете аудио?
Прослушайте подкастную версию этого раздела, созданную с помощью NotebookLM.

Обзор экосистемы агентов Google Cloud

Строительство ИИ-агентов, готовых к эксплуатации в продакшене, требует гораздо большего, чем просто выбор большой языковой модели. Полноценное решение предполагает масштабируемую инфраструктуру, надёжные инструменты интеграции данных и архитектурные паттерны, способные удовлетворить разнообразные технические требования.

Google Cloud поддерживает комплексную разработку агентных систем — независимо от того, создаёте ли вы собственные агенты, используете готовые агенты Google Cloud или подключаете агентов от партнёров. В основе этой экосистемы лежат Model Context Protocol (MCP) и Agent2Agent (A2A) protocol — общий фреймворк, разработанный для обеспечения совместимости. Благодаря ему агенты могут эффективно взаимодействовать в экосистеме Google Cloud, независимо от их происхождения или внутренней архитектуры.

«Агентные рабочие процессы — это следующий рубеж.
Речь уже не просто о том, чтобы задать вопрос и получить ответ. Речь о том, чтобы поставить перед ИИ сложную цель — например, «спланируй запуск этого продукта» или «реши проблему в цепочке поставок» — и позволить ему самостоятельно организовать выполнение многоэтапных задач для достижения этой цели. Это кардинально изменит производительность труда».
— Томас Куриан, генеральный директор Google Cloud

Создавайте собственные агенты

Если вы хотите создавать кастомные агенты, ориентированные на решение конкретных задач, — этот путь для вас. Здесь у вас есть два варианта: подход с приоритетом кода (code-first) для максимального контроля или подход с приоритетом приложения (application-first) для ускоренной разработки.

Agent Development Kit для кастомной разработки с акцентом на код

Этот подход лучше всего подходит разработчикам, техническим стартапам и командам, которым необходим высокий уровень контроля над поведением агента. Agent Development Kit (ADK) от Google Cloud создан именно для такой кастомной разработки.

ADK даёт разработчикам возможность создавать, управлять, оценивать и разворачивать ИИ-агентов. Он предоставляет надёжную и гибкую среду для создания как диалоговых, так и недиалоговых агентов, способных справляться со сложными задачами и рабочими процессами.

Агенты, созданные с помощью ADK, можно легко развернуть на Vertex AI Agent Engine — управляемой масштабируемой среде, специально разработанной для этой цели. Поскольку такие агенты упакованы в контейнеры, их также можно развернуть в любой среде, поддерживающей контейнеры, например, в Cloud Run или Google Kubernetes Engine (GKE).

Ключевые возможности

Логика оркестрации: основной процесс рассуждений агента (например, фреймворк ReAct), позволяющий планировать и выполнять последовательность вызовов инструментов и действий для достижения сложной цели.
Определение и регистрация инструментов: интерфейс для создания кастомных функций и API, позволяющий агенту взаимодействовать с данными, API и внешними системами.
Управление контекстом: система, предоставляющая агенту память, чтобы он мог учитывать предпочтения пользователя и историю диалогов в ходе нескольких взаимодействий, обеспечивая целостный опыт.
Оценка и наблюдаемость: набор встроенных инструментов для тщательного тестирования качества агента, отладки пошаговых рассуждений и мониторинга его работы в продакшене.
Контейнеризация: возможность упаковать агента в стандартный переносимый контейнер, готовый к развертыванию в любой совместимой облачной среде.
Композиция из нескольких агентов: возможность создавать системы, в которых несколько специализированных агентов могут сотрудничать, делегировать задачи и совместно решать проблемы.

Почему это важно для стартапов

Автоматизируйте не только диалоги, но и рабочие процессы: внедрите многошаговую логику оркестрации для решения сложных бизнес-задач, получив операционное преимущество, необходимое небольшой команде для масштабирования.
Создайте защищённый продукт: подключите агентов напрямую к своим проприетарным API и внутренним данным, чтобы построить продукт с реальным конкурентным преимуществом.
Помните своих клиентов для по-настоящему персонализированного опыта: плавно интегрируйте краткосрочный диалоговый контекст с долгосрочными знаниями, позволяя агенту вспоминать прошлые взаимодействия и выстраивать настоящие отношения с клиентами.
Запускайте с уверенностью: используйте встроенную оценку и наблюдаемость для тщательного тестирования и отладки агента, гарантируя выпуск надёжного продукта, готового к эксплуатации.
Сосредоточьтесь на продукте, а не на инфраструктуре: упакуйте агента в стандартный контейнер, чтобы быстрее и надёжнее выйти в продакшен, используя стандартные практики DevOps.

Google Agentspace для разработки с приоритетом приложения

Второй основной путь создания агентов — через Google Agentspace. В отличие от кодоориентированного ADK, Google Agentspace позволяет управлять всей вашей ИИ-командой и даёт возможность нетехническим сотрудникам создавать кастомные агенты с помощью конструктора без кода.

Такой платформенный подход идеально подходит для управления множеством агентов и масштабирования их использования в зрелом стартапе с растущим набором SaaS-приложений.

Ключевые возможности

Единый поиск по всей компании: подключается к нескольким SaaS-приложениям и выполняет сквозной поиск по ним.
Мультимодальный синтез данных: понимает и объединяет информацию из текста, изображений, графиков и видео с учётом прав доступа к данным.
Библиотека готовых агентов: предоставляет набор готовых к использованию агентов для сложных задач, таких как глубокий анализ или генерация идей.
Конструктор кастомных агентов без кода: включает Agent Designer — инструмент, с помощью которого нетехнические пользователи могут создавать агентов через интерфейс на основе текстовых запросов (промптов).

Почему это важно для стартапов

Устранение разрозненности данных: команды без инженерного бэкграунда могут создавать и разворачивать агентов, способных получать доступ к фрагментированным источникам данных и приложениям и действовать в них.
Автоматизация рабочих процессов: создавайте кроссплатформенные сценарии без привлечения дефицитных инженерных ресурсов, освобождая вашу инженерную команду для работы над ключевыми функциями продукта.

Используйте агенты Google Cloud

Управляемые агенты позволяют быстро создавать прототипы и легко интегрировать ИИ в существующие приложения, чтобы вы могли сосредоточиться на бизнес-логике, а не на управлении инфраструктурой. Они особенно полезны, если у вас ограничены инженерные ресурсы.

Gemini Code Assist

Gemini Code Assist — это ИИ-ассистент для разработчиков.
Он интегрируется в различные этапы жизненного цикла разработки ПО и оказывает помощь через расширения для IDE, командную строку, интеграцию с GitHub и встроенные функции в сервисах Google Cloud.

Почему это важно для стартапов
Gemini Code Assist действует как усилитель продуктивности. Он может выполнять задачи разработки ПО на всех этапах жизненного цикла — от рутинных (написание шаблонного кода) до сложных (рефакторинг нескольких файлов).

Gemini Cloud Assist

Gemini Cloud Assist — это ИИ-эксперт для вашей среды Google Cloud, предоставляющий контекстно-зависимую помощь в управлении инфраструктурой и эксплуатацией приложений.
Он использует контекст вашего проекта — включая идентификаторы проектов Google Cloud и конкретную страницу продукта, которую вы просматриваете в консоли, — чтобы адаптировать свои рекомендации под вашу ситуацию.

Ключевые возможности

Проектирование и развёртывание: В Центре проектирования приложений вы можете описать желаемые результаты инфраструктуры на естественном языке. Gemini Cloud Assist автоматически создаёт архитектурные схемы и шаблоны приложений, которые можно экспортировать в формате Terraform для интеграции в существующие процессы Infrastructure as Code (IaC).
Диагностика и устранение неполадок: Интегрируется с Cloud Observability, чтобы суммировать сложные записи в логах и объяснять сообщения об ошибках. При более серьёзных проблемах вы можете запустить автоматическое расследование: Gemini проанализирует логи и метрики, чтобы выявить первопричину сбоя.

Почему это важно для стартапов
Управление облачной инфраструктурой может занимать много инженерного времени. Gemini Cloud Assist освобождает ваши ресурсы, позволяя сосредоточиться на разработке продукта.

Ключевые компоненты каждого агента

Модели: выбор и дообучение

Представьте модель как «мозг» вашего агента. С её помощью агент может читать запросы пользователей, понимать, что нужно сделать, и генерировать разумные ответы.

Как выбрать подходящую модель

Выбор правильной модели — это не про то, чтобы взять самую мощную из доступных, а про поиск оптимального баланса между возможностями, скоростью и стоимостью для вашей конкретной задачи. Каждую модель можно оценить по этим трём взаимоисключающим характеристикам, и цель — подобрать наиболее эффективный вариант для конкретной работы.

По мере роста возможностей модели обычно растут и её стоимость, и задержка (latency). Самая распространённая ошибка — чрезмерные инвестиции в вычислительную мощность там, где она не требуется, что приводит к неэффективным расходам и замедлению работы.

Оптимальная стратегия — выбирать наиболее эффективную модель для каждой конкретной задачи.

Этот принцип особенно мощен на уровне всей системы.
Надёжные когнитивные архитектуры используют множество специализированных агентов, каждый из которых динамически выбирает самую лёгкую модель для своей подзадачи. Например, тяжёлая модель резервируется для сложных рассуждений, а лёгкая обрабатывает рутинные запросы. Такой мультиагентный подход даёт архитектурную гибкость, позволяя оптимизировать стоимость и производительность всей системы, а не только отдельного компонента.

Сундар Пичаи, генеральный директор Google и Alphabet:
«ИИ-агенты — это системы, сочетающие интеллект передовых ИИ-моделей с доступом к инструментам, чтобы действовать от вашего имени под вашим контролем».

Примеры использования

Прототипирование на ранних этапах и задачи с высокой нагрузкой
• Профиль модели: лёгкая и недорогая модель, например Gemini 2.5 Flash-Lite.
• Обоснование: это самая экономичная и быстрая модель из линейки 2.5, отлично подходящая для задач с высоким объёмом и чувствительных к задержкам, таких как перевод и классификация.
Приложения с высокой нагрузкой и требованиями к качеству
• Профиль модели: сбалансированная модель среднего уровня, например Gemini 2.5 Flash.
• Обоснование: эта модель оптимизирована для баланса между качеством, стоимостью и скоростью. Она обеспечивает высокую производительность в сложных задачах при более низкой цене по сравнению с Pro-версией, что делает её идеальной для продакшен-приложений, которым нужно быть одновременно умными и экономичными.
Сложные многошаговые рассуждения и генерация кода на передовом уровне
• Профиль модели: продвинутая модель для сложных рассуждений, например Gemini 2.5 Pro.
• Обоснование: это самая мощная модель для самых сложных задач, где производительность критически важна.

Gemini 2.5 Pro показала лучшие в отрасли результаты на передовых бенчмарках: 82,2% на Aider Polyglot (кодирование) и 86,4% на GPQA Diamond (рассуждения). Данные на июнь 2025 года.

Дообучение модели (Model tuning)

После того как вы выберете модель, соответствующую вашим требованиям по стоимости, задержке и качеству, у вас может появиться возможность дообучить её (fine-tune). Это позволяет адаптировать её знания и стиль под конкретные бизнес-задачи с помощью тщательно отобранного набора ваших собственных высококачественных примеров.

Возможность дообучения зависит от конкретной модели. В портфеле моделей Google эта функция поддерживается для семейства открытых моделей Gemma и для отдельных версий Gemini. Важно ознакомиться с документацией и лицензионным соглашением каждой модели, чтобы убедиться, что дообучение разрешено и технически поддерживается.

Пример: дообучение агента поддержки

Предположим, вы создаёте агента технической поддержки для своего SaaS-продукта. Вы можете дообучить модель на наборе из тысяч прошлых обращений в поддержку и их идеальных ответов, чтобы помочь модели понять типичные проблемы и научиться отвечать в тоне, соответствующем стилю вашей команды поддержки.

Пример использования

Дообучение — это не то же самое, что привязка (grounding).
Дообучение адаптирует стиль модели и уточняет её знания для конкретной задачи.
Привязка же подключает модель к актуальным и проверяемым источникам данных, чтобы гарантировать фактологическую точность её ответов. Подробнее о привязке — ниже.

Примечание
Чтобы узнать, какие модели можно дообучать в Vertex AI, ознакомьтесь с официальной документацией.

Инструменты: расширение возможностей агента

Инструменты — это заранее определённые возможности, которые позволяют агенту делать больше, чем способна его базовая модель рассуждений: от выполнения простых внутренних вычислений до взаимодействия с внешними системами через API. Они устраняют разрыв между рассуждениями агента и его способностью получать новую информацию или выполнять операции с сохранением состояния.

Инструменты могут включать самые разные компоненты:

Внутренние функции и сервисы: проприетарная логика, написанная вашей командой.
API: подключения как к внутренним сервисам, так и к внешним сторонним сервисам.
Источники данных: возможность выполнять запросы к базам данных, векторным хранилищам или другим репозиториям информации.
Другие агенты: в мультиагентной системе один агент может использовать другого специализированного агента как инструмент.

Архитектура данных для агентных систем

Данные лежат в основе как краткосрочной, так и долгосрочной памяти агента. Надёжная архитектура данных должна удовлетворять трём разным потребностям:
— постоянное хранилище для извлечения долгосрочных знаний,
— доступ с низкой задержкой для обработки краткосрочного контекста диалога,
— надёжный журнал для аудита транзакций.

Сопоставляя каждую из этих потребностей с конкретными сервисами Google Cloud, вы можете быть уверены, что каждое архитектурное решение будет одновременно экономически эффективным и масштабируемым, а также будет отвечать текущим бизнес-требованиям и целям по скорости вывода продукта на рынок.

1. База долгосрочных знаний (привязка и извлечение)

Долгосрочная память агента — это основа его интеллекта, привязки к фактам (grounding) и персонализации. Она принципиально отличается от быстрого краткосрочного контекста живого диалога.

Надёжная архитектура долгосрочной памяти должна включать три ключевых компонента:
— структурированную базу знаний для фактологической привязки с помощью Retrieval-Augmented Generation (RAG);
— постоянное хранилище истории взаимодействий с пользователем, чтобы обеспечить непрерывный и персонализированный опыт;
— операционное хранилище данных (data lake) для «сырых» материалов — таких как транскрипты диалогов и состояния рабочих процессов, — которые могут использоваться в сложных когнитивных процессах и для будущего анализа.

2. Рабочая память (контекст диалога и краткосрочное состояние)
Этот уровень управляет временной информацией, необходимой для выполнения текущей задачи или ведения диалога.
Он должен обеспечивать доступ с чрезвычайно низкой задержкой, чтобы поддерживать отзывчивый пользовательский опыт.

3. Транзакционная память (управление состоянием и аудит действий)
Этот уровень отвечает за запись действий и изменений состояния с высокой степенью согласованности и целостности.
Он служит системой учёта («системой записи»), часто требуя гарантий ACID для обеспечения надёжности.

Оркестрация агентов: исполнительная функция

Оркестрация — это операционное ядро, которое направляет агента при выполнении многошаговой задачи. Для любого процесса, требующего более одного действия, именно оркестрация определяет, какие инструменты нужны, в какой последовательности их следует использовать и как объединить их результаты для достижения конечной цели.

Как «исполнительная функция» агента, оркестрация отвечает за планирование и принятие решений. Автоматизируя сложные бизнес-процессы, она даёт небольшим стартап-командам мощное операционное преимущество.

Концепции оркестрации и когнитивная архитектура

Распространённым и эффективным паттерном оркестрации является ReAct (Reason + Action) — фреймворк, объединяющий способности больших языковых моделей к рассуждению и действиям.

ReAct создаёт динамический цикл из нескольких шагов, в котором модель генерирует как цепочки рассуждений («мысли»), так и действия, специфичные для задачи, чередуя их. Это обеспечивает синергию: рассуждения помогают модели отслеживать и корректировать план действий, а действия собирают информацию из внешних инструментов, чтобы обогатить процесс рассуждений.

Вот как это работает:

Рассуждение (Reason): агент анализирует цель и текущее состояние, формируя гипотезу о следующем оптимальном шаге и определяя, нужен ли для этого инструмент.
Действие (Act): агент выбирает и вызывает подходящий инструмент.
Наблюдение (Observe): агент получает результат от инструмента. Эта новая информация интегрируется в контекст агента и используется на следующем шаге рассуждения.

Пример: обработка возврата с оркестрацией по схеме ReAct

Рассуждение: Пользователь хочет оформить возврат. Первым шагом нужно понять правила компании по возвратам.
Действие: Использовать инструмент semantic_search, чтобы найти в внутренней базе знаний информацию по запросу «политика возвратов».
Наблюдение: Инструмент возвращает: «Полный возврат средств доступен для всех товаров в течение 30 дней с даты покупки».
Рассуждение: Политика требует указать дату покупки. Эта информация по конкретному заказу пользователя должна быть получена из CRM.
Действие: Вызвать функцию get_order_details из инструмента CRM, передав ID пользователя.
Наблюдение: Функция возвращает объект заказа, включая purchase_date: ‘2025-07-20’.
Рассуждение: Сегодня 29 июля 2025 года. Покупка была совершена 9 дней назад — это укладывается в 30-дневный срок. Условия соблюдены, можно инициировать возврат.
Действие: Вызвать инструмент process_refund с ID заказа и суммой возврата.
Наблюдение: Инструмент возвращает статус: ‘success’.
Финальный ответ: «Ваш возврат успешно обработан. Средства поступят на ваш счёт в течение 3–5 рабочих дней».

Примеры использования

Автоматизированное подключение клиентов: Агент может направлять нового пользователя через процесс настройки. Сначала он создаёт аккаунт через API, затем отправляет приветственное письмо, а в завершение проверяет в базе данных, завершил ли пользователь первое действие — и при необходимости отправляет напоминание.
Проактивный мониторинг и устранение неполадок: Оркестрация может запускаться по алерту из системы мониторинга. Агент сначала запрашивает логи через Cloud Logging, затем, на основе анализа, перезапускает под в GKE с помощью kubectl, и в конце уведомляет дежурную команду в Slack.
Сложная квалификация лидов: Агент по продажам может обогащать данные о новом лидах, получая информацию о компании через API. Он проверяет в CRM, является ли лида существующим клиентом, и на основе этого решает — передать ли его старшему менеджеру или добавить в цепочку nurturing.

Освоение оркестрации — ключ к переходу от простых агентов, выполняющих однократные запросы, к сложным автономным системам, способным решать задачи, которые ранее были технически невозможны. Это открывает новое поколение приложений и пользовательских сценариев.

Среда выполнения (Runtime): развёртывание агентов в масштабе

Развёртывание рабочего прототипа агента в продакшен-среде требует надёжной инфраструктуры времени выполнения (runtime).
Среда выполнения обеспечивает масштабируемое развёртывание агентов, превращая прототип в надёжный продукт, способный справляться со сложными операционными задачами — такими как безопасность, балансировка нагрузки и обработка ошибок, особенно в периоды непредсказуемого роста пользовательской активности.

Концепции и архитектура среды выполнения

Среда выполнения, готовая к эксплуатации в продакшене, должна обеспечивать несколько ключевых возможностей:

Масштабируемость: инфраструктура должна автоматически масштабироваться для обработки переменной нагрузки — от нуля до миллионов запросов. Это включает как балансировку на основе запросов, так и автомасштабирование на основе ресурсов для эффективного управления вычислительными требованиями.
Безопасность: среда выполнения должна предоставлять защищённую среду исполнения, управляя идентификацией, сетевыми правилами доступа и защищёнными каналами связи (например, TLS), чтобы защитить как самого агента, так и данные, к которым он обращается.
Надёжность и наблюдаемость: система должна включать механизмы обработки ошибок, автоматических повторных попыток и комплексного мониторинга. Это подразумевает логирование действий агента и результатов работы инструментов, а также сбор метрик по производительности и использованию ресурсов для диагностики и устранения проблем.

Ваш выбор среды выполнения напрямую влияет на операционные издержки и способность к масштабированию.

Vertex AI Agent Engine: стартап на стадии посевного финансирования с небольшой инженерной командой развёртывает своего первого агента техподдержки — переход от рабочего прототипа к масштабируемой и безопасной продакшен-точке занимает дни, а не недели.
Cloud Run: стартап, испытывающий быстрый, но непредсказуемый рост новой ИИ-функции, разворачивает агента на ADK в этой бессерверной архитектуре, оплачивая вычисления только тогда, когда агент действительно обрабатывает запросы. Это экономически эффективный способ справляться со всплесками трафика без избыточного выделения ресурсов.
Google Kubernetes Engine (GKE): стартап на стадии Series B с устоявшейся командой платформенной инженерии и десятками микросервисов решает разместить нового внутреннего агента автоматизации в существующем кластере GKE. Это позволяет использовать уже настроенные процессы CI/CD, политики безопасности и панели мониторинга, гарантируя, что агент соответствует тем же операционным стандартам, что и остальные продакшен-сервисы.

Роль привязки (grounding) в агентных системах

Надёжность и полезность агента зависят от его способности давать точные и достоверные ответы на основе проверяемых фактов — процесс, известный как привязка (grounding). В этом разделе рассматривается эволюция методов привязки и предложен пошаговый путь к созданию всё более сложных и надёжных агентов.

Мы начинаем с базовой архитектуры RAG (Retrieval-Augmented Generation), которая обеспечивает привязку агента за счёт извлечения текста на основе семантического сходства.
Затем переходим к GraphRAG, который обогащает привязку за счёт понимания явных связей между данными в виде знаний, организованных в граф.
Наконец, мы рассмотрим Agentic RAG, при котором агент перестаёт быть пассивным получателем информации и становится активным участником процесса поиска: он самостоятельно рассуждает и выполняет многошаговые стратегии, чтобы найти наилучший возможный ответ.

RAG: первый фундаментальный шаг

Первый шаг на пути к продвинутой привязке — это архитектурный паттерн RAG. Этот подход улучшает ответы большой языковой модели (LLM) за счёт предварительного извлечения релевантной информации из внешней базы знаний перед генерацией ответа. Вместо того чтобы полагаться исключительно на встроенные знания, полученные при обучении, агент выполняет семантический поиск, чтобы найти проверяемые данные, которые затем передаются модели в качестве контекста. Это обеспечивает базовый уровень достоверных и обоснованных ответов.

Однако, несмотря на свою фундаментальность, такой простой подход «сначала найди, потом сгенерируй» рассматривает знания как плоский набор несвязанных фактов. Это мощная техника для прямых вопросов и ответов, но она недостаточна для сложных запросов, требующих глубокого понимания взаимосвязей между элементами данных.

Преимущества RAG для агентных систем

Агенты получают доступ к самой свежей информации: извлекаемые данные актуальнее, чем дата последнего обучения модели, что делает поведение агентов более своевременным и релевантным.
Агенты становятся точнее: RAG значительно снижает риск генерации ответов, которые могут привести к ошибочным или неподходящим действиям агента.
Более быстрые ответы: векторные эмбеддинги и специализированные базы данных обеспечивают молниеносный семантический поиск по огромным массивам данных, позволяя агентам принимать оперативные и своевременные решения.
Более полное понимание контекста: рабочий процесс RAG — включающий инжест, парсинг, разбиение на фрагменты, создание эмбеддингов, хранение и извлечение — применим не только к тексту, но и к изображениям и другим типам данных. Благодаря такому глубокому пониманию агенты могут выполнять более сложные многошаговые рассуждения.

Готовое управляемое решение RAG от Google Cloud называется Vertex AI Search. Оно упрощает интеграцию источников данных и также поддерживает использование open-source или сторонних инструментов. Vertex AI RAG Engine предоставляет фреймворк для разработки приложений на основе LLM с расширенным контекстом, которые дают точные и контролируемые ответы, соответствующие вашим внутренним знаниям и политикам. Это идеальный выбор для критически важных задач стартапов: поддержка клиентов, внутреннее управление знаниями, соответствие нормативным требованиям.

Vertex AI RAG Engine в действии

Векторные базы данных: поиск по смыслу

Возможность искать по смыслу, а не только по ключевым словам, обеспечивается благодаря векторным эмбеддингам. Эти числовые представления отражают концептуальную суть данных (текста, изображений и т.д.), позволяя системе находить релевантную информацию независимо от формулировки вопроса.

Векторные базы данных — это инфраструктура, делающая такой поиск возможным в масштабе. Это высокоспециализированные системы, предназначенные для хранения, индексации и запроса миллионов эмбеддингов с чрезвычайно низкой задержкой, необходимой для отзывчивой работы агентов.

Как это работает:

Данные преобразуются в векторные эмбеддинги: ML-модель размещает семантически близкие элементы рядом друг с другом в многомерном векторном пространстве.
Хранение и индексация: векторная база данных сохраняет эти эмбеддинги и строит специализированные индексы для быстрого и эффективного поиска по сходству.
Запрос: запрос пользователя преобразуется в эмбеддинг с помощью той же модели. База данных находит в индексе эмбеддинги, наиболее близкие к эмбеддингу запроса, и таким образом извлекает наиболее релевантную информацию для привязки ответа модели.

Улучшение поддержки клиентов

Компания по производству обуви использует векторную базу данных с семантическим поиском для чат-бота поддержки:

Описания товаров, гарантийная информация и разделы FAQ преобразуются в эмбеддинги и хранятся в базе.
Система понимает, что фраза «подходит для людей с широкой стопой» семантически связана с такими понятиями, как «широкая колодка», «экстра-широкая» или «удобная для широких стоп».
Она подбирает релевантные рекомендации по товарам, обеспечивая гораздо лучший клиентский опыт.

Сравните это с ситуацией, если бы компания использовала традиционную базу данных. Запрос вида LIKE ‘%подходит для людей с широкой стопой%’ не вернул бы результатов, потому что точная фраза отсутствует в базе.

Пример использования

Используйте API проверки привязки (check grounding API), чтобы убедиться, что ответы ИИ основаны на актуальных и проверяемых данных.
Используйте Vertex AI Search и Vertex AI RAG Engine, чтобы привязывать ответы к вашему проприетарному контенту.

GraphRAG: более умная привязка

GraphRAG строит граф знаний, благодаря чему агент понимает не просто схожесть фраз, а связи между понятиями.
Например, медицинский ИИ-ассистент должен понимать цепочку «симптомы → причины → методы лечения», а не просто извлекать связанные фрагменты текста.

Дуве Кила, генеральный директор Contextual AI:

«Раньше считалось, что производительность фундаментальных моделей будет расти экспоненциально, но сейчас мы подходим к точке перегиба, где этот рост выходит на плато. Настоящее конкурентное преимущество теперь — в специализации и инженерии контекста. Agentic RAG становится центральным элементом контекстного слоя, позволяя ИИ-агентам итеративно находить, извлекать и рассуждать над достоверными данными до генерации финального ответа.
Будущее — за мульти-LLM: разные модели для разных задач, объединённые универсальным контекстным слоем, независимым от конкретных моделей и данных, что раскрывает их полный потенциал».

Agentic RAG: динамическое рассуждение и поиск

Самый мощный подход к привязке — это Agentic RAG, методика, которая превращает агента из пассивного получателя извлечённых данных в активного участника процесса поиска знаний, способного рассуждать. Следуя фреймворкам вроде ReAct, агент может анализировать сложный запрос, составлять многошаговый план и последовательно выполнять несколько вызовов инструментов, чтобы найти наилучшую возможную информацию.

Яркий пример такого агентного паттерна — привязка с помощью Google Search. Вы можете использовать семейство моделей Gemini 2.5, чтобы интегрировать продвинутое рассуждение, позволяя моделям чередовать возможности поиска с внутренними процессами мышления для ответа на сложные многоэтапные запросы и выполнения задач с длительным горизонтом планирования. Агент может полностью автоматизировать весь рабочий процесс: проанализировать запрос, сформулировать и выполнить точные поисковые запросы, а затем синтезировать финальный, обоснованный ответ с указанием источников.

Агент, построенный на основе семейства моделей Gemini, выходит за рамки простого распознавания контента и переходит к активному многошаговому решению задач. Например, такой агент может:

Проанализировать фотографию, чтобы определить конкретный вид растения, а затем автоматически найти подробные инструкции по уходу за ним.
Обработать аудиопоток из обращения в поддержку: не только транскрибировать слова, но и определить эмоциональное состояние клиента (например, раздражение), чтобы корректно повысить приоритет обращения.

Эта способность воспринимать и рассуждать над разными типами данных превращает агента из простого процессора данных в инструмент решения проблем, который понимает и взаимодействует с миром более целостным образом.

Пример: проверка наличия товара в реальном времени

Определите функцию check_inventory, которая принимает product_ID и возвращает текущий уровень запасов из вашей системы учёта в реальном времени. Аналогично, другая функция — check_warranty_status — может принимать product_ID и возвращать информацию о гарантии непосредственно из вашей системы управления гарантиями.

Когда клиент спрашивает о наличии конкретного товара, ИИ-агент:

Идентифицирует товар: использует семантический поиск (на основе векторной базы данных), чтобы точно определить модель обуви, о которой спрашивает клиент, даже если описание неточное или расплывчатое.
Инициирует действие: распознаёт необходимость получить актуальные данные о наличии и вызывает функцию check_inventory через механизм вызова функций (function calling).

Используйте Vertex AI и векторный поиск Google Cloud, чтобы добавить эту функциональность в вашего агента.

product_lookup
check_inventory
«В наличии ли новые кроссовки SolarFlare?»
Инструменты / Функции
«Да! Кроссовки SolarFlare есть в наличии. Сейчас у нас 82 пары.»
Векторная база данных
Система учёта запасов

Даёт ответ в реальном времени: функция check_inventory выполняется, получает актуальные данные о запасах из вашей системы и возвращает их ИИ-агенту. Агент немедленно сообщает клиенту точную информацию о наличии.

Такое сочетание поиска (понимания, какая информация релевантна) и действий (выполнения операций в реальном времени) делает ваших ИИ-агентов умнее, быстрее и гораздо полезнее.

Рабочий процесс Agentic RAG в Google Cloud

Google Cloud предоставляет управляемые сервисы, которые обрабатывают весь цикл Agentic RAG:

Генерация эмбеддингов и индексация: первый шаг — преобразование ваших данных в векторные эмбеддинги. Один из вариантов — модель Gemini Embedding, доступная как в Vertex AI, так и в Gemini API, поддерживающая более 100 языков. Эта и другие модели входят в состав набора Vertex AI Embedding APIs.
Хранение и индексация: векторные эмбеддинги сохраняются и индексируются в Vertex AI Vector Search — полностью управляемой высокопроизводительной векторной базе данных, которая автоматически создаёт специализированные индексы для быстрого и эффективного поиска по сходству в масштабе.
Поиск и рассуждение: когда пользователь отправляет запрос, он преобразуется в эмбеддинг, и Vertex AI Vector Search находит наиболее релевантную информацию. Этот целевой контекст затем передаётся LLM для генерации финального, обоснованного ответа.

Используйте подход «поиск и повторная ранжировка» (retrieve and re-rank).

Чтобы сбалансировать полноту (recall — нахождение всех релевантных документов) и точность (precision — уверенность, что каждый найденный документ действительно релевантен), применяйте двухэтапный подход «поиск и повторная ранжировка».

Сначала расширяется охват поиска: Vertex AI Vector Search настраивается на извлечение большего, чем необходимо, набора кандидатов. Затем этот расширенный набор передаётся LLM или специальному сервису повторной ранжировки, который отбирает наиболее релевантные документы и отбрасывает нерелевантные или семантически противоположные.

От поиска к рассуждению: стратегическое преимущество

Agentic RAG — это фундаментальный скачок: он выходит за рамки простого извлечения информации и переходит к настоящему решению задач.
Наделяя агента активной ролью и способностью к рассуждению, разработчики могут создавать системы, способные выполнять сложные многошаговые запросы и задачи с длительным горизонтом планирования — именно это и определяет возможности ИИ-агентов следующего поколения.
Для стартапа освоение этого подхода — ключ к созданию защищённого, по-настоящему интеллектуального продукта, способного раскрывать новые рабочие процессы и пользовательские сценарии.

1. Запрос от пользователя: приложение отправляет запрос в API Gemini с подключённым инструментом Google Search.
2. Анализ запроса: модель анализирует запрос и решает, улучшит ли ответ выполнение поиска в Google.
3. Поиск в Google: если необходимо, модель автоматически генерирует один или несколько поисковых запросов и выполняет их.

Другие методы привязки (grounding)

Хотя RAG — это базовая техника, Vertex AI предлагает и другие способы обеспечить точность и надёжность ответов ваших агентов. Например:

Привязка через Google Search: подключите модель к мировым знаниям и широкому спектру тем.
Привязка через Google Maps: используйте данные Google Maps для более точных и контекстно-зависимых ответов.
Привязка Gemini к вашим данным: примените RAG, чтобы связать модель с данными вашего сайта или коллекциями документов.
Привязка Gemini к Elasticsearch: используйте RAG вместе с существующими индексами Elasticsearch и Gemini.

Пример: привязка через Google Search

Когда вы используете инструмент Google Search, модель автоматически управляет всем рабочим процессом: от поиска и обработки информации до цитирования источников.

4. Обработка результатов поиска: модель анализирует результаты, синтезирует информацию и формирует ответ.
5. Обоснованный ответ: API возвращает финальный, удобочитаемый ответ, основанный на результатах поиска. Этот ответ включает текстовый ответ модели и метаданные привязки — поисковые запросы, веб-результаты и ссылки на источники.

Ключевые выводы: выбор компонентов вашего ИИ-агента

Готовы воплотить своё ИИ-видение в жизнь?

Мы здесь, чтобы помочь.

Узнайте, как создавать больше приложений на основе генеративного ИИ, с помощью записей сессий Startup School по запросу.
Начать сейчас
Подайте заявку
Получите до 350 000 долларов США в виде кредитов Google Cloud через программу Google for Startups Cloud Program.
Свяжитесь с нами
Обратитесь в нашу команду поддержки стартапов.
Подпишитесь
Оставайтесь в курсе и получайте все последние обновления, подписавшись на новостную рассылку Google Cloud для стартапов.

Раздел 2: Как создавать ИИ-агентов

Предыдущий раздел определил ключевые компоненты современной агентной системы:
— основную модель рассуждений,
— набор инструментов для выполнения действий,
— архитектуру данных для хранения краткосрочной и долгосрочной памяти агента,
— механизм привязки (grounding) для обеспечения фактологической точности,
— и варианты развёртывания.

Теперь, когда эта концептуальная основа заложена, мы можем перейти к практическому вопросу: как именно создать агента.
Этот раздел предлагает чёткое и практичное руководство по архитектурным решениям, необходимым для создания агента, готового к эксплуатации в продакшене.

Экосистема Google Cloud открыта и гибка — она признаёт, что в индустрии существует множество отличных фреймворков. Однако здесь мы сознательно делаем акцент на ADK (Agent Development Kit) — полной и надёжной реализации, идеально интегрированной в экосистему Google Cloud. Мы также даём конкретные рекомендации, основанные на открытых отраслевых стандартах, таких как Model Context Protocol (MCP) и Agent2Agent (A2A) protocol.

Перед тем как создавать своего агента, ознакомьтесь с 601 реальным примером использования агентов от ведущих компаний мира.

Полный набор инструментов для создания ИИ-агентов

При создании кастомного ИИ-агента для своего стартапа основатели сталкиваются с ключевым компромиссом: скорость разработки против гибкости.

С одной стороны — простые в использовании решения, такие как low-code платформы или готовые продукты. Их быстро внедрить, но они дают меньше контроля, поэтому лучше подходят для стандартных задач.
С другой стороны — высоко гибкие фреймворки или возможность собрать всё с нуля. Такие подходы обеспечивают максимальную кастомизацию, но требуют значительных инженерных ресурсов и глубокой технической экспертизы.

ADK (Agent Development Kit) занимает промежуточную позицию в этом ландшафте разработки.

Изучите ADK

Agent Development Kit (ADK)
Open-source набор инструментов с приоритетом кода для создания, оценки и развёртывания ИИ-агентов.
Model Context Protocol (MCP)
Открытый протокол, стандартизирующий способ, которым приложения предоставляют контекст большим языковым моделям (LLM).
Vertex AI Agent Engine
Управляемая платформа для развёртывания, управления и масштабирования ИИ-агентов в продакшене.
Agent2Agent (A2A) protocol
Открытый стандарт, предназначенный для обеспечения взаимодействия и совместной работы между ИИ-агентами.

Ключевые компоненты для создания ИИ-агентов

Разрабатывайте с помощью ADK

Если вам нужно больше возможностей, чем дают простые low-code инструменты, но при этом вы хотите ускорить разработку, ADK предоставляет контроль для создания уникальной системы совместно работающих агентов, одновременно упрощая сложные технические задачи. Например, такие протоколы, как MCP и A2A, облегчают расширение возможностей агентов.

Более того, ADK дополняет инструменты, которые ваша команда, возможно, уже использует, и интегрируется с более широкой экосистемой Google Cloud, так что вы не привязаны к одному подходу.

Эта гибкость распространяется и на то, как вы запускаете своих агентов после создания: вы можете развернуть их либо на полностью управляемом сервисе, таком как Vertex AI Agent Engine, либо на универсальной бессерверной платформе, такой как Cloud Run. Всё дело в выборе правильной основы под ваши конкретные операционные потребности.

Сундар Пичаи, генеральный директор Google и Alphabet:

«Мы сосредоточены на создании процветающей экосистемы ИИ-агентов. Open-source Agent Development Kit был загружен более миллиона раз менее чем за четыре месяца».

Что можно делать с ADK

1. Создавать сложные, совместные ИИ-системы

ADK изначально ориентирован на мультиагентную архитектуру. С ним легко создавать высокоспециализированные ИИ-решения, автоматизирующие сложные многошаговые рабочие процессы. Благодаря гибкой оркестрации (последовательной, параллельной или динамической) вы можете начать с простых автоматизаций и постепенно перейти к высокоадаптивным системам. Например, вы можете построить интеллектуальную систему управления проектами, в которой «Агент разбивки задач» делегирует подзадачи специализированным «Агентам генерации кода», «Агентам дизайна» и «Агентам документации».

2. Интеграция ИИ в существующие инструменты, агенты и рабочие процессы

ADK построен вокруг богатой экосистемы инструментов, позволяющей вашим агентам взаимодействовать со всеми вашими текущими инструментами и данными. Вы можете подключить агентов к уже используемым продуктивным инструментам — таким как Notion, Slack или CRM, — а также к фреймворкам инструментов, например LangChain и LlamaIndex, или к фреймворкам агентов, таким как LangGraph или CrewAI. Инструменты можно совместно использовать через MCP, а созданных вами агентов — через A2A. Таким образом, вы можете внедрить ИИ-интеллект во все аспекты своей деятельности, улучшая уже существующие инструменты и системы без необходимости радикальной перестройки архитектуры.

Создание сложных рабочих процессов становится проще с ADK

3. Обеспечьте качество и надёжность с первого дня

Чтобы завоевать доверие пользователей, крайне важно тщательно тестировать и оценивать ваших агентов до развёртывания в продакшене. Встроенные в ADK инструменты наблюдаемости и оценки помогут вам:

Быстро итерировать: до развёртывания вы можете систематически проверять, как агенты реагируют на различные сценарии и насколько хорошо они справляются со сложными задачами.
Отлаживать поведение агента: вы можете изучить полную цепочку выполнения — включая рассуждения («мысли»), вызовы инструментов и наблюдения, — чтобы понять процесс принятия решений и отладить сложные многошаговые рабочие процессы.
Сравнивать производительность агентов: оценивайте разные архитектуры агентов или обновления моделей по заранее определённым метрикам, используя подход, основанный на данных, для постоянного улучшения работы агента.

Это выводит ваш процесс за рамки простого «тестирования на ощущение» (vibe-testing), позволяя быстро запускать профессиональные агенты, строить доверие пользователей за счёт доказанной надёжности и вносить улучшения с уверенностью, основанной на данных.

4. Масштабируйте ИИ с уверенностью

По мере роста ваши ИИ-решения должны масштабироваться плавно, не становясь узким местом. ADK ускоряет путь к продакшену, используя AgentOps (подробно описано ниже), чтобы устранить разрыв между локальной разработкой и развёртыванием.

Фреймворк представляет агентов как стандартные веб-сервисы с помощью FastAPI, которые затем можно упаковать в контейнеры. Это освобождает ваших разработчиков от необходимости создавать собственную инфраструктуру развёртывания. Они могут разворачивать агентов где угодно — от локального тестирования до полностью управляемых, автоматически масштабируемых сред выполнения, таких как Vertex AI Agent Engine или Cloud Run.

ADK Core: архитектуры агентов

Фундаментальный шаг при работе с ADK — выбор правильной архитектуры агента. Разные классы агентов предназначены для различных паттернов выполнения, и ваш выбор определит, как агент будет рассуждать и действовать. Обычно это компромисс между гибкой, недетерминированной мощью большой языковой модели (LLM) и предсказуемым, детерминированным контролем жёстко заданной логики.

Понимание взаимодействия между этими классами агентов — ключ к созданию надёжных и эффективных ИИ-систем.

LlmAgent (рассуждение, инструменты, передача управления)
CustomAgent
SequentialAgent
ParallelAgent
LoopAgent

Типы агентов в ADK делятся на три категории:

На основе LLM → LlmAgent
Агенты рабочих процессов (Workflow agents) → SequentialAgent, ParallelAgent, LoopAgent
Кастомная логика → CustomAgent (наследуется от BaseAgent)

Все они расширяют базовый класс BaseAgent.

Агент на основе LLM (LlmAgent)

Основной движок: LLM
Детерминированность: Недетерминированный (гибкий)

Это самый распространённый тип агента, часто называемый просто «Агент». Он использует LLM (например, Gemini) для сложных рассуждений, динамического принятия решений и понимания естественного языка. Именно он лежит в основе большинства диалоговых и проблемно-ориентированных агентов.

Агенты рабочих процессов

(SequentialAgent, ParallelAgent, LoopAgent)

Основной движок: Предопределённая логика
Детерминированность: Детерминированный (предсказуемый)

Эти оркестраторы управляют выполнением других агентов по заранее заданным схемам. Используются для структурированных процессов.

Последовательные агенты (SequentialAgent)
Выполняют подчинённые агенты в фиксированном порядке, передавая выход одного как вход следующему.
Пример: вы создаёте агента, который сначала получает содержимое веб-страницы, а затем создаёт его краткое содержание. Поскольку суммирование невозможно без исходного текста, порядок вызовов строго фиксирован.

Параллельные агенты (ParallelAgent)
Выполняют несколько подчинённых агентов одновременно. Используется для оптимизации производительности, когда задачи независимы.
Пример: параллельное извлечение данных из нескольких источников или выполнение тяжёлых вычислений. Важно: такой подход предполагает отсутствие необходимости в обмене состоянием между агентами.

Циклические агенты (LoopAgent)
Выполняют подчинённые агенты в цикле — итеративно. Цикл повторяется заданное число раз или до выполнения условия завершения.
Пример: генерация изображения с определённым количеством объектов (например, пять бананов). Агент генерирует изображение, считает объекты, и если их недостаточно — повторяет попытку, пока не достигнет цели или не исчерпает лимит итераций.

Кастомный агент (наследник BaseAgent)

Основной движок: Кастомный код на Python
Детерминированность: Зависит от реализации

Для уникальных требований и специфических рабочих процессов, выходящих за рамки стандартного цикла рассуждений, вы можете создать кастомного агента, унаследовавшись от BaseAgent и написав собственную логику на Python. Этот подход необходим, когда поведение агента определяется не LLM, а жёстко заданными правилами.

Как это делается: разработчик создаёт новый класс Python, наследуемый от BaseAgent, и реализует метод _run_async_impl, содержащий уникальную логику. Этот метод имеет полный доступ к состоянию сессии и может генерировать события для взаимодействия с другими агентами или завершения рабочего процесса.

ADK tools: фреймворк для действий агентов

В ADK агент может использовать инструменты (tools), чтобы выполнять действия, выходящие за рамки возможностей его основной модели рассуждений. Эти определённые возможности позволяют агенту исполнять код, взаимодействовать с внешними системами и действовать за пределами собственного контекста выполнения.

Инструмент — это функция на Python (или метод на Java), которая может либо реализовывать автономную логику, либо выступать обёрткой для более сложных операций, таких как:

вызовы внешних API,
использование Model Context Protocol (MCP) для доступа к разнообразным внешним системам,
делегирование задач другому специализированному агенту локально или удалённо через протокол Agent2Agent (A2A).

Этот раздел описывает, как проектировать эффективные инструменты, и представляет классификацию доступных типов инструментов.

Совет от профессионалов
Полное описание, включая примеры кода и продвинутые сценарии использования, см. в официальной документации ADK.

Проектирование эффективных инструментов: API-контракт для модели

Чтобы модель могла корректно использовать инструмент, его определение должно служить чётким и однозначным API-контрактом, состоящим из:

Сигнатуры функции: используйте понятные имена для инструментов и их параметров. Обязательны аннотации типов (type hints) — они предоставляют структурную схему, которую модель использует для генерации корректных аргументов.
Docstring (семантическое ядро): это основной источник семантической информации для модели. Хорошо написанный docstring должен точно определять:
назначение инструмента,
условия его использования,
параметры,
ожидаемую схему возвращаемого значения.
Схема возврата: инструмент должен возвращать словарь. Хотя это не строгое синтаксическое требование, лучшей практикой считается включение ключа status (например, "success" или "error").
Эта структура необходима, чтобы агент мог надёжно отличать успешные исходы от ошибок на этапе Observation и принимать решения о дальнейших действиях.
Состоятельные инструменты и ToolContext: если инструменту нужно читать или записывать данные в постоянное состояние сессии, в сигнатуру функции можно добавить необязательный параметр tool_context: ToolContext. Агент автоматически внедряет этот объект, предоставляя инструменту доступ к словарю состояния на уровне сессии.

Совет от профессионалов
Рекомендации и примеры по определению параметров, схем инструментов, составлению эффективных промптов и реализации сложных мультиагентных рабочих процессов см. в репозитории ADK Samples.

Классификация инструментов в ADK

ADK предлагает гибкую архитектуру для реализации инструментов — от простых функций до взаимодействующих мультиагентных систем.

Наборы инструментов (Toolsets): объединение связанных возможностей

Основной паттерн в ADK — это Toolset, класс, который группирует набор связанных инструментов в один настраиваемый объект (например, BigQueryToolset, MCPToolset).

Кастомные функциональные инструменты

Это самый прямой способ расширить агента проприетарной логикой:

FunctionTool: стандартная обёртка для синхронных функций Python.
LongRunningFunctionTool: специализированный инструмент для асинхронных задач или сценариев с участием человека (human-in-the-loop).

Иерархические и удалённые инструменты

ADK позволяет создавать сложные системы за счёт композиции агентов:

Agent-as-a-tool: паттерн делегирования, при котором родительский агент использует другого специализированного агента. Родитель вызывает дочерний агент, получает ответ и сохраняет контроль для обработки будущих запросов.
(Отличается от модели делегирования подагенту, где полный контроль над диалогом передаётся подагенту.)
RemoteA2aAgent: для взаимодействия между агентами в разных процессах ADK предоставляет класс RemoteA2aAgent, использующий протокол A2A для бесшовной интеграции распределённых систем.

Готовые и интегрированные инструменты

ADK включает набор инструментов и обёрток для ускорения разработки:

Встроенные инструменты: готовые решения, такие как Google Search и выполнение кода.
Наборы инструментов Google Cloud: глубокая интеграция с сервисами, такими как Vertex AI Search и BigQuery.
Интероперабельность со сторонними решениями: обёртки вроде LangchainTool и CrewaiTool позволяют напрямую использовать инструменты из популярных open-source экосистем.

Совет от профессионалов

Стандартизация с помощью Model Context Protocol (MCP)

Model Context Protocol (MCP) — это появляющийся открытый стандарт для подключения ИИ и больших языковых моделей (LLM) к внешним источникам данных и инструментам. С его помощью вы можете интегрировать свои ИИ-приложения с различными источниками данных и инструментами без необходимости создавать отдельные точечные интеграции для каждого из них.

С ADK ваши агенты могут участвовать в этой экосистеме двумя способами:

Использовать внешние инструменты: агент на ADK может выступать в роли клиента MCP, позволяя ему использовать любой инструмент, предоставляемый сторонним сервером MCP.
Публиковать собственные инструменты: разработчики могут обернуть свои инструменты на ADK в сервер MCP, сделав их безопасно доступными для любого другого агента или приложения, совместимого с MCP.

Используйте open-source MCP Toolbox for Databases, чтобы легко и безопасно подключать своих агентов к широкому спектру популярных источников данных.

Совет от профессионалов

MCP — это универсальный адаптер для источников данных и инструментов агента

Управление данными с помощью сервисов Google Cloud

Как было описано в предыдущем разделе, долгосрочная память, рабочая память и транзакционная память играют разные роли в архитектуре данных агента. Здесь мы объясним, как это реализовать на практике. ADK предоставляет необходимые паттерны и интеграции, чтобы напрямую сопоставить эту концептуальную архитектуру с конкретными, масштабируемыми сервисами Google Cloud.

1. База долгосрочных знаний (привязка, контекст и аналитика)
Это постоянная память агента, объединяющая:

поиск по библиотеке знаний,
историю взаимодействий с пользователями,
хранилище для аналитики.
Vertex AI Search: служит в качестве поисковой библиотеки знаний для неструктурированной информации. В ADK набор инструментов VertexAISearchToolset позволяет агенту привязывать свои ответы, извлекая релевантную информацию из заданного набора документов.
Firestore: выступает в роли постоянной памяти пользователя. В ADK он используется для хранения и извлечения истории диалогов и состояния длительных задач, обеспечивая непрерывный и персонализированный опыт, который можно возобновлять между сессиями.
Cloud Storage: работает как надёжная файловая система агента. ADK использует его как источник «сырых» документов (PDF, изображения и т.д.), которые затем индексируются такими сервисами, как Vertex AI Search.
BigQuery: функционирует как аналитическая база данных агента. Набор инструментов BigQueryToolset в ADK позволяет агентам отвечать на вопросы, выполняя сложные аналитические запросы к большим структурированным наборам данных.

2. Рабочая память (кэширование и состояние сессии)
Это высокоскоростная, временная память агента для управления контекстом текущего диалога.

Memorystore: обеспечивает высокоскоростной кэш. В ADK его основная роль — хранить результаты частых или дорогостоящих вызовов инструментов, что резко снижает задержку и операционные расходы.

3. Транзакционная память (аудит и надёжное выполнение)
Это надёжный журнал агента для записи критически важных действий и изменений состояния с высокой целостностью.

Cloud SQL: служит надёжной системой учёта. ADK поддерживает паттерны, при которых инструменты записывают свои действия в Cloud SQL, создавая постоянный, соответствующий требованиям ACID журнал аудита для каждого важного действия агента.
Cloud Spanner: выступает в качестве глобально согласованного бэкенда для миссионно-критичных действий агента. В продвинутой реализации на ADK инструмент, представляющий ключевой бизнес-процесс (например, process_global_order), инициирует транзакцию в системе на базе Spanner, чтобы обеспечить глобальную целостность.

4. Следующий рубеж: дистиллированная память диалогов

По мере того как история взаимодействий агента с пользователем растёт (недели или месяцы), передача всей «сырой» истории модели при каждом запросе становится неэффективной и дорогостоящей. Кроме того, модели могут запутаться.

Дистилляция памяти — это следующий шаг вперёд. Она использует LLM для динамического и непрерывного сжатия длинных историй диалогов в компактный, структурированный набор ключевых фактов и предпочтений. Полученная курированная долгосрочная память гораздо эффективнее для поиска и использования.

Это активная область исследований, но уже появляются первые паттерны. Пример — Vertex AI Memory Bank, управляемый сервис в Vertex AI Agent Engine, который предоставляет механизмы для реализации дистилляции памяти:

Автоматическая дистилляция: асинхронная обработка истории диалогов для автоматического извлечения и генерации списка значимых фактов о пользователе (GenerateMemories).
Управляемая агентом дистилляция: для большего контроля агент может использовать память как инструмент, чтобы решить, какая именно информация достаточно важна для явной записи в банк памяти (CreateMemory).

Фокус на дистиллированном наборе воспоминаний вместо «сырой» истории делает систему более масштабируемой, эффективной и «похожей на человека» — идеально для ИИ-агентов следующего поколения.

Развёртывание в управляемой среде выполнения с помощью Vertex AI Agent Engine

ADK изначально не привязан к конкретной платформе развёртывания. Логика агента, которую вы определяете на Python, отделена от инфраструктуры обслуживания, поэтому вы можете разрабатывать и тестировать локально, а затем разворачивать одного и того же агента в различных продакшен-средах.

Процесс развёртывания:

Разработка → определение BaseAgent
Сборка/упаковка → контейнеризация через adk api_server (на основе FastAPI)
Развёртывание → выбор целевой платформы:

Vertex AI Agent Engine — полностью управляемый, автомасштабируемый сервис, специально созданный для ИИ-агентов.
Cloud Run — управляемая бессерверная платформа для запуска агентов в виде контейнеров. Идеально подходит для интеграции в существующую микросервисную архитектуру.
Пользовательская инфраструктура — Docker-хост, GKE, on-prem и т.д.

ADK-агенты предоставляются для развёртывания как стандартные веб-сервисы с использованием FastAPI. Команда adk api_server автоматически оборачивает вашего агента в готовый к продакшену API-сервер, который затем можно упаковать в контейнер.

Хотя такой контейнер можно развернуть на различных сервисах Google Cloud, три основные управляемые цели развёртывания для ADK-агентов:

Cloud Run: управляемая вычислительная платформа для запуска агента как контейнерного приложения. Отличный выбор для интеграции в существующую архитектуру микросервисов или для сценариев, требующих кастомных настроек контейнера.
Vertex AI Agent Engine: полностью управляемый, автомасштабируемый сервис на Google Cloud, специально предназначенный для развёртывания, управления и масштабирования ИИ-агентов, созданных с помощью фреймворков вроде ADK. Обеспечивает глубокую интеграцию с экосистемой Vertex AI для MLOps, мониторинга и безопасности.
Google Kubernetes Engine (GKE): управляемый сервис Kubernetes — лучший выбор, если у вас уже есть инфраструктура на базе Kubernetes или вы с самого начала делаете ставку на переносимость, глубокий контроль архитектуры и экосистему open-source Kubernetes. Предоставляет наиболее детальный контроль над сетью, stateful-нагрузками и специализированным оборудованием (GPU/TPU). Идеален для команд с экспертизой в платформенной инженерии или для сложных мультикомпонентных приложений.

Для стартапов, использующих ADK, рекомендуемой платформой развёртывания является Vertex AI Agent Engine.

Он специально оптимизирован как экономически эффективное и автомасштабируемое решение и обеспечивает самый простой и прямой путь к созданию масштабируемого агента, готового к продакшену. Как полностью управляемый сервис, он абстрагирует базовую инфраструктуру, позволяя вашим инженерам сосредоточиться на логике агента, а не на операционных задачах.

Будучи сервисом, разработанным специально для агентных рабочих нагрузок, Vertex AI Agent Engine предоставляет несколько ключевых преимуществ:

Основные возможности

Автоматическое масштабирование: автоматически адаптирует ресурсы под изменяющуюся нагрузку пользователей.
Безопасность и аутентификация: встроенное управление идентификацией и доступом.
Независимость от фреймворка: поддерживает агентов, созданных с использованием различных фреймворков, не только ADK.
Управление жизненным циклом агентов: предоставляет API для создания, чтения, обновления и удаления развёрнутых агентов.

Специализированные функции для агентов

Memory Bank (Банк памяти): управляемый сервис для динамического создания и извлечения долгосрочных персонализированных воспоминаний на основе диалогов с пользователями.
Example Store (Хранилище примеров): позволяет разработчикам предоставлять и управлять few-shot примерами для улучшения и направления работы агента в конкретных задачах.

Важно понимать взаимосвязь между инструментами Google Cloud для создания агентов. Vertex AI Agent Builder — это комплексный набор функций для всего жизненного цикла агента: от проектирования до развёртывания.
Ключевой компонент этого набора — Vertex AI Agent Engine, управляемый сервис, предназначенный именно для развёртывания, управления и масштабирования агентов в продакшене.

В рамках этого руководства, когда мы говорим о среде выполнения для продакшена, мы имеем в виду именно Vertex AI Agent Engine.

Примечание
Системная архитектура движка агентов на базе Gemini

Сотрудничество с помощью протокола Agent2Agent (A2A)

Настоящая сила специализированных агентов раскрывается, когда они могут взаимодействовать друг с другом. Чтобы обеспечить такую возможность, Google поддерживает протокол Agent2Agent (A2A) — открытый стандарт, который гарантирует, что агенты, созданные сегодня, смогут обнаруживать, общаться и безопасно координировать действия с другими агентами — независимо от того, кто их создал и на какой фреймворк они опираются.

Эта приверженность открытой и совместимой экосистеме лежит в основе стратегии Google Cloud в области агентов.

Ключевые концепции протокола A2A:

Карточка агента (Agent card): цифровая «визитка» (обычно JSON-файл по известному URL), с помощью которой агент заявляет о своих возможностях, адресе API и требованиях к аутентификации. Это позволяет другим агентам находить его.
Архитектура, ориентированная на задачи: взаимодействие строится вокруг «задач». Клиент-агент отправляет запрос на выполнение задачи сервер-агенту, который обрабатывает его и возвращает ответ. Один и тот же агент может выступать как в роли клиента, так и в роли сервера.
Независимость от модальности: A2A поддерживает обмен текстом, аудио и видео, отражая эволюцию агентных взаимодействий в мультимодальную среду.

ADK-агенты могут нативно участвовать в этой экосистеме.

Они предоставляют стандартную HTTP-точку входа и файл agent.json, что позволяет им быть обнаруженными и взаимодействовать с любым другим агентом, совместимым с A2A.

Ознакомьтесь с этими ресурсами по A2A, чтобы начать:

Организация A2A Project на GitHub
Документация по протоколу A2A
Спецификация протокола A2A

Как BioCorteX использует протокол A2A для ускорения разработки лекарств

Ситуация
В биотехнологиях объединение и преобразование разрозненных наборов данных в коммерчески значимые знания — медленный и неопределённый процесс. Проверка гипотез может занимать годы из-за плохих моделей, противоречивых теорий и огромной сложности биологических систем.

Решение
BioCorteX построила мультиагентную систему на Google Cloud Platform (GCP), которая проверяет гипотезы по трём направлениям: биологическая правдоподобность, клиническая значимость в реальном мире и коммерческая ценность. Система использует агентов на базе Gemini, ADK и graphRAG для навигации по знаниевой графе из 44 миллиардов связей — всё это оркестрируется через A2A.

Результат
То, что раньше занимало годы, теперь занимает дни. Агенты BioCorteX предоставляют руководителям прозрачное сценарное планирование, подкрепляя стратегические коммерческие решения глубокими научными знаниями — ускоряя тестирование новых механизмов и терапевтических направлений и сокращая потери на всех этапах разработки.

История клиента
«В BioCorteX наши агенты Carbon Graph отличаются от других. В отличие от большинства агентов, они оперируют фактами, а не мнениями или ассоциациями.
Перемещаясь по крупнейшему в мире знаниевому графу, основанному на механистической биологии (а не используя LLM), агенты Carbon Graph не предлагают гипотезы — они проверяют их правдоподобность, клиническую значимость и коммерческие аспекты, обеспечивая полное согласование между командами R&D, регуляторного контроля и коммерческого отдела».

Пошаговое руководство: определение LLM-агента

Создание ИИ-агента — это итеративный процесс, включающий определение, тестирование и развёртывание. В этом разделе мы сосредоточимся на первом и самом важном этапе: определении основной идентичности агента, его инструкций и возможностей.

Хотя в открытом репозитории ADK Samples есть библиотека готовых агентов, её цель — показать, как выглядит завершённый агент. Настоящий же раздел призван научить вас мыслить как разработчик агентов. Мы объясним архитектурные принципы и стратегическое «почему» каждого ключевого компонента, чтобы вы получили фундаментальные знания для создания собственных решений на основе примеров.

Для наглядности пройдёмся по процессу создания Ассистента по обработке багов (Software Bug Assistant) — агента типа LlmAgent, предназначенного для помощи команде поддержки в сортировке новых отчётов об ошибках.

1. Определите идентичность агента

Сначала вы задаёте, кто этот агент и для чего он. Это делается с помощью трёх ключевых параметров:

name (обязательный): уникальный строковый идентификатор, критически важный для внутренних операций и делегирования в мультиагентных системах.
Пример: software_bug_triage_agent.
description (рекомендуемый): краткое описание возможностей, которое другие агенты используют для принятия решения о передаче задачи.
Пример: «Анализирует новые отчёты об ошибках, определяет приоритет и назначает их нужной инженерной команде».
model (обязательный): базовая LLM, обеспечивающая рассуждения агента, например gemini-2.5-flash.

2. Направляйте агента с помощью инструкций

Параметр instruction — самый важный компонент для формирования поведения агента. Он сообщает агенту его основную задачу, персону, ограничения и то, как использовать инструменты.
Для нашего Ассистента по обработке багов мы указали бы, что он должен вести себя как эксперт-инженер-менеджер, объяснили, как использовать инструменты для поиска данных о пользователе, и задали, что финальный вывод должен быть в формате JSON для нашей системы тикетов.

Эффективная инструкция должна:

Чётко и конкретно описывать желаемые результаты.
Содержать примеры (few-shot prompting) для сложных задач.
Направлять использование инструментов, объясняя, когда и почему их следует вызывать.
Внедрять динамические данные из состояния агента с помощью синтаксиса {variable}.

Будьте точны — всё определение является промптом.
LLM использует каждую часть определения агента — от имени и описания до названий и описаний инструментов — для рассуждений. И интерпретирует эту информацию буквально.
Избегайте неоднозначных, расплывчатых или противоречивых формулировок — это может привести к «отравлению контекста»: агент запутается, будет преследовать неверные цели или неправильно использовать инструменты.
Рассматривайте каждую строку конфигурации как тщательно продуманную инструкцию для модели.

Примечание
ИИ-агенты и их фреймворки развиваются невероятно быстро. Хотя это руководство фокусируется на устойчивых архитектурных принципах, конкретные примеры кода и детали API — это лишь снимок текущего момента.
Всегда сверяйтесь с официальной документацией ADK и репозиторием ADK Samples для получения актуальных данных.

3. Оснастите агента инструментами

Инструменты дают агенту возможности, выходящие за рамки встроенных рассуждений, позволяя ему взаимодействовать с внешним миром. Нашему Ассистенту по обработке багов понадобятся несколько инструментов:

Функция для получения информации о пользователе (get_user_details(user_id)).
Функция для поиска по кодовой базе (search_codebase(file_name)).
Функция для создания тикета в системе управления проектами (create_jira_ticket(...)).

LLM использует имя инструмента, его docstring и схему параметров, чтобы решить, какой инструмент вызвать.

4. Завершите жизненный цикл разработки

Теперь вы готовы протестировать и оценить работу агента. Эта задача заключается в оценке качества вывода агента через анализ его пошагового выполнения («траектории»). Подробнее об оценке — в следующем разделе.

Когда вы убедитесь, что агент работает хорошо, вам понадобится простой способ его развёртывания. Именно тогда ваш прототип превращается в готовое к продакшену приложение для вашей команды или клиентов, становясь надёжным бизнес-инструментом.

Как Box использует ADK и протокол A2A для ускорения создания контента

Box — это платформа интеллектуального управления контентом, которая помогает организациям улучшать совместную работу, управлять полным жизненным циклом контента, защищать важные данные и трансформировать бизнес-процессы.

Ситуация
Критически важные бизнес-процессы — такие как проверка соответствия нормативам, управление договорами и одобрение кредитов — замедляются из-за необходимости сотрудникам искать и интерпретировать огромные объёмы информации, хранящейся в документах в Box. Это создаёт неэффективность и задерживает принятие ключевых решений.

Решение
Box внедряет агента, совместимого с протоколом A2A, построенный с использованием ADK от Google и модели Gemini. Агент напрямую подключается к Box Intelligent Content Cloud, позволяя пользователям задавать сложные вопросы на естественном языке и мгновенно получать сводные, контекстно-зависимые ответы и аналитику по своим документам.

Результат
Это кардинально ускоряет рабочие процессы, связанные с контентом, и повышает качество принятия решений. Такой подход закладывает основу для более продвинутых транзакционных агентов, способных управлять, контролировать и инициировать процессы — например, электронные подписи и согласования, — что в корне меняет способ выполнения работы в компании.

История клиента
«Мы вступаем в новую эру, в которой ИИ-агенты преобразят рабочие процессы — и контент находится в самом центре этого изменения.
Используя Box как защищённый слой контента и протокол A2A от Google Cloud для бесшовного взаимодействия в экосистеме, мы открываем мощные новые возможности для автоматизации бизнес-процессов, ускорения принятия решений и достижения реальных результатов для наших клиентов».

Управление и масштабирование вашей агентной команды с помощью Google Agentspace

Когда ваш стартап переходит от создания одного агента к развёртыванию портфеля специализированных агентов, перед вами возникает новый набор задач:
— Как управлять ими?
— Как нетехнические сотрудники могут использовать их?
— Как контролировать их доступ к данным и инструментам?

Google Agentspace решает эти проблемы масштабирования.
Это единая безопасная платформа, которая позволяет создавать, управлять и оркестрировать всю вашу ИИ-агентную команду, объединяя разрозненные приложения и источники данных. Она дополняет разработку на ADK (с приоритетом кода), предоставляя фреймворк для масштабирования использования агентов по всей организации и эффективного управления ими.

С помощью Google Agentspace вы можете:

Объединять и получать доступ к корпоративным данным: Agentspace устраняет разрозненность данных, используя готовые коннекторы к существующим корпоративным приложениям (например, Microsoft SharePoint, Google Workspace, Jira).
Он применяет мультимодальные поисковые технологии Google ко всем подключённым данным, позволяя любому сотруднику мгновенно получать ответы и синтезировать инсайты из единого источника истины — при этом полностью соблюдая существующие права доступа.
Внедрять автоматизацию по всей команде: если ADK идеален для сложной разработки агентов с помощью кода, то Google Agentspace даёт возможность всей организации создавать автоматизацию.
Специалисты в продукте, маркетинге или операциях могут использовать конструктор агентов без кода (Agent Designer), чтобы создавать собственные кастомные агенты через интерфейс на основе промптов. Это превращает их экспертные знания в автоматизированные решения без участия инженеров.
Управлять и оркестрировать флот агентов: Google Agentspace предоставляет единую платформу для управления агентами, созданными с помощью ADK, конструктора без кода или партнёрами.
Галерея агентов (Agent Gallery) выступает центральным порталом, где ваша команда может находить, управлять и развёртывать все агенты — как собственные, так и готовые агенты Google, предназначенные для сложных задач вроде глубокого анализа или генерации идей.

Попробуйте эти запросы в Google Agentspace:

«Запланируй наше еженедельное совещание команды на четверг в 10 утра».
«Создай повестку дня для обсуждения подготовки к встрече с инвесторами».
«Подведи итоги этой недели для канала #product в Slack».

Совет от профессионалов
Скачайте руководство по составлению промптов для Google Agentspace, чтобы получить больше шаблонов.

Как Zoom’s AI agent автоматически планирует встречи Zoom на основе контекста из Gmail с интеграцией Google Agentspace

Zoom — это технологическая компания в сфере коммуникаций, предоставляющая открытую, ориентированную на ИИ платформу для виртуальных встреч, вебинаров, чата, онлайн-сотрудничества, клиентского опыта и многого другого.

Ситуация
Стратегия Zoom, ориентированная на ИИ, направлена на превращение AI Companion в полноценную агентную платформу — способную не только к продвинутому рассуждению и оркестрации задач, но и к бесшовной интеграции с ключевыми сторонними системами клиентов. Благодаря взаимодействию с другими ИИ-агентами Zoom обеспечивает более значимые рабочие результаты через открытую и совместимую экосистему.

Решение
Zoom AI Companion интегрируется с Google Agentspace для упрощения планирования встреч. Запуск этой функции запланирован на конец лета. Благодаря этой интеграции агенты, совместимые с протоколом A2A, смогут автоматически:

назначать встречи Zoom прямо из контекста Gmail,
обновлять Google Calendar,
информировать участников —
всё это без необходимости ручного согласования времени.

Результат

Снижение технических барьеров при кроссплатформенной интеграции ИИ.
Бесшовное взаимодействие между Zoom AI Companion и внешними агентами, совместимыми с A2A, без написания кастомного кода.
Повышение автоматизации рабочих процессов и эффективности для корпоративных клиентов.
Поддержка в будущем более сложных мультиагентных ИИ-взаимодействий.

История клиента
«Наш вклад в протокол A2A позволяет глубже интегрироваться с Google Cloud и другими сторонними платформами, предоставляя клиентам гибкость и выбор».

Другие варианты создания агентов

Экспериментируйте с Gemini CLI

Для стартапов, которым нужен быстрый и экономичный способ поэкспериментировать с ИИ, Gemini CLI — это open-source агент, который приносит Gemini прямо в ваш терминал. Он предлагает:

Значительную экономию средств: бесплатный доступ к Gemini 2.5 с щедрыми лимитами (контекст до 1 млн токенов, 60 запросов в минуту).
Повышенную продуктивность: интеграция в существующие рабочие процессы разработчика ускоряет написание кода, отладку и документирование.
Полную гибкость: как open-source инструмент (лицензия Apache 2.0), его можно аудировать, модифицировать и встраивать в свой стек, избегая привязки к поставщику и позволяя глубокую кастомизацию.

Ускоряйте разработку с помощью Firebase Studio

Бэкенд-агент, даже самый мощный, созданный на ADK, — это лишь часть полноценного продукта. Чтобы оживить его, нужно построить полноценное full-stack приложение, включая пользовательский интерфейс, базы данных и хостинг.

Firebase Studio — это интегрированная облачная среда разработки, которая использует агентный ИИ для ускорения всего жизненного цикла разработки. Команды могут использовать её для всего: от прототипирования интерфейса и генерации кода до безопасного развёртывания на инфраструктуре Google Cloud.

Вместе ADK (для логики агента), Agent Starter Pack (для продакшен-инфраструктуры, подробнее в разделе 3) и Firebase Studio (для full-stack приложения) образуют полный end-to-end набор инструментов, с помощью которого стартап может создать и развернуть современную агентную систему.

Firebase Studio ускоряет весь цикл разработки с помощью ИИ:

Быстрая настройка: используйте App Prototyping Agent, чтобы создать проект с помощью естественного языка, макетов или скриншотов. Выбирайте из обширного каталога шаблонов для популярных фреймворков или импортируйте существующий проект.
Gemini в Firebase: получайте ИИ-помощь в написании, отладке, тестировании, рефакторинге, объяснении и документировании кода.
Совместная работа: делитесь рабочими пространствами с командой и предоставляйте URL для раннего тестирования.
Оптимизация: предварительно просматривайте приложения так, как их видят пользователи, с встроенными веб-превью и эмуляторами Android; тестируйте и оптимизируйте с доступом к тысячам расширений в реестре Open VSX.
Развёртывание: публикуйте в Firebase App Hosting в несколько кликов или развёртывайте продакшен-приложения в Cloud Run, Firebase Hosting или собственную инфраструктуру.

Совет от профессионалов
Попробуйте Gemini CLI, настроенный для разработки на ADK.

Попробуйте эти запросы с App Prototyping Agent:

«Создай дашборд поддержки клиентов, который получает данные из Zendesk и отображает ключевые метрики: объём тикетов и время решения».
«Создай B2B SaaS-приложение с аутентификацией пользователей, базой данных PostgreSQL и страницей подписки».
«Собери full-stack приложение для внутренней системы отслеживания багов с формой подачи и канбан-доской для просмотра статусов».

Ключевые выводы: от создания к масштабированию

Готовы воплотить своё ИИ-видение в жизнь?

Мы здесь, чтобы помочь.

Начните сейчас
Узнайте, как создавать больше приложений на основе генеративного ИИ, с помощью записей сессий Startup School по запросу.
Подайте заявку
Получите до 350 000 долларов США в виде кредитов Google Cloud через программу Google for Startups Cloud Program.
Свяжитесь с нами
Обратитесь в нашу команду поддержки стартапов.
Подпишитесь
Оставайтесь в курсе и получайте все последние обновления, подписавшись на новостную рассылку Google Cloud для стартапов.

Раздел 3: Обеспечение надёжности и ответственности ИИ-агентов

Из-за недетерминированной природы систем на основе больших языковых моделей (LLM) достижение надёжности, соответствующей требованиям продакшена, может быть затруднено. Переход за рамки поверхностного «тестирования на ощущение» («vibe-testing») требует строгого инженерного подхода, чтобы гарантировать безопасную работу агента и стабильную ценность для пользователя.

Этот раздел посвящён методологиям и инструментам, необходимым для решения этих задач, с акцентом на три ключевые области:

Корректность и надёжность: оценка точности финальных ответов и правильности промежуточных шагов рассуждения.
Производительность и масштабируемость: измерение и оптимизация задержки и пропускной способности агента под нагрузкой.
Безопасность и ответственность: внедрение защитных механизмов, мониторинг нежелательного поведения и обеспечение работы агента в заданных границах.

Эти практики — практическое воплощение приверженности Google принципам ответственного ИИ, позволяя стартапам создавать мощных и надёжных агентов в соответствии с передовыми отраслевыми стандартами безопасности.

Совет от профессионалов
Наблюдаемость на уровне продакшена означает, что нужно смотреть не только на метрики приложения, но и на низкоуровневые операционные показатели, такие как использование CPU и памяти. Тщательный учёт потребления ресурсов необходим для диагностики узких мест, оптимизации среды выполнения и прямого снижения операционных затрат. ADK и Agent Starter Pack предоставляют встроенную поддержку OpenTelemetry, позволяя направлять важные операционные данные прямо в ваши существующие системы мониторинга.

Харрисон Чейс, генеральный директор и сооснователь LangChain:

«Агенты открывают новый уровень производительности, но их успех зависит от нашего руководства».

AgentOps: фреймворк для агентов, готовых к продакшену

Операционная методология для агентов (AgentOps) решает задачи обеспечения надёжности и ответственности в продакшене. Она адаптирует принципы DevOps, MLOps и DataOps к уникальным вызовам, связанным с созданием, развёртыванием и управлением ИИ-агентами на протяжении всего их жизненного цикла. AgentOps предоставляет систематический, автоматизированный и воспроизводимый фреймворк для работы со сложными недетерминированными системами на основе LLM в продакшен-средах.

Продуманная стратегия AgentOps систематизирует процесс разработки, обеспечивая непрерывные циклы обратной связи для улучшения надёжности, безопасности и производительности агента — включая его инструменты, логику рассуждений и базовые модели.

Систематический фреймворк для оценки агентов

Оценка недетерминированных агентных систем — одна из самых сложных задач современной инженерии ПО. Традиционное тестирование часто фокусируется на лексической корректности, но оценка агентов должна решать две более трудные проблемы:
— семантическую корректность (понял ли агент намерение пользователя и дал ли полезный ответ?),
— корректность рассуждений (следовал ли агент логичному и эффективному пути к выводу?).

Как обсуждалось в разделе 1, когнитивная архитектура, управляющая этими рассуждениями, часто основана на фреймворке вроде ReAct, который создаёт динамический цикл чередования мышления и действия. Сбой на любом этапе этого цикла может привести к неверному результату. Следовательно, необходима строгая, многоуровневая система оценки.

Этот фреймворк реализуется с помощью комбинации:

ADK — для логики агента и инструментирования,
Agent Starter Pack — для продакшен-инфраструктуры, автоматизации и наблюдаемости.

Уровень 1: Оценка на уровне компонентов (детерминированные юнит-тесты)

Этот уровень фокусируется на предсказуемых, не-LLM компонентах системы агента.

Цель: проверить лексическую корректность отдельных строительных блоков, чтобы убедиться, что сбои агента не вызваны простыми багами в его компонентах.
Что тестировать:
Инструменты: поведение при корректных, некорректных и пограничных входных данных.
Обработка данных: устойчивость функций парсинга и сериализации.
Интеграции с API: обработка успешных ответов, ошибок и таймаутов.
Реализация:
В ADK инструменты определяются как функции Python (или методы Java) — именно они становятся объектами тестирования.
Agent Starter Pack предоставляет инфраструктуру тестирования: генерирует проект с готовой средой pytest в директории tests/unit/. Разработчики могут сразу писать юнит-тесты и запускать их командой make test.

Уровень 2: Оценка траектории (процедурная корректность)

Это самый важный уровень для оценки процесса рассуждений агента. «Траектория» — это полная последовательность шагов Reason → Act → Observe, которые агент выполняет для завершения задачи.

Цель: проверить корректность рассуждений агента в цикле ReAct.
Что проверять:
Шаг Reason: правильно ли агент оценивает цель и текущее состояние, чтобы сформулировать логичную гипотезу для следующего шага?
Шаг Act: выбирает ли он правильный инструмент (выбор инструмента) и корректно ли извлекает и форматирует аргументы для него (генерация параметров)?
Шаг Observe: правильно ли он интегрирует результат работы инструмента, чтобы использовать его на следующем шаге Reason?
Реализация:
Среда выполнения ADK исполняет цикл ReAct и напрямую интегрируется с Google Cloud Trace, чтобы инструментировать каждый шаг Reason, Act и Observe.
Это позволяет разработчикам визуализировать всю траекторию, проверять входные и выходные данные инструментов и анализировать «цепочку мыслей» модели для отладки её рассуждений.
Agent Starter Pack автоматизирует и масштабирует оценку траекторий. В директории tests/integration/ создаётся «золотой набор» промптов с ожидаемыми траекториями ReAct.
Автоматизированный CI/CD-конвейер (настраивается командой agent-starter-pack setup-cicd) запускает эти тесты при каждом pull request, чтобы предотвратить регрессии.
Именно инфраструктура наблюдаемости Starter Pack собирает данные трассировки, генерируемые агентом ADK.

Уровень 3: Оценка результата (семантическая корректность)

Этот уровень оценивает финальный, видимый пользователю ответ, сгенерированный после завершения цикла ReAct.

Цель: проверить семантическую корректность, фактологическую точность и общее качество финального ответа.
Что проверять:
Фактологическая точность и привязка: основан ли ответ на проверяемых фактах, собранных на этапе Observe?
Полезность и тон: полностью ли ответ удовлетворяет запросу пользователя и в подходящем ли стиле?
Полнота: содержит ли ответ всю необходимую информацию?
Реализация:
В ADK для проверки фактологической точности можно создавать специализированные инструменты или использовать API для проверки привязки. Эти инструменты программно проверяют, подтверждается ли финальный ответ контекстом, который агент извлёк, давая количественную оценку риска галлюцинаций.
Agent Starter Pack предоставляет платформу для масштабируемой оценки: интеграция с Vertex AI Gen AI evaluation service позволяет использовать LLM-as-a-judge для оценки качества. Встроенный UI-плейграунд включает механизмы обратной связи, логируя оценки пользователей в BigQuery для высокоточной оценки с участием человека (HITL).

Уровень 4: Мониторинг на уровне системы (в продакшене)

Оценка не заканчивается после развёртывания. Непрерывный мониторинг работы агента в реальных условиях критически важен.

Цель: отслеживать производительность в реальном времени и выявлять сбои или дрейф поведения.
Что мониторить: частоту сбоев инструментов, оценки пользователей, метрики траекторий (например, количество циклов ReAct на задачу), сквозную задержку.
Реализация:
Агент на ADK, работающий в продакшене, генерирует операционные данные для каждого взаимодействия с пользователем.
Agent Starter Pack предоставляет готовый стек наблюдаемости: автоматически настраивает OpenTelemetry, маршрутизатор логов в BigQuery и шаблоны дашбордов Looker Studio. Это позволяет сразу отслеживать производительность, анализировать тренды и отлаживать проблемы на основе реальных данных без дополнительной настройки.

Этот комплексный подход к оценке — практическая реализация стратегии AgentOps, которая переводит команды от неформального «тестирования на ощущение» к систематическому, автоматизированному и воспроизводимому процессу. Разделение оценки на компоненты, траектории, результат и системный мониторинг напрямую решает ключевые задачи AgentOps.

Принятие систематического подхода к оценке — это не просто лучшая практика, а конкурентное преимущество. Оно создаёт строгий, управляемый данными и автоматизированный процесс, который позволяет командам быстрее внедрять инновации, уверенно развёртывать решения и строить агентов, которые доказуемо безопаснее и эффективнее.

Высокоуровневая архитектура Agent Starter Pack

Оркестрация LLM
→ ИЛИ
→ Оркестрация LLM
Серверная часть: Vertex AI Agent Engine или Cloud Run
API-сервер: FastAPI
Фронтенд: Пользовательский интерфейс
Оценка: Vertex AI Evaluation
Модели LLM: Vertex AI Model Garden
Данные:
– Векторное хранилище (адаптируется под любое)
– Хранилище и анализ данных: BigQuery
Мониторинг: Looker Studio
Наблюдаемость: Cloud Trace и OpenTelemetry, Cloud Logging
IaC и CI/CD: Terraform, Cloud Build
Оркестрация агентов: выбор фреймворка (включая примеры с Google ADK, LangGraph, CrewAI)

Набор инструментов AgentOps: ADK и Agent Starter Pack

Автоматизированные CI/CD-конвейеры реализуют принципы AgentOps: любое изменение в коде агента, инструментах или промптах запускает стандартизированный процесс сборки, юнит-тестирования и количественной оценки на заранее определённом наборе данных. Этот автоматизированный этап оценки критически важен для предотвращения регрессий и обеспечивает непрерывную, объективную обратную связь по производительности и безопасности агента до его развёртывания.

Чтобы ускорить внедрение принципов AgentOps, Agent Starter Pack предоставляет готовую эталонную реализацию. Его комплексные шаблоны решают распространённые задачи (развёртывание и эксплуатация, оценка, кастомизация, наблюдаемость) при создании и запуске ИИ-агентов. По сути, он автоматически настраивает новый проект агента со всей необходимой инфраструктурой и конвейерами, позволяя разработчикам сосредоточиться на основной логике.

Agent Starter Pack включает следующие ключевые компоненты:

Infrastructure as Code (Terraform): предоставляет воспроизводимые шаблоны для подготовки и управления облачной средой агента, включая такие сервисы, как Cloud Run, IAM-разрешения и настройки сети.
CI/CD-конвейеры (Cloud Build): предварительно настроенный файл cloudbuild.yaml автоматизирует сборку, юнит-тестирование, количественную оценку и развёртывание, напрямую реализуя рабочий процесс AgentOps.
Наблюдаемость и логирование (Cloud Trace и Cloud Logging): создаёт основу для мониторинга и отладки за счёт интеграции с Cloud Trace для детального анализа трассировок выполнения агента и Cloud Logging для централизованного управления логами.
Интеграция с данными (BigQuery): включает базовые компоненты для агентов, которым нужно подключаться к структурированным корпоративным данным и анализировать их с помощью BigQuery.
Непрерывная оценка (Vertex AI Evaluation): интегрируется с Vertex AI для запуска наборов оценки при каждом изменении агента, постоянно измеряя производительность по ключевым параметрам, описанным ранее.

Это разделение проявляется в пятиэтапном рабочем процессе:

Инициализация с помощью Agent Starter Pack: разработчик выполняет одну команду, чтобы сгенерировать новый проект, содержащий все необходимые операционные компоненты: файлы Terraform для инфраструктуры, конфигурации Cloud Build для CI/CD и шаблоны наборов данных для оценки.
Разработка с использованием ADK: внутри этой структуры разработчик применяет ADK для написания логики агента — реализует кастомные инструменты, компонует агентов и задаёт основные инструкции.
Фиксация кода и автоматизация: при коммите кода в репозиторий автоматически запускается предварительно настроенный CI/CD-конвейер, управляемый Cloud Build.
Непрерывная оценка: конвейер собирает агента ADK в контейнер, а затем выполняет количественную оценку на заранее определённом тестовом наборе, программно проверяя производительность и безопасность агента.
Уверенное развёртывание: при успешной оценке конвейер автоматически развёртывает новую, проверенную версию агента в целевой продакшен-среде.

Интегрируя фреймворк разработки ADK с операционной автоматизацией Agent Starter Pack, вы создаёте полный сквозной процесс MLOps/DevOps, специально адаптированный для создания и управления ИИ-агентами, готовыми к эксплуатации. Это и есть AgentOps в масштабе.

Лучше вместе: ADK и Agent Starter Pack

ADK и Agent Starter Pack разработаны так, чтобы чётко разделять логику приложения агента и его операционный жизненный цикл, обеспечивая надёжный и масштабируемый процесс разработки.

По сути:

ADK используется для написания кода самого агента,
Agent Starter Pack предоставляет готовую к продакшену операционную основу для запуска и управления этим кодом в масштабе.
ADK отвечает за поведение агента во время выполнения: как SDK для Python/Java он предоставляет API и основные абстракции для определения логики агента. Разработчики используют его для реализации сценариев оркестрации, определения инструментов и настройки взаимодействия с LLM.
Agent Starter Pack отвечает за операционную среду: как инструмент для генерации шаблонов он создаёт Infrastructure as Code (Terraform) для подготовки среды развёртывания (например, Cloud Run) и конфигурации CI/CD-конвейеров (Cloud Build) для автоматизации всего жизненного цикла.

Создание ответственных и безопасных ИИ-агентов с помощью AgentOps

Цзя Ли, соучредитель, президент и главный ИИ-офицер LiveX AI:
«По мере того как ИИ-агенты всё глубже интегрируются в нашу жизнь, крайне важно решать новые вызовы, связанные с доверием, конфиденциальностью и безопасностью.
Нам необходимо думать о безопасности и приватности и задавать себе вопрос: как создавать надёжные продукты?»

Создание мощных агентов неотделимо от безусловной ответственности за их безопасность, защиту и соответствие целям. Это означает проектирование систем с самого начала с защитными механизмами, предотвращающими вредоносные или непреднамеренные последствия, включая несправедливую предвзятость, нарушения конфиденциальности и уязвимости в безопасности.

Для решения этой задачи требуется структурированный подход. Диаграмма ниже даёт общий обзор распространённых рисков и типов технических и процедурных мер защиты, используемых для их снижения. Хотя это ценный отправной пункт, для полного руководства по стандартам и лучшим практикам мы настоятельно рекомендуем ознакомиться с Secure AI Framework (SAIF) от Google.

Типы рисков и соответствующие меры защиты:

Несоответствие ожиданиям (например, по безопасности, качеству, точности)
→ Проверки на заучивание (recitation checks), каналы обратной связи от пользователей, API модерации контента
Неправомерное или вредоносное использование разработчиками или пользователями
→ Условия использования, политика допустимого использования, ограничения на приватность
Создание ложного впечатления о наличии возможностей, которых на самом деле нет
→ Предупреждения в интерфейсе, политика допустимого использования, карточки моделей (model cards)
Формирование или усиление негативных социальных предубеждений и вреда
→ Оценка моделей, инструменты оценки предвзятости, атрибуты безопасности
Усиление неравенства или других социально-экономических проблем
→ Руководства по ответственному ИИ (RAI guides), политика допустимого использования, мониторинг моделей
Небезопасное развёртывание (например, слишком рано или без достаточного тестирования)
→ Оценка моделей, инструменты оценки предвзятости, руководства RAI
Создание или усиление информационных угроз (например, отсутствие привязки к фактам, недостоверность, подтверждение существующих убеждений)
→ Проверки на заучивание, инструменты оценки предвзятости, оценка моделей

ADK и Agent Starter Pack реализуют стратегию «защиты в глубину» (defense-in-depth) в этой критически важной области.

Во-первых, с помощью ADK вы можете внедрить детализированные механизмы безопасности на уровне приложения.
Во-вторых, Agent Starter Pack автоматизирует развёртывание защищённой облачной инфраструктуры, которая обеспечивает соблюдение этих мер безопасности в масштабе.

Такой комплексный подход охватывает ключевые аспекты безопасности и соответствия требованиям:

Безопасная инфраструктура и контроль доступа:
Agent Starter Pack использует Terraform для подготовки защищённой основы: развёртывает агента в таких средах, как Cloud Run, и настраивает конкретные роли IAM, чтобы применять принцип минимальных привилегий. Инструменты, определённые вами в ADK, работают в рамках этих строгих разрешений на уровне облака, что гарантирует: даже если логика агента будет скомпрометирована, он не сможет получить доступ к неавторизованным ресурсам.
Контрольные механизмы на входе и выходе (guardrails):
В ADK вы можете реализовать логику приложения для проверки промптов на предмет возможных атак (например, инъекций) и фильтрации финальных ответов агента от вредоносного контента. Agent Starter Pack делает эти механизмы надёжными, интегрируя их в CI/CD-конвейер. Таким образом, вы можете запускать автоматизированные тесты безопасности для каждого изменения кода, чтобы выявлять уязвимости до попадания в продакшен.
Аудит и мониторинг:
Подробная наблюдаемость в ADK создаёт детальную трассировку каждого «мысли» и вызова инструмента агентом. Agent Starter Pack автоматизирует этот процесс: настраивает маршрутизацию логов в BigQuery для долгосрочного и безопасного хранения. Это формирует устойчивый журнал аудита, необходимый для проверок на соответствие и реагирования на инциденты.

Безопасность — это партнёрство.
Хотя ADK предоставляет фреймворк для когнитивной архитектуры агента, а Agent Starter Pack — компоненты для его развёртывания, оба они работают в рамках более широкой экосистемы Google Cloud. Всё это даёт вам мощную позицию в области безопасности, построенную на принципах «безопасность по замыслу» (secure-by-design), с интегрированными средствами защиты для любых рабочих нагрузок.

Ключевые выводы: создание надёжных агентов

Готовы воплотить своё ИИ-видение в жизнь?

Мы здесь, чтобы помочь.

Начните сейчас
Узнайте, как создавать больше приложений на основе генеративного ИИ, с помощью записей сессий Startup School по запросу.
Подайте заявку
Получите до 350 000 долларов США в виде кредитов Google Cloud через программу Google for Startups Cloud Program.
Свяжитесь с нами
Обратитесь в нашу команду поддержки стартапов.
Подпишитесь
Оставайтесь в курсе и получайте все последние обновления, подписавшись на новостную рассылку Google Cloud для стартапов.

Раздел 4: Больше возможностей полного ИИ-стека Google

Google Cloud предлагает единый, комплексный ИИ-стек — от инфраструктуры и моделей до инструментов и сервисов, — который позволяет стартапам быстро создавать и масштабировать передовые ИИ-продукты.

Создавайте быстро с помощью Gemini в Google AI Studio
Google AI Studio — это самый быстрый способ начать работу с моделью Gemini. Вы можете экспериментировать с промптами, настраивать модели и интегрировать их в своё приложение всего за несколько минут. Это идеальный инструмент для прототипирования и быстрой проверки идей.

Используйте самые мощные мультимодальные модели
Семейство моделей Gemini 2.5 включает специализированные версии для разных задач:

Gemini 2.5 Flash — для высокоскоростных, экономичных приложений с высокой нагрузкой.
Gemini 2.5 Pro — для сложных многошаговых рассуждений и генерации кода мирового уровня.
Gemini 2.5 Flash Image (aka Nano Banana) — для генерации и редактирования изображений с поддержкой естественного языка.

Расширяйте возможности с помощью видео и изображений

Veo — генерация высококачественных видео по текстовому или визуальному описанию.
Imagen — создание и редактирование фотореалистичных изображений с помощью ИИ.

Эти модели позволяют создавать богатые, мультимодальные пользовательские сценарии — от интерактивных историй до автоматизированного контент-маркетинга.

Заключение

Путь от прототипа к системе, готовой к эксплуатации в продакшене, — это путь дисциплинированной инженерии. Используя подход с приоритетом кода, такой как ADK, и операционные принципы, изложенные в этом руководстве, вы можете выйти за рамки неформального «тестирования на ощущение» и перейти к строгому, надёжному процессу создания и управления полным жизненным циклом вашего агента.

Для вашего стартапа такой дисциплинированный подход становится мощным конкурентным преимуществом. Ваша команда сможет быстрее итерировать и внедрять инновации, автоматизируя при этом ресурсоёмкие процессы оценки.

Кроме того, вы сможете масштабироваться с уверенностью, не жертвуя безопасностью или надёжностью.

Как показано в этом руководстве, Google Cloud поддерживает ваши инновации — от специализированного ИИ-оборудования и унифицированной платформы данных до моделей, сервисов и инструментов, необходимых для превращения вашей идеи в сложную ИИ-систему.

Платформа — это основа; ваше уникальное видение и принципы, изложенные в этом руководстве, — чертёж.
Вместе они формируют основу для создания следующего поколения интеллектуальных систем, которые будут двигать ваш стартап вперёд.

Ресурсы

AdkApp: Разрабатывайте и разворачивайте агентов на Vertex AI Agent Engine.
Agent Development Kit (ADK): Гибкая и модульная платформа для разработки и развёртывания ИИ-агентов.
Agent2Agent (A2A): Открытый протокол, обеспечивающий взаимодействие и совместимость между непрозрачными агентными приложениями.
Agent Starter Pack: Быстро создавайте агентов, готовых к продакшену, на Google Cloud. Переходите от идеи к развёртыванию быстрее благодаря готовым шаблонам и инструментам.
BigQuery: Полностью управляемое, масштабируемое до петабайтов и экономически эффективное хранилище аналитических данных в Google Cloud, позволяющее выполнять аналитику над огромными объёмами данных почти в реальном времени.
Check grounding API: В рамках вашего опыта работы с RAG в ИИ-приложениях вы можете проверить привязку (grounding), чтобы определить, насколько конкретный фрагмент текста («кандидат в ответ») обоснован заданным набором эталонных текстов («фактов»).
Cloud Functions API: Этот API управляет лёгкими функциями, предоставленными пользователем и выполняемыми в ответ на события.
Cloud Run: Запускайте фронтенд- и бэкенд-сервисы, пакетные задания, хостите LLM и обрабатывайте задачи из очередей без необходимости управлять инфраструктурой.
Cloud Storage bucket: Бакеты — это базовые контейнеры для хранения ваших данных. Всё, что вы сохраняете в Cloud Storage, должно находиться внутри бакета.
Colab Enterprise: Colab Enterprise — это совместная, управляемая среда ноутбуков с возможностями безопасности и соответствия требованиям Google Cloud.
Example Store: Позволяет хранить и динамически извлекать few-shot примеры.
Firestore: Высокомасштабируемая NoSQL база данных для веб- и мобильных приложений.
Gemini 2.5 Flash: Модель Gemini 2.5 Flash предназначена для балансировки качества, стоимости и скорости.
Gemini 2.5 Flash Image (aka Nano Banana): Gemini может генерировать и обрабатывать изображения в диалоговом режиме. Вы можете передавать Gemini текст, изображения или их комбинацию, чтобы создавать, редактировать и итеративно улучшать визуальный контент с беспрецедентным контролем.
Gemini 2.5 Pro: Самая продвинутая модель Gemini для сложных рассуждений, способная решать самые трудные задачи.
Gemini CLI: Бесплатный и open-source инструмент, который приносит Gemini 2.5 прямо в терминал разработчика — с беспрецедентным уровнем доступа для отдельных пользователей.
Gemma: Набор лёгких, передовых open-source моделей, созданных на той же технологии, что и модели Gemini.
Gen AI evaluation service: Сервис оценки генеративного ИИ в Vertex AI позволяет оценивать любую генеративную модель или приложение и сравнивать результаты оценки с вашим собственным суждением, используя ваши критерии.
Google AI Studio: Самый быстрый способ начать работу с Gemini — новым поколением мультимодальных генеративных ИИ-моделей.
Google Cloud Observability: Набор сервисов наблюдаемости, помогающих понять поведение, состояние и производительность ваших приложений.
Google Kubernetes Engine (GKE): Самый масштабируемый и полностью автоматизированный сервис Kubernetes. Запускайте контейнеры в автономном режиме и безопасно выполняйте корпоративные рабочие нагрузки в масштабе — даже без глубоких знаний Kubernetes.
GraphRAG: GraphRAG на Google Cloud сочетает знаниевые графы с Retrieval-Augmented Generation (RAG), чтобы повысить точность, контекстуальность и объяснимость больших языковых моделей (LLM).
Imagen: Imagen в Vertex AI предоставляет разработчикам передовые возможности генерации изображений от Google.
Model Context Protocol (MCP): MCP — это открытый протокол, стандартизирующий способ, которым приложения предоставляют контекст большим языковым моделям (LLM).
Model evaluation in Vertex AI: Сервис оценки предиктивных моделей в Vertex AI позволяет оценивать производительность модели в конкретных сценариях использования.
Model Garden on Vertex AI: Единое место для быстрого старта вашего ML-проекта: здесь можно обнаруживать, настраивать и развёртывать разнообразные модели от Google и партнёров.
Model tuning: Дообучение модели — ключевой процесс адаптации Gemini для выполнения конкретных задач с повышенной точностью и аккуратностью.
ReAct: Оркестрация с помощью агента ReAct (Reasoning + Action) предполагает многоэтапное взаимодействие между приложением и моделью (или моделями), при котором агент управляет диалогами, транзакциями и инструкциями для LLM.
Responsible AI: Чтобы помочь разработчикам, Vertex AI Studio включает встроенную фильтрацию контента, а наши генеративные ИИ-API предоставляют оценку по атрибутам безопасности. Это позволяет клиентам тестировать фильтры Google и задавать пороги уверенности, подходящие их сценарию и бизнесу.
Retrieval-Augmented Generation (RAG): RAG — это ИИ-фреймворк, объединяющий преимущества традиционных систем информационного поиска (например, поиск и базы данных) с возможностями генеративных LLM.
Vector database: Векторная база данных — это любая база, позволяющая хранить, индексировать и запрашивать векторные эмбеддинги — числовые представления неструктурированных данных, таких как текст, изображения или аудио.
Veo: Вы можете использовать Veo в Vertex AI для генерации новых видео по текстовому или визуальному промпту.
Vertex AI Agent Engine: Vertex AI Agent Engine — это набор сервисов, позволяющих разработчикам развёртывать, управлять и масштабировать ИИ-агентов в продакшене.
Vertex AI notebooks: Доступ ко всем возможностям платформы Vertex AI для работы на всех этапах дата-сайенс-процесса — от исследования данных до прототипирования и развёртывания в продакшен.
Vertex AI Platform: Vertex AI — это полностью управляемая, унифицированная платформа для разработки и использования генеративного ИИ.
Vertex AI RAG Engine: Vertex AI RAG Engine — это фреймворк данных для создания приложений на основе LLM с расширенным контекстом.
Vertex AI Search: Vertex AI Search объединяет мощь глубокого информационного поиска, передовые технологии обработки естественного языка и новейшие методы работы с LLM, чтобы понимать намерения пользователей и возвращать наиболее релевантные результаты.
Vertex AI Studio: Упростите свои рабочие процессы с фундаментальными моделями с помощью Vertex AI Studio. Быстро создавайте прототипы, улучшайте их и легко развёртывайте модели в своих приложениях.

Вопросы?
Обратитесь в нашу команду поддержки стартапов.
Свяжитесь с нами