AI

Агентный ИИ против генеративного ИИ

Узнайте, чем отличаются агентный и генеративный ИИ, почему они важны и когда использовать каждую парадигму для автоматизации задач или создания контента.
1 мин. чтения
Agentic AI vs Generative AI blog image

Агентный и генеративный ИИ станут двумя определяющими парадигмами этого десятилетия. По мере того как ИИ стремительно расширяется и получает широкое распространение, в его архитектуре появляются две различные модели – агентный и генеративный.

После этого вы сможете ответить на следующие вопросы:

  • Что такое агентный ИИ?
  • Что такое генеративный искусственный интеллект?
  • Почему они оба важны?
  • Когда следует использовать каждый из них?

Краткий обзор этих технологий

И агентивный, и генеративный ИИ часто имеют одну и ту же основу – веса, предварительное обучение, тонкая настройка и LLM. Основные различия заключаются в их использовании. Чтобы объяснить разницу, я воспользуюсь музыкой.

  • Агентный искусственный интеллект: исполнение музыки, написанной кем-то другим, – точное следование каждой ноте – до мелочей.
  • Генеративный ИИ: возможно, это все еще исполнение, но уже импровизированное. Генеративный ИИ – это тот, кто пишет музыку – вспомните Бетховена или джазового музыканта.

Агентный ИИ выполняет сложную задачу. Генеративный ИИ создает нечто совершенно новое.

Чем они делятся

  • Веса: Веса представляют собой то, что модель действительно выучила. Они определяют внутреннее распознавание образов и принятие решений.
  • Предварительное обучение: В ходе этого процесса модель обучается на огромных массивах данных и соответствующим образом настраивает свои внутренние веса.
  • Тонкая настройка: После обучения модель настраивается под конкретные задачи и области. Ее весовые коэффициенты тонко настраиваются, чтобы она вела себя так, как задумано.
  • Модель: После процесса обучения модель используется для выполнения своей задачи. Как в агентном, так и в генеративном ИИ конечный результат обычно (не всегда) обеспечивается LLM.

Где они расходятся

  • Конечная цель: Агентные ИИ создаются для выполнения задачи. Генеративные ИИ создаются для создания контента.
  • Взаимодействие: Агентные ИИ используют минимум подсказок, они следуют процессу – заданный план определяет их действия. Генеративный ИИ почти полностью зависит от подсказок – модель получает подсказку и генерирует контент, интерпретируя ее.
  • Автономность: Агентные ИИ часто обладают высокой степенью автономности, в то время как генеративные ИИ работают под руководством человека. Когда вы скребёте LinkedIn с помощью ChatGPT, вы используете агентный ИИ. Когда вы просите ChatGPT создать изображение, вы используете генеративный ИИ.
  • Выходные данные: Агентные ИИ выводят изменения в состоянии – “статус задания: выполнено”. Генеративный ИИ обычно выводит текст, изображения или видео.
  • Оценка: Агентные ИИ оцениваются по успешному выполнению задания. Генеративные ИИ оцениваются по качеству, релевантности и оригинальности их результатов.

Агентный искусственный интеллект

Блок-схема, иллюстрирующая процесс с этапами: Планирование, Инструментарий, Обновление состояния, Обратная связь, Оценка, приводящие к двум результатам: Успех (зеленый) и Неудача (красный). Поток включает в себя обратный цикл от оценки к планированию.

Агентный ИИ основан на выполнении задачи. Не следует путать его с агентами ИИ. Агенты – это реальное, практическое применение агентного ИИ. Когда вы создаете программное обеспечение с использованием агентного ИИ, ваше приложение, скорее всего, имеет одну или несколько из следующих потребностей.

  • Принятие решений
  • Решение проблем
  • Автономия
  • Взаимодействие
  • Завершение задачи

Под капотом

  1. Планирование: Любому агенту ИИ нужен как минимум свободный план. Это может быть что-то простое, например, запрос: “Вы полезный помощник по скрапбукингу, пожалуйста, извлеките эти продукты и выведите их в JSON”.
  2. Инструментарий и функциональные вызовы: Агент не может работать в одиночку. В зависимости от сложности, вы можете предоставить ему доступ к калькулятору или даже к полному экземпляру Playwright. Вы предоставляете агенту доступ, а он решает, как и когда использовать инструменты.
  3. Управление состоянием: Агент должен знать как краткосрочный, так и долгосрочный контекст. Для краткосрочного контекста может быть достаточно контекста чата, но это нежелательно. Простое CRUD-приложение (Create, Read, Update, Delete) помогает в работе. Постоянное хранение данных позволяет агенту правильно отслеживать свою работу.
  4. Петля обратной связи: Агент должен работать по циклу до тех пор, пока его задача не будет выполнена или пока он не будет условно остановлен – например, прерван пользователем.
  5. Оценка и прекращение работы: Агент должен знать, когда его работа завершена. Если задание было выполнено, но результат оказался неприемлемым, агенту необходимо повторить процесс. Если задание выполнено успешно, агент должен выйти из цикла управления.

Примеры использования

  • Обслуживание клиентов: Почти на каждом сайте есть чат-бот в службе поддержки. В таких случаях модель может регистрировать проблему, настроение пользователя, а затем использовать вызовы функций для подачи заявки или отметки о решении проблемы.
  • Здравоохранение: Индустрия здравоохранения использует агентный ИИ с 1990-х годов – задолго до того, как эта парадигма получила свое название. Агенты получают такие данные, как рентгеновские снимки, результаты УЗИ и историю болезни, чтобы ускорить диагностику.
  • Рабочие процессы: Представьте, что ваш агент имеет доступ как к браузеру, так и к файловой системе. Он может выполнить сканирование, а затем ввести извлеченные данные непосредственно в ваш носитель, будь то база данных SQL или простой файл JSON.
  • Автономные роботы: Возможно, наиболее широкое применение агентного ИИ находит в виде автономных роботов и умных домов. Самостоятельное вождение Tesla – это агентский ИИ. Так же, как и умные приборы и Roombas.

Генеративный ИИ

Блок-схема, иллюстрирующая процесс, включающий элементы, обозначенные как "Prompt", "RAG", "Vector Encoding", "Model" и "Output", со стрелками, указывающими направление потока, и петлей обратной связи от "Output" обратно к "RAG".

Как я уже говорил, генеративный ИИ больше похож на композитора или джазового музыканта. Он по-прежнему сильно зависит от предварительного обучения (возможно, даже в большей степени), но использует это предварительное обучение для создания новых структурированных или неструктурированных данных – о разнице между структурированными и неструктурированными данными вы можете узнать здесь. Генеративный ИИ удовлетворяет перечисленные ниже потребности.

  • Создание уникальных выходных данных
  • Анализ данных
  • Адаптация
  • Персонализация

Под капотом

  1. Предварительно обученная базовая модель: В основе генеративных моделей ИИ лежит гигантская нейронная сеть. ChatGPT, Grok, Claude – все эти модели используют архитектуру трансформатора. Обучение позволяет делать выводы, а выводы позволяют нам создавать новые данные.
  2. Оперативный интерфейс: Эти модели часто предназначены для прямого взаимодействия с человеком. Когда вы говорите модели: “Создайте мем” или “Обобщите этот текст”, подсказка используется непосредственно для создания вывода.
  3. Векторное кодирование: Ваш запрос кодируется в числовой вектор. Затем этот вектор интерпретируется с внутренними вкраплениями модели. Подробнее об этих векторах и вкраплениях вы можете узнать здесь.
  4. Retrieval-Augmented Generation: RAG все еще считается необязательным, но становится все более распространенным. Когда модель чего-то не знает, она выполняет поиск (retrieval) соответствующих данных. Затем она использует нулевое обучение для улучшения (дополнения) своих результатов (генерации).
  5. Выходной носитель: Модель использует ту же векторную кодировку для преобразования выходных данных в лексемы (текст) или даже изображения или видео. В зависимости от запроса, вы можете даже запросить данные в формате JSON или CSV.

Примеры использования

  • Разговорные инструменты: В отличие от чат-ботов службы поддержки, генеративные чат-боты предназначены для ведения беседы и создания уникальных результатов – они имитируют более глубокий разговор, чем “Вы уверены, что он подключен к сети?”. Grok, ChatGPT, Claude и большинство других веб-приложений, ориентированных на LLM, являются разговорными инструментами.
  • Создание контента: Качественный контент часто можно получить за считанные секунды при правильной подсказке. Нужны ли вам концепт-арты, сообщения в социальных сетях или длинные тексты, генеративные модели справятся с этими задачами.
  • Анализ и генерация данных: Загрузите файл набора данных в модель для анализа. В зависимости от модели вы можете получить подробный отчет или даже создать новый синтетический набор данных, отражающий закономерности исходного.
  • Персонализированные помощники: Генеративные ИИ обладают высокой степенью настраиваемости – они созданы для того, чтобы быть уникальными. Если вам нужен помощник с определенным тоном, приведите ему несколько примеров, и вы получите индивидуальную личность.

Ключевое сравнение между агентным и генеративным ИИ

Критерии Агентный искусственный интеллект Генеративный ИИ
Основная цель ✔️ Выполнение и завершение задач ✔️ Формирование и синтез контента
Ориентированные на достижение целей ✔️ Да – действует в соответствии с определенными целями ❌ Не целеустремленные по своей природе
Зависимость от подсказок ❌ Минимальный – часто работает автономно ✔️ Высокий – требуется запрос для инициирования выхода
Тип выхода ✔️ Изменение состояния, завершенные действия ✔️ Текст, изображения, код, структурированные данные.
Использование инструментов / доступ к API ✔️ Часто использует инструменты и функции ❌ Редко (если только не завернуты в агентский цикл)
Требования к памяти ✔️ Нужна кратковременная и долговременная память ❌ Дополнительно (только в RAG или пользовательских сборках)
Поток управления ✔️ Контур обратной связи с логикой повтора ❌ Одноразовая генерация (по умолчанию без цикла)
Автономия ✔️ Возможна высокая автономность ❌ Человек в петле – это типично.
Метод оценки ✔️ Двоичный успех/неудача ✔️ Субъективное качество (оригинальность, тон и т.д.)
Примеры из реальной жизни ✔️ Боты для веб-скреппинга, самодвижущиеся автомобили ✔️ ChatGPT, DALL-E, GitHub Copilot

Заключение

Агентный ИИ и генеративный ИИ не должны конкурировать друг с другом. Это две разные ниши с инструментами, которые существенно пересекаются. Агентный ИИ действует по плану, в то время как генеративный ИИ импровизирует по одной подсказке за раз.

Такие инструменты, как Model Context Protocol от Bright Data, позволяют вашему агенту или LLM использовать реальные веб-данные в режиме реального времени. Это невероятно мощно – ваш ИИ может получить доступ к любому публичному сайту в Интернете. В агентном ИИ это улучшает процесс принятия решений, а в генеративном – повышает производительность.

Агентный и генеративный ИИ будут доминировать в будущем. Строители и аналитики, которые понимают, как использовать оба этих направления, будут иметь все шансы на успех.

Кредитная карта не требуется

Вас также может заинтересовать

Utilize Browser Use With a Scraping Browser blog image
AI

Создайте агентов ИИ с browser-use и Scraping Browser

Узнайте, как создать агентов искусственного интеллекта на Python, которые смогут преодолеть ограничения автоматизации браузера и избежать блокировок, интегрировав использование браузера с браузером для скрапинга.
7 мин. чтения
What is AI Model Training blog image
AI

Что такое обучение моделей искусственного интеллекта? Все, что вам нужно знать

Модели искусственного интеллекта обучаются с помощью структурированного обучения, совершенствуя свои способности на основе данных. Изучите процесс обучения ИИ и его реальное применение.
1 мин. чтения
Scraping Browser + Apify blog image
Веб-данные

Веб-скраппинг с помощью браузера Bright Data на Apify

Узнайте, как интегрировать браузер Scraping Browser от Bright Data с Apify, чтобы повысить эффективность веб-скреппинга, сократить расходы и обойти проблемы с анти-ботами.
7 мин. чтения