Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Инструмент генерации изображений позволяет агенту создавать и редактировать визуальный контент с использованием подключённых провайдеров. Сгенерированные изображения автоматически возвращаются в ответе агента в виде медиафайлов, что делает процесс максимально простым и быстрым.
Функция становится доступной только при наличии хотя бы одного настроенного провайдера генерации изображений. Если инструмент не отображается, необходимо задать API-ключ и выбрать модель по умолчанию.
Быстрый старт
Чтобы начать использовать генерацию изображений, выполните несколько простых шагов:
- Установите API-ключ одного из провайдеров (например, OpenAI или Google).
- При необходимости укажите модель генерации по умолчанию.
- Отправьте агенту запрос на создание изображения.
После этого агент автоматически вызовет инструмент генерации без дополнительной настройки.
Как это работает
Вам достаточно описать желаемое изображение текстом. Агент интерпретирует запрос и вызывает соответствующий инструмент генерации. Например, можно попросить создать дружелюбного персонажа или визуал для маркетинга — всё происходит в рамках одного диалога.
При этом не требуется вручную подключать инструменты — система автоматически активирует их при наличии доступного провайдера.
Поддерживаемые провайдеры
Инструмент поддерживает несколько популярных платформ генерации изображений. Каждая из них предлагает собственные модели, возможности редактирования и требования к API-ключам.
- OpenAI — модель gpt-image-1 с поддержкой генерации и редактирования изображений.
- Google — модель Gemini с возможностями визуального создания.
- Fal — модели Flux для генерации изображений.
- MiniMax — поддержка генерации с использованием референсов.
- ComfyUI — кастомные workflow для генерации изображений.
- Vydra — базовые функции генерации без редактирования.
Параметры инструмента
Для управления генерацией используются следующие параметры:
- prompt — текстовое описание изображения (обязательный параметр).
- action — действие: генерация или просмотр доступных моделей.
- model — выбор конкретной модели (опционально).
Эти параметры позволяют гибко управлять процессом создания изображений и адаптировать результат под конкретные задачи.
Гибкость и возможности
Инструмент поддерживает как простую генерацию изображений по тексту, так и более сложные сценарии — например, редактирование существующих изображений или использование нескольких моделей в зависимости от задачи.
Также доступна функция просмотра списка доступных моделей в реальном времени, что позволяет выбирать оптимальный вариант для каждого конкретного случая.
Таким образом, генерация изображений становится не отдельным инструментом, а частью единого интеллектуального рабочего процесса, где агент берёт на себя как интерпретацию задачи, так и её визуальную реализацию. :
Файл из источника