Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
MiniMax Understand Image — это специализированный навык для анализа изображений с использованием протокола MCP (Model Context Protocol) и возможностей MiniMax. Он позволяет автоматически распознавать объекты, сцены, текст и контекст на изображениях, работая как с локальными файлами, так и с URL.
Когда использовать
Навык активируется в ситуациях, когда требуется:
- проанализировать изображение или описать его содержимое;
- распознать объекты, текст или сцены;
- ответить на конкретные вопросы по изображению;
- использовать функцию
understand_imageот MiniMax.
Что делает этот навык
Инструмент интегрируется с MiniMax MCP и обеспечивает полноценное понимание визуального контента. Он принимает изображение и текстовый запрос, после чего возвращает структурированный результат анализа.
- работает с локальными изображениями и ссылками;
- генерирует подробные описания;
- выделяет ключевые объекты и элементы сцены;
- извлекает текстовую информацию при наличии;
- поддерживает кастомные вопросы к изображению.
Процесс работы
Первый запуск требует базовой настройки окружения, после чего использование сводится к вызову функции анализа изображения.
Шаг 1. Установка зависимостей
Проверьте наличие утилиты uvx. Если она отсутствует — установите её через официальный скрипт или зеркало.
which uvx
После этого убедитесь, что MCP-сервер установлен:
uvx minimax-coding-plan-mcp --help
Если сервер отсутствует — установите его:
uvx install minimax-coding-plan-mcp
Шаг 2. Проверка API-ключа
Убедитесь, что API-ключ MiniMax уже настроен:
cat ~/.openclaw/config/minimax.json
Если ключ отсутствует — его необходимо добавить вручную.
Шаг 3. Настройка API-ключа
Если ключ не найден, его можно:
- получить из существующих конфигураций;
- запросить у пользователя;
- создать новый через платформу MiniMax.
Сохраните ключ в конфигурационный файл:
{
"api_key": "ВАШ_API_KEY",
"output_path": "~/.openclaw/workspace/minimax-output"
}
Шаг 4. Анализ изображения
Подготовьте изображение — локальный файл или URL — и выполните вызов скрипта:
python3 scripts/understand_image.py <путь_к_изображению> "Ваш вопрос"
Примеры:
# Описание изображения
python3 scripts/understand_image.py ~/image.jpg "Опиши это изображение"
# Анализ по URL
python3 scripts/understand_image.py "https://example.com/image.jpg" "Что здесь происходит?"
Параметры API
- image — путь к изображению или URL (обязательный параметр);
- prompt — текстовый запрос к изображению (обязательный параметр).
Как это работает
Скрипт автоматически определяет API-ключ (через переменные окружения или конфигурацию), запускает MCP-сервер и отправляет запрос в формате JSON-RPC к инструменту understand_image. В ответ возвращается структурированный JSON с результатами анализа.
Обработка ошибок
- если API-ключ отсутствует — выводится ошибка конфигурации;
- если не установлен
uvx— предлагается установка; - ошибки MCP-сервера выводятся через stderr.
Итог
MiniMax Understand Image — это удобный инструмент для автоматического анализа изображений в рамках OpenClaw. Он объединяет мощь визуальных моделей MiniMax с гибкостью MCP, позволяя интегрировать обработку изображений в любые AI-процессы и сценарии. :
Файл из источника