Скиллы Средний Коммуникация и социальные сети

MiniMax Understand Image

Скачать ZIP
12
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

MiniMax Understand Image — это специализированный навык для анализа изображений с использованием протокола MCP (Model Context Protocol) и возможностей MiniMax. Он позволяет автоматически распознавать объекты, сцены, текст и контекст на изображениях, работая как с локальными файлами, так и с URL.

Когда использовать

Навык активируется в ситуациях, когда требуется:

  • проанализировать изображение или описать его содержимое;
  • распознать объекты, текст или сцены;
  • ответить на конкретные вопросы по изображению;
  • использовать функцию understand_image от MiniMax.

Что делает этот навык

Инструмент интегрируется с MiniMax MCP и обеспечивает полноценное понимание визуального контента. Он принимает изображение и текстовый запрос, после чего возвращает структурированный результат анализа.

  • работает с локальными изображениями и ссылками;
  • генерирует подробные описания;
  • выделяет ключевые объекты и элементы сцены;
  • извлекает текстовую информацию при наличии;
  • поддерживает кастомные вопросы к изображению.

Процесс работы

Первый запуск требует базовой настройки окружения, после чего использование сводится к вызову функции анализа изображения.

Шаг 1. Установка зависимостей

Проверьте наличие утилиты uvx. Если она отсутствует — установите её через официальный скрипт или зеркало.

which uvx

После этого убедитесь, что MCP-сервер установлен:

uvx minimax-coding-plan-mcp --help

Если сервер отсутствует — установите его:

uvx install minimax-coding-plan-mcp

Шаг 2. Проверка API-ключа

Убедитесь, что API-ключ MiniMax уже настроен:

cat ~/.openclaw/config/minimax.json

Если ключ отсутствует — его необходимо добавить вручную.

Шаг 3. Настройка API-ключа

Если ключ не найден, его можно:

  • получить из существующих конфигураций;
  • запросить у пользователя;
  • создать новый через платформу MiniMax.

Сохраните ключ в конфигурационный файл:

{
 "api_key": "ВАШ_API_KEY",
 "output_path": "~/.openclaw/workspace/minimax-output"
}

Шаг 4. Анализ изображения

Подготовьте изображение — локальный файл или URL — и выполните вызов скрипта:

python3 scripts/understand_image.py <путь_к_изображению> "Ваш вопрос"

Примеры:

# Описание изображения
python3 scripts/understand_image.py ~/image.jpg "Опиши это изображение"

# Анализ по URL
python3 scripts/understand_image.py "https://example.com/image.jpg" "Что здесь происходит?"

Параметры API

  • image — путь к изображению или URL (обязательный параметр);
  • prompt — текстовый запрос к изображению (обязательный параметр).

Как это работает

Скрипт автоматически определяет API-ключ (через переменные окружения или конфигурацию), запускает MCP-сервер и отправляет запрос в формате JSON-RPC к инструменту understand_image. В ответ возвращается структурированный JSON с результатами анализа.

Обработка ошибок

  • если API-ключ отсутствует — выводится ошибка конфигурации;
  • если не установлен uvx — предлагается установка;
  • ошибки MCP-сервера выводятся через stderr.

Итог

MiniMax Understand Image — это удобный инструмент для автоматического анализа изображений в рамках OpenClaw. Он объединяет мощь визуальных моделей MiniMax с гибкостью MCP, позволяя интегрировать обработку изображений в любые AI-процессы и сценарии. :


Файл из источника

11156_minimax-understand-image-1.0.3.zip