Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
MinerU PDF Parser — это навык для OpenClaw, который превращает PDF, Word, презентации и изображения в аккуратный Markdown с сохранением структуры документа.
В основе лежит VLM-движок MinerU, позволяющий извлекать текст, таблицы, формулы и изображения практически без потери контекста. :
Что это такое
MinerU — это open-source решение для точного извлечения содержимого документов. Оно сочетает OCR, анализ структуры и постобработку, чтобы получать чистые и пригодные для LLM данные. :
В формате навыка OpenClaw он становится удобным инструментом для автоматического преобразования документов в Markdown — формат, идеально подходящий для дальнейшей работы с ИИ и базами знаний.
Когда использовать
- Конвертация PDF, Word или PPT в Markdown
- Извлечение текста из изображений (OCR)
- Работа с научными статьями и сложными макетами
- Подготовка данных для LLM или RAG-систем
Поддерживаемые форматы
- PDF — статьи, книги, сканы
- DOCX — отчёты и документы
- PPTX — презентации
- JPG / PNG — изображения с текстом
Ключевые возможности
- Сохранение структуры документа (заголовки, колонки, порядок чтения)
- Извлечение таблиц и формул
- Автоматическое извлечение изображений
- Поддержка сложных макетов и смешанного контента
- Выход в Markdown + JSON с метаданными
По сравнению с обычными PDF-парсерами, MinerU даёт значительно более точный и структурированный результат, особенно на сложных документах. :
Установка
clawhub install mineru-skill
Перед использованием необходимо получить API-токен и задать его в переменной окружения:
export MINERU_TOKEN="your-token-here"
Пример использования
python3 scripts/mineru_v2.py \
--file ./document.pdf \
--output ./output/
Для пакетной обработки можно указать директорию и включить параллельную обработку файлов.
Режимы работы
- pipeline — быстрый и универсальный режим
- vlm — медленный, но максимально точный (для сложных документов)
- MinerU-HTML — вывод, оптимизированный под веб
Ограничения
- До 2000 страниц в день
- До 200 МБ на файл
- До 600 страниц на документ
Структура результата
output/
├── document-name/
│ ├── document-name.md
│ ├── images/
│ └── content.json
Markdown-файл содержит основной текст, а JSON — подробную структуру и метаданные документа.
Почему это важно
Современные AI-агенты работают лучше с чистыми и структурированными данными. MinerU решает одну из ключевых проблем — преобразование “грязных” документов в формат, пригодный для автоматизации, поиска и анализа.
В экосистеме OpenClaw такие навыки позволяют быстро расширять возможности агента без написания кода — достаточно установить нужный skill. :
Файл из источника