Скиллы Новичок Разное

MinerU PDF Parser

Скачать ZIP
12
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

MinerU PDF Parser — это навык для OpenClaw, который превращает PDF, Word, презентации и изображения в аккуратный Markdown с сохранением структуры документа.

В основе лежит VLM-движок MinerU, позволяющий извлекать текст, таблицы, формулы и изображения практически без потери контекста. :

Что это такое

MinerU — это open-source решение для точного извлечения содержимого документов. Оно сочетает OCR, анализ структуры и постобработку, чтобы получать чистые и пригодные для LLM данные. :

В формате навыка OpenClaw он становится удобным инструментом для автоматического преобразования документов в Markdown — формат, идеально подходящий для дальнейшей работы с ИИ и базами знаний.

Когда использовать

  • Конвертация PDF, Word или PPT в Markdown
  • Извлечение текста из изображений (OCR)
  • Работа с научными статьями и сложными макетами
  • Подготовка данных для LLM или RAG-систем

Поддерживаемые форматы

  • PDF — статьи, книги, сканы
  • DOCX — отчёты и документы
  • PPTX — презентации
  • JPG / PNG — изображения с текстом

Ключевые возможности

  • Сохранение структуры документа (заголовки, колонки, порядок чтения)
  • Извлечение таблиц и формул
  • Автоматическое извлечение изображений
  • Поддержка сложных макетов и смешанного контента
  • Выход в Markdown + JSON с метаданными

По сравнению с обычными PDF-парсерами, MinerU даёт значительно более точный и структурированный результат, особенно на сложных документах. :

Установка

clawhub install mineru-skill

Перед использованием необходимо получить API-токен и задать его в переменной окружения:

export MINERU_TOKEN="your-token-here"

Пример использования

python3 scripts/mineru_v2.py \
 --file ./document.pdf \
 --output ./output/

Для пакетной обработки можно указать директорию и включить параллельную обработку файлов.

Режимы работы

  • pipeline — быстрый и универсальный режим
  • vlm — медленный, но максимально точный (для сложных документов)
  • MinerU-HTML — вывод, оптимизированный под веб

Ограничения

  • До 2000 страниц в день
  • До 200 МБ на файл
  • До 600 страниц на документ

Структура результата

output/
 ├── document-name/
 │ ├── document-name.md
 │ ├── images/
 │ └── content.json

Markdown-файл содержит основной текст, а JSON — подробную структуру и метаданные документа.

Почему это важно

Современные AI-агенты работают лучше с чистыми и структурированными данными. MinerU решает одну из ключевых проблем — преобразование “грязных” документов в формат, пригодный для автоматизации, поиска и анализа.

В экосистеме OpenClaw такие навыки позволяют быстро расширять возможности агента без написания кода — достаточно установить нужный skill. :


Файл из источника

11155_mineru-1.0.1.zip