Скиллы Средний Исследования и аналитика

OCR — Local (No API Key)

Скачать ZIP
11
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Извлечение текста с изображений с помощью Tesseract.js OCR — полностью локально, без необходимости API-ключа. Поддерживаются китайский (упрощённый и традиционный) и английский языки.

Этот инструмент представляет собой навык для OpenClaw, позволяющий быстро и безопасно распознавать текст прямо на вашем устройстве без передачи данных во внешние сервисы. :

Установка

clawhub install ocr-local

Перед установкой убедитесь, что у вас установлен CLI-инструмент clawhub.

Быстрый старт

node {baseDir}/scripts/ocr.js /path/to/image.jpg
node {baseDir}/scripts/ocr.js /path/to/image.png --lang chi_sim
node {baseDir}/scripts/ocr.js /path/to/image.jpg --lang chi_tra+eng

Параметры

  • —lang — выбор языков (по умолчанию: chi_sim+eng)
  • chi_sim — упрощённый китайский
  • chi_tra — традиционный китайский
  • eng — английский
  • Языки можно комбинировать через +, например: chi_sim+eng
  • —json — вывод результата в формате JSON вместо обычного текста

Примеры использования

# Распознавание китайского текста
node {baseDir}/scripts/ocr.js screenshot.png

# Распознавание английского документа
node {baseDir}/scripts/ocr.js document.jpg --lang eng

# Смешанный текст (китайский + английский)
node {baseDir}/scripts/ocr.js mixed.png --lang chi_sim+eng

Особенности

  • Полностью локальная работа — никакие данные не отправляются в облако
  • Не требуется API-ключ или регистрация
  • Поддержка нескольких языков
  • Гибкий вывод: текст или JSON
  • Простое использование через CLI

Примечания

  • При первом запуске загружаются языковые данные (~20 МБ на язык)
  • Данные кэшируются для последующих запусков
  • Лучшие результаты достигаются на чётких изображениях с высоким контрастом
  • Распознавание рукописного текста может быть менее точным

Этот навык идеально подходит для локальной обработки изображений, когда важны конфиденциальность, скорость и независимость от сторонних API.


Файл из источника

11205_ocr-local-1.0.0.zip