Скиллы Новичок Разное

Scrapling

Скачать ZIP
9
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Scrapling — это адаптивный фреймворк для веб-скрейпинга, который справляется как с единичными запросами, так и с полноценным краулингом сайтов.

Его парсер обучается на изменениях веб-страниц и автоматически находит нужные элементы даже после обновлений сайта. Встроенные fetcher’ы умеют обходить антибот-защиту (например, Cloudflare Turnstile) «из коробки». А spider-фреймворк позволяет масштабировать сбор данных до параллельных многосессионных обходов с поддержкой паузы, возобновления и автоматической ротации прокси — всего в несколько строк Python-кода. :

Одна библиотека — без компромиссов. Быстрые обходы, стриминг данных и статистика в реальном времени. Инструмент создан скрейперами для скрейперов — но подойдёт и обычным пользователям.

Когда использовать

Используйте Scrapling, если вам нужно:

  • парсить веб-страницы и извлекать данные;
  • обходить защиту сайтов и антибот-системы;
  • работать с динамическими сайтами и JavaScript;
  • писать краулеры или пауков (spiders) на Python;
  • получать данные там, где стандартные методы не справляются.

Основные возможности

  • Адаптивный парсинг — элементы автоматически находятся даже после изменений структуры сайта;
  • Обход антиботов — поддержка stealth-режима и обхода Cloudflare;
  • Headless-браузер — работа с динамическими страницами;
  • Spider-фреймворк — масштабируемый краулинг с многосессионной поддержкой;
  • Прокси и сессии — встроенная ротация и управление состоянием;
  • CLI-интерфейс — извлечение данных без написания кода.

Требования

Для работы требуется Python версии 3.10 или выше.

Установка

Создайте виртуальное окружение (например, через venv) и установите библиотеку:

pip install "scrapling[all]>=0.4.2"

Затем установите зависимости браузеров:

scrapling install --force

Если бинарник scrapling не находится в PATH — используйте полный путь к нему.

Docker

Если вы не хотите использовать Python, можно воспользоваться Docker-образом:

docker pull pyd4vinci/scrapling
# или
docker pull ghcr.io/d4vinci/scrapling:latest

CLI: использование без кода

Команда scrapling extract позволяет скачивать и извлекать данные с сайтов без написания кода:

scrapling extract [OPTIONS] COMMAND [ARGS]...

Доступные команды:

  • get — GET-запрос и сохранение результата;
  • post — POST-запрос;
  • put — PUT-запрос;
  • delete — DELETE-запрос;
  • fetch — получение страницы через браузер;
  • stealthy-fetch — скрытый режим с обходом защиты.

Примеры использования

# Сохранить страницу в Markdown
scrapling extract get "https://example.com" article.md

# Сохранить HTML
scrapling extract get "https://example.com" page.html

# Получить чистый текст
scrapling extract get "https://example.com" content.txt

Формат вывода определяется расширением файла. При необходимости можно использовать CSS-селекторы для извлечения конкретных элементов страницы.

Как выбрать режим

  • get — для простых сайтов и статических страниц;
  • fetch — для современных сайтов с динамикой;
  • stealthy-fetch — для защищённых ресурсов и антиботов.

Если не уверены — начните с get, затем переходите к более продвинутым режимам.


Файл из источника

11705_scrapling-official-0.4.5.zip