Скиллы Новичок Коммуникация и социальные сети

TikTok Scraping with yt-dlp

Скачать ZIP
17
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

yt-dlp — это CLI-инструмент для скачивания видео и аудио из TikTok и множества других платформ. Он подходит для парсинга, сбора контента и последующего анализа данных.

Установка и настройка

# macOS
brew install yt-dlp ffmpeg

# через pip (любая платформа)
pip install yt-dlp
# ffmpeg нужно установить отдельно для объединения и постобработки

Основные сценарии загрузки

Одиночное видео

yt-dlp "https://www.tiktok.com/@handle/video/1234567890"

Весь профиль

yt-dlp "https://www.tiktok.com/@handle" \
 -P "./tiktok/data" \
 -o "%(uploader)s/%(upload_date)s-%(id)s/video.%(ext)s" \
 --write-info-json

В результате создаётся структура папок с видео и метаданными:

tiktok/data/
 handle/
 20260220-7331234567890/
 video.mp4
 video.info.json

Несколько профилей

for handle in handle1 handle2 handle3; do
 yt-dlp "https://www.tiktok.com/@$handle" \
 -P "./tiktok/data" \
 -o "%(uploader)s/%(upload_date)s-%(id)s/video.%(ext)s" \
 --write-info-json \
 --download-archive "./tiktok/downloaded.txt"
done

Поиск, хэштеги и звуки

# поиск по ключевым словам
yt-dlp "tiktoksearch:cooking recipes" --playlist-end 20

# страница хэштега
yt-dlp "https://www.tiktok.com/tag/booktok" --playlist-end 50

# видео с конкретным звуком
yt-dlp "https://www.tiktok.com/music/original-sound-1234567890" --playlist-end 30

Фильтрация данных

Можно отбирать видео по дате, просмотрам, длительности и другим параметрам.

# видео после определённой даты
--dateafter 20260215

# видео с 100k+ просмотров
--match-filters "view_count >= 100000"

# диапазон дат
--dateafter 20260210 --datebefore 20260220

Работа только с метаданными

Можно получить данные без скачивания самих видео:

yt-dlp "https://www.tiktok.com/@handle" \
 --simulate \
 --dump-json > handle_videos.json

Экспорт данных

JSON / JSONL

# JSON
yt-dlp URL --simulate --dump-json > data.json

# JSONL (удобно для больших массивов)
yt-dlp URL --simulate -j > data.jsonl

CSV

yt-dlp "https://www.tiktok.com/@handle" \
 --simulate \
 --print-to-file "%(uploader)s,%(id)s,%(upload_date)s,%(view_count)s,%(like_count)s,%(webpage_url)s" \
 "./tiktok/analysis/metadata.csv"

Анализ данных с jq

# топ-10 видео по просмотрам
jq -s 'sort_by(.view_count) | reverse | .[:10]' tiktok/data/*/*.info.json

# общее количество просмотров
jq -s 'map(.view_count) | add' tiktok/data/*/*.info.json

# группировка по дате
jq -s 'group_by(.upload_date)' tiktok/data/*/*.info.json

Полезные опции

  • -o — шаблон имени файла
  • -P — директория загрузки
  • —match-filters — фильтрация по метаданным
  • —write-info-json — сохранение метаданных
  • —simulate — тестовый запуск без загрузки
  • —download-archive — избегание повторных скачиваний

Этот инструмент позволяет автоматизировать сбор данных из TikTok, строить архивы контента и проводить глубокий анализ без необходимости использовать официальный API. :


Файл из источника

11830_tiktok-crawling-1.0.0.zip