Скиллы Новичок Контент и творчество

Edge-TTS Skill

Скачать ZIP
14
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Edge-TTS — это навык для преобразования текста в речь с использованием нейросетевого TTS-сервиса Microsoft Edge через пакет node-edge-tts. Он позволяет создавать аудио высокого качества с поддержкой различных языков, голосов и гибких настроек воспроизведения.

Обзор

Инструмент предназначен для генерации озвучки текста с естественным звучанием. Он поддерживает выбор голосов, настройку скорости и высоты тона, а также генерацию субтитров. :

Решение особенно полезно в ситуациях, когда контент нужно не читать, а слушать — например, при многозадачности, в дороге или для повышения доступности информации. :

Когда использовать

  • Когда пользователь явно запрашивает озвучку текста или использует триггер tts
  • Когда информация должна восприниматься на слух (например, во время работы или вождения)
  • Когда требуется конкретный голос, скорость или формат аудио

Быстрый старт

При обнаружении запроса на озвучку:

  • Вызовите встроенный инструмент tts для преобразования текста
  • Получите путь к аудиофайлу (формат MEDIA)
  • Аудио автоматически отправится в текущий канал
tts("Ваш текст для озвучивания")
// Результат: MEDIA: /path/to/audio.mp3

Расширенные возможности

Для более гибкой настройки доступны Node.js-скрипты, позволяющие управлять параметрами генерации речи.

Конвертация текста в речь

cd scripts
npm install
node tts-converter.js "Ваш текст" \
 --voice en-US-AriaNeural \
 --rate +10% \
 --output output.mp3

Доступные параметры:

  • —voice — выбор голоса
  • —lang — язык
  • —format — формат аудио
  • —pitch — высота тона
  • —rate — скорость речи
  • —volume — громкость
  • —output — путь к файлу
  • —save-subtitles — сохранение субтитров

Менеджер конфигурации

cd scripts
npm install
node config-manager.js --set-voice en-US-AriaNeural
node config-manager.js --reset

Настройки сохраняются локально, что позволяет повторно использовать выбранные параметры без необходимости задавать их каждый раз.

Выбор голосов

Сервис поддерживает множество голосов на разных языках. Например:

  • en-US-MichelleNeural — женский голос (по умолчанию)
  • en-US-GuyNeural — мужской голос
  • en-GB-SoniaNeural — британский акцент
  • ja-JP-NanamiNeural — японский язык
  • de-DE-KatjaNeural — немецкий язык

Нейронные голоса (с окончанием Neural) обеспечивают более естественное звучание по сравнению со стандартными вариантами. :

Рекомендации по скорости

  • -20%…-10% — медленная, чёткая речь (обучение, сторителлинг)
  • default — стандартная скорость
  • +10%…+20% — немного ускоренная речь
  • +30%…+50% — быстрая подача (новости, сводки)

Форматы аудио

  • audio-24khz-48kbitrate-mono-mp3 — стандартное качество
  • audio-24khz-96kbitrate-mono-mp3 — высокое качество
  • audio-48khz-96kbitrate-stereo-mp3 — максимальное качество

Особенности

  • Не требует API-ключа — работает через сервис Microsoft Edge :
  • Поддерживает множество языков и голосов
  • Генерирует субтитры (VTT/SRT)
  • Подходит для озвучки видео, обучения и аудиоконтента

Стоит учитывать, что это облачный сервис без гарантированного SLA, поэтому его следует использовать как best-effort решение. :


Файл из источника

10944_edge-tts-2.0.0.zip