Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Edge-TTS — это навык для преобразования текста в речь с использованием нейросетевого TTS-сервиса Microsoft Edge через пакет node-edge-tts. Он позволяет создавать аудио высокого качества с поддержкой различных языков, голосов и гибких настроек воспроизведения.
Обзор
Инструмент предназначен для генерации озвучки текста с естественным звучанием. Он поддерживает выбор голосов, настройку скорости и высоты тона, а также генерацию субтитров. :
Решение особенно полезно в ситуациях, когда контент нужно не читать, а слушать — например, при многозадачности, в дороге или для повышения доступности информации. :
Когда использовать
- Когда пользователь явно запрашивает озвучку текста или использует триггер
tts - Когда информация должна восприниматься на слух (например, во время работы или вождения)
- Когда требуется конкретный голос, скорость или формат аудио
Быстрый старт
При обнаружении запроса на озвучку:
- Вызовите встроенный инструмент
ttsдля преобразования текста - Получите путь к аудиофайлу (формат MEDIA)
- Аудио автоматически отправится в текущий канал
tts("Ваш текст для озвучивания")
// Результат: MEDIA: /path/to/audio.mp3
Расширенные возможности
Для более гибкой настройки доступны Node.js-скрипты, позволяющие управлять параметрами генерации речи.
Конвертация текста в речь
cd scripts
npm install
node tts-converter.js "Ваш текст" \
--voice en-US-AriaNeural \
--rate +10% \
--output output.mp3
Доступные параметры:
- —voice — выбор голоса
- —lang — язык
- —format — формат аудио
- —pitch — высота тона
- —rate — скорость речи
- —volume — громкость
- —output — путь к файлу
- —save-subtitles — сохранение субтитров
Менеджер конфигурации
cd scripts
npm install
node config-manager.js --set-voice en-US-AriaNeural
node config-manager.js --reset
Настройки сохраняются локально, что позволяет повторно использовать выбранные параметры без необходимости задавать их каждый раз.
Выбор голосов
Сервис поддерживает множество голосов на разных языках. Например:
- en-US-MichelleNeural — женский голос (по умолчанию)
- en-US-GuyNeural — мужской голос
- en-GB-SoniaNeural — британский акцент
- ja-JP-NanamiNeural — японский язык
- de-DE-KatjaNeural — немецкий язык
Нейронные голоса (с окончанием Neural) обеспечивают более естественное звучание по сравнению со стандартными вариантами. :
Рекомендации по скорости
- -20%…-10% — медленная, чёткая речь (обучение, сторителлинг)
- default — стандартная скорость
- +10%…+20% — немного ускоренная речь
- +30%…+50% — быстрая подача (новости, сводки)
Форматы аудио
- audio-24khz-48kbitrate-mono-mp3 — стандартное качество
- audio-24khz-96kbitrate-mono-mp3 — высокое качество
- audio-48khz-96kbitrate-stereo-mp3 — максимальное качество
Особенности
- Не требует API-ключа — работает через сервис Microsoft Edge :
- Поддерживает множество языков и голосов
- Генерирует субтитры (VTT/SRT)
- Подходит для озвучки видео, обучения и аудиоконтента
Стоит учитывать, что это облачный сервис без гарантированного SLA, поэтому его следует использовать как best-effort решение. :
Файл из источника