Скиллы Новичок Контент и творчество

Edge-TTS Skill

Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Edge-TTS — это навык для преобразования текста в речь с использованием нейросетевого TTS-сервиса Microsoft Edge через пакет node-edge-tts. Он позволяет создавать аудио высокого качества с поддержкой различных языков, голосов и гибких настроек воспроизведения.

Обзор

Инструмент предназначен для генерации озвучки текста с естественным звучанием. Он поддерживает выбор голосов, настройку скорости и высоты тона, а также генерацию субтитров. :

Решение особенно полезно в ситуациях, когда контент нужно не читать, а слушать — например, при многозадачности, в дороге или для повышения доступности информации. :

Когда использовать

Когда пользователь явно запрашивает озвучку текста или использует триггер tts
Когда информация должна восприниматься на слух (например, во время работы или вождения)
Когда требуется конкретный голос, скорость или формат аудио

Быстрый старт

При обнаружении запроса на озвучку:

Вызовите встроенный инструмент tts для преобразования текста
Получите путь к аудиофайлу (формат MEDIA)
Аудио автоматически отправится в текущий канал

tts("Ваш текст для озвучивания")
// Результат: MEDIA: /path/to/audio.mp3

Расширенные возможности

Для более гибкой настройки доступны Node.js-скрипты, позволяющие управлять параметрами генерации речи.

Конвертация текста в речь

cd scripts
npm install
node tts-converter.js "Ваш текст" \
 --voice en-US-AriaNeural \
 --rate +10% \
 --output output.mp3

Доступные параметры:

—voice — выбор голоса
—lang — язык
—format — формат аудио
—pitch — высота тона
—rate — скорость речи
—volume — громкость
—output — путь к файлу
—save-subtitles — сохранение субтитров

Менеджер конфигурации

cd scripts
npm install
node config-manager.js --set-voice en-US-AriaNeural
node config-manager.js --reset

Настройки сохраняются локально, что позволяет повторно использовать выбранные параметры без необходимости задавать их каждый раз.

Выбор голосов

Сервис поддерживает множество голосов на разных языках. Например:

en-US-MichelleNeural — женский голос (по умолчанию)
en-US-GuyNeural — мужской голос
en-GB-SoniaNeural — британский акцент
ja-JP-NanamiNeural — японский язык
de-DE-KatjaNeural — немецкий язык

Нейронные голоса (с окончанием Neural) обеспечивают более естественное звучание по сравнению со стандартными вариантами. :

Форматы аудио

audio-24khz-48kbitrate-mono-mp3 — стандартное качество
audio-24khz-96kbitrate-mono-mp3 — высокое качество
audio-48khz-96kbitrate-stereo-mp3 — максимальное качество

Особенности

Не требует API-ключа — работает через сервис Microsoft Edge :
Поддерживает множество языков и голосов
Генерирует субтитры (VTT/SRT)
Подходит для озвучки видео, обучения и аудиоконтента

Стоит учитывать, что это облачный сервис без гарантированного SLA, поэтому его следует использовать как best-effort решение. :

Файл из источника

10944_edge-tts-2.0.0.zip

Интеграции: # ai аудио # edge tts # tts # голосовые технологии # озвучка текста # синтез речи # текст в речь

Тип Скилл
Сложность Новичок
Дата обновления 11.04.2026
Автор opclpro
Просмотры 31

Скачать ZIP