Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Kokoro TTS
Kokoro TTS — это навык для OpenClaw, который позволяет генерировать озвучку текста с использованием локального или удалённого движка Kokoro. Он превращает текст в естественно звучащую речь и возвращает результат в виде аудиофайла (MP3).
Решение работает по умолчанию локально, что избавляет от необходимости использовать облачные API и оплачивать запросы. При этом сохраняется высокая выразительность речи и гибкость настройки.
Что делает этот навык
Kokoro TTS преобразует текст в голосовое сообщение с возможностью настройки параметров: голос, скорость воспроизведения и адрес API. Результат сохраняется в формате MP3 и автоматически отправляется как аудиовложение.
Навык может работать как с локальным сервером, так и с удалённым API Kokoro, обеспечивая гибкость в развертывании и использовании. :
Когда использовать
- Отправка голосовых ответов в чатах
- Озвучивание отчётов, резюме или уведомлений
- Создание голосовой версии электронных писем
- Генерация аудио для алертов и системных сообщений
- Тестирование различных голосов для проектов
Примеры применения
- Разработка голосовых интерфейсов с естественной интонацией
- Создание озвучки для сторителлинга и интерактивных приложений
- Прототипирование голосовых ассистентов
- Добавление аудио в обучающие и доступные (accessibility) решения
Как это работает
Навык запускается с передачей текста и дополнительных параметров. Затем выполняется следующий процесс:
- Выбирается подходящий голос и скорость
- Скрипт отправляет запрос к API Kokoro
- Генерируется аудиофайл
- Возвращается путь к MP3-файлу, который автоматически прикрепляется к ответу
Пример сценария
Вход:
Пользователь: «Скажи «Your build is ready» профессиональным голосом»
Действия агента:
- Выбирает голос с профессиональным звучанием (например, af_nova)
- Запускает скрипт генерации речи
- Отправляет запрос к API
- Получает MP3-файл
Выход:
MEDIA: media/tts_XXXX.mp3 — файл автоматически отправляется пользователю
Установка
Для установки навыка используйте одну из команд:
clawhub install edkief/kokoro-tts
Если CLI не установлен:
npx clawhub@latest install edkief/kokoro-tts
Требования
- Запущенный сервер Kokoro TTS (локально или удалённо)
- Переменная окружения
KOKORO_API_URL - API-ключ (если требуется аутентификация)
Настройка
По умолчанию используется следующий адрес API:
http://localhost:8880/v1/audio/speech
Вы можете изменить его, добавив переменную окружения:
KOKORO_API_URL=http://your-server:port/v1/audio/speech
Использование
Для генерации речи используется Node.js-скрипт:
node skills/kokoro-tts/scripts/tts.js "" [voice] [speed]
- text — текст для озвучки
- voice — ID голоса (по умолчанию af_heart)
- speed — скорость речи (0.25–4.0)
Особенности
- Локальная работа без облачных затрат
- Высокое качество и естественность речи
- Гибкая настройка голосов и скорости
- Простая интеграция в AI-агентов и автоматизации
Kokoro TTS представляет собой лёгкий и эффективный инструмент для добавления голосовых возможностей в приложения, позволяя разработчикам создавать более живые и интерактивные пользовательские сценарии. :
Файл из источника