Скиллы Новичок Контент и творчество

Kokoro TTS

Скачать ZIP
11
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Kokoro TTS

Kokoro TTS — это навык для OpenClaw, который позволяет генерировать озвучку текста с использованием локального или удалённого движка Kokoro. Он превращает текст в естественно звучащую речь и возвращает результат в виде аудиофайла (MP3).

Решение работает по умолчанию локально, что избавляет от необходимости использовать облачные API и оплачивать запросы. При этом сохраняется высокая выразительность речи и гибкость настройки.

Что делает этот навык

Kokoro TTS преобразует текст в голосовое сообщение с возможностью настройки параметров: голос, скорость воспроизведения и адрес API. Результат сохраняется в формате MP3 и автоматически отправляется как аудиовложение.

Навык может работать как с локальным сервером, так и с удалённым API Kokoro, обеспечивая гибкость в развертывании и использовании. :

Когда использовать

  • Отправка голосовых ответов в чатах
  • Озвучивание отчётов, резюме или уведомлений
  • Создание голосовой версии электронных писем
  • Генерация аудио для алертов и системных сообщений
  • Тестирование различных голосов для проектов

Примеры применения

  • Разработка голосовых интерфейсов с естественной интонацией
  • Создание озвучки для сторителлинга и интерактивных приложений
  • Прототипирование голосовых ассистентов
  • Добавление аудио в обучающие и доступные (accessibility) решения

Как это работает

Навык запускается с передачей текста и дополнительных параметров. Затем выполняется следующий процесс:

  • Выбирается подходящий голос и скорость
  • Скрипт отправляет запрос к API Kokoro
  • Генерируется аудиофайл
  • Возвращается путь к MP3-файлу, который автоматически прикрепляется к ответу

Пример сценария

Вход:
Пользователь: «Скажи «Your build is ready» профессиональным голосом»

Действия агента:

  • Выбирает голос с профессиональным звучанием (например, af_nova)
  • Запускает скрипт генерации речи
  • Отправляет запрос к API
  • Получает MP3-файл

Выход:
MEDIA: media/tts_XXXX.mp3 — файл автоматически отправляется пользователю

Установка

Для установки навыка используйте одну из команд:

clawhub install edkief/kokoro-tts

Если CLI не установлен:

npx clawhub@latest install edkief/kokoro-tts

Требования

  • Запущенный сервер Kokoro TTS (локально или удалённо)
  • Переменная окружения KOKORO_API_URL
  • API-ключ (если требуется аутентификация)

Настройка

По умолчанию используется следующий адрес API:

http://localhost:8880/v1/audio/speech

Вы можете изменить его, добавив переменную окружения:

KOKORO_API_URL=http://your-server:port/v1/audio/speech

Использование

Для генерации речи используется Node.js-скрипт:

node skills/kokoro-tts/scripts/tts.js "" [voice] [speed]
  • text — текст для озвучки
  • voice — ID голоса (по умолчанию af_heart)
  • speed — скорость речи (0.25–4.0)

Особенности

  • Локальная работа без облачных затрат
  • Высокое качество и естественность речи
  • Гибкая настройка голосов и скорости
  • Простая интеграция в AI-агентов и автоматизации

Kokoro TTS представляет собой лёгкий и эффективный инструмент для добавления голосовых возможностей в приложения, позволяя разработчикам создавать более живые и интерактивные пользовательские сценарии. :


Файл из источника

11101_kokoro-tts-0.1.0.zip