Скиллы Новичок Контент и творчество

ElevenLabs TTS (Text-to-Speech)

Скачать ZIP
13
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

Генерируйте выразительные голосовые сообщения с помощью ElevenLabs v3, используя встроенные аудио-теги для передачи эмоций, пауз и интонаций прямо в тексте.

Что делает этот навык

Этот навык позволяет создавать реалистичную озвучку на базе ElevenLabs API с поддержкой эмоциональных тегов. Вы можете управлять подачей, темпом и настроением речи прямо внутри текста — без дополнительного редактирования аудио после генерации. :

  • Генерация выразительных голосовых сообщений
  • Поддержка более 70 языков
  • Создание аудио, совместимого с WhatsApp (через конвертацию ffmpeg)
  • Управление эмоциями через текстовые теги вроде [excited], [whispers], [pause]

Когда использовать

  • Отправка эмоциональных голосовых сообщений в мессенджерах
  • Озвучка историй (ужасы, драма, сторителлинг)
  • Создание мультиязычного аудиоконтента
  • Генерация диалогов и подкастов с несколькими голосами
  • Озвучка поздравлений и объявлений

Требования

  • API-ключ ElevenLabs (ELEVENLABS_API_KEY)
  • Установленный ffmpeg для конвертации аудио (например, в формат Opus для WhatsApp)

Быстрый старт

npx clawhub@latest install elevenlabs-tts

Пример использования

Сторителлинг (эмоциональное повествование):

[soft] Всё началось как обычный день... [pause] Но что-то было не так. 
[nervous] Мои руки дрожали, когда я открыл конверт. 
[gasps] Меня приняли! [excited] Меня действительно приняли! 
[laughs] [happy] Это меняет всё!

Поддержка диалогов

Модель v3 умеет обрабатывать несколько персонажей в одном тексте, позволяя создавать живые диалоги:

Jessica: [whispers] Ты это слышал?
Chris: [interrupting] —Я тоже это услышал!
Jessica: [panicking] Нам нужно спрятаться!

Типы аудио-тегов

  • Эмоции: [excited], [happy], [sad], [angry], [nervous]
  • Подача: [whispers], [shouts], [soft], [rushed]
  • Реакции: [laughs], [sighs], [gasps]
  • Паузы и темп: [pause], [hesitates], [breathes]
  • Характер: [British accent], [robotic tone]
  • Диалоги: [interrupting], [overlapping]

Рекомендации

  • Используйте 1 основной эмоциональный тег на блок текста
  • Добавляйте реакции умеренно для естественности
  • Разбивайте длинные тексты на сегменты (до ~800 символов)
  • Экспериментируйте — генерация может отличаться от запуска к запуску

Устранение проблем

  • Теги озвучиваются как текст — проверьте модель (используйте v3)
  • Нет эмоций — попробуйте другой голос или добавьте контекст
  • Аудио не воспроизводится в WhatsApp — конвертируйте в Opus
  • Голос нестабилен — уменьшите длину текста и перегенерируйте

Файл из источника

10948_elevenlabs-tts-2.4.0.zip