Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Генерируйте выразительные голосовые сообщения с помощью ElevenLabs v3, используя встроенные аудио-теги для передачи эмоций, пауз и интонаций прямо в тексте.
Что делает этот навык
Этот навык позволяет создавать реалистичную озвучку на базе ElevenLabs API с поддержкой эмоциональных тегов. Вы можете управлять подачей, темпом и настроением речи прямо внутри текста — без дополнительного редактирования аудио после генерации. :
- Генерация выразительных голосовых сообщений
- Поддержка более 70 языков
- Создание аудио, совместимого с WhatsApp (через конвертацию ffmpeg)
- Управление эмоциями через текстовые теги вроде [excited], [whispers], [pause]
Когда использовать
- Отправка эмоциональных голосовых сообщений в мессенджерах
- Озвучка историй (ужасы, драма, сторителлинг)
- Создание мультиязычного аудиоконтента
- Генерация диалогов и подкастов с несколькими голосами
- Озвучка поздравлений и объявлений
Требования
- API-ключ ElevenLabs (ELEVENLABS_API_KEY)
- Установленный ffmpeg для конвертации аудио (например, в формат Opus для WhatsApp)
Быстрый старт
npx clawhub@latest install elevenlabs-tts
Пример использования
Сторителлинг (эмоциональное повествование):
[soft] Всё началось как обычный день... [pause] Но что-то было не так.
[nervous] Мои руки дрожали, когда я открыл конверт.
[gasps] Меня приняли! [excited] Меня действительно приняли!
[laughs] [happy] Это меняет всё!
Поддержка диалогов
Модель v3 умеет обрабатывать несколько персонажей в одном тексте, позволяя создавать живые диалоги:
Jessica: [whispers] Ты это слышал?
Chris: [interrupting] —Я тоже это услышал!
Jessica: [panicking] Нам нужно спрятаться!
Типы аудио-тегов
- Эмоции: [excited], [happy], [sad], [angry], [nervous]
- Подача: [whispers], [shouts], [soft], [rushed]
- Реакции: [laughs], [sighs], [gasps]
- Паузы и темп: [pause], [hesitates], [breathes]
- Характер: [British accent], [robotic tone]
- Диалоги: [interrupting], [overlapping]
Рекомендации
- Используйте 1 основной эмоциональный тег на блок текста
- Добавляйте реакции умеренно для естественности
- Разбивайте длинные тексты на сегменты (до ~800 символов)
- Экспериментируйте — генерация может отличаться от запуска к запуску
Устранение проблем
- Теги озвучиваются как текст — проверьте модель (используйте v3)
- Нет эмоций — попробуйте другой голос или добавьте контекст
- Аудио не воспроизводится в WhatsApp — конвертируйте в Opus
- Голос нестабилен — уменьшите длину текста и перегенерируйте
Файл из источника