Скиллы Средний Контент и творчество

OpenAI TTS

Скачать ZIP
11
Предупреждение о рисках!

Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.

TL;DR: преобразует текст в естественно звучащую речь с помощью моделей OpenAI TTS, позволяя вашему AI-агенту «заговорить».

OpenAI TTS — это навык для OpenClaw, реализующий преобразование текста в речь через OpenAI Audio Speech API. Создан пользователем pors и уже набрал тысячи установок в ClawHub.

Обзор

Навык позволяет легко добавить голосовые ответы к AI-агенту. После установки он сразу расширяет возможности вашего ассистента, позволяя генерировать аудио из текста в различных форматах и с разными голосами.

Основные возможности

  • Добавление голосовых ответов в чат-боты и виртуальные ассистенты
  • Создание аудиоверсий статей, документации и рассылок
  • Повышение доступности интерфейсов для слабовидящих пользователей
  • Генерация озвучки для презентаций и демо-видео без записи голоса

Установка

Установить навык можно одной командой через OpenClaw CLI:

npx clawhub@latest install openai-tts

Быстрый старт

{baseDir}/scripts/speak.sh "Hello, world!"
{baseDir}/scripts/speak.sh "Hello, world!" --out /tmp/hello.mp3

По умолчанию используются:

  • Модель: tts-1 (быстрая) или tts-1-hd (более качественная)
  • Голос: alloy (нейтральный)
  • Формат: mp3

Доступные голоса

  • alloy — нейтральный, сбалансированный
  • echo — мужской, тёплый
  • fable — британский, выразительный
  • onyx — глубокий, авторитетный
  • nova — женский, дружелюбный
  • shimmer — женский, мягкий

Параметры запуска

{baseDir}/scripts/speak.sh "Text" --voice nova --model tts-1-hd --out speech.mp3
{baseDir}/scripts/speak.sh "Text" --format opus --speed 1.2
  • --voice — выбор голоса
  • --model — выбор модели (tts-1 или tts-1-hd)
  • --format — формат аудио (mp3, opus, wav и др.)
  • --speed — скорость воспроизведения (0.25–4.0)
  • --out — путь к выходному файлу

API-ключ

Для работы требуется ключ OpenAI API. Его можно задать через переменную окружения:

export OPENAI_API_KEY="sk-..."

Или прописать в конфигурации OpenClaw.

Ценообразование

  • tts-1: около $0.015 за 1000 символов
  • tts-1-hd: около $0.030 за 1000 символов

Это делает генерацию коротких голосовых ответов очень доступной. :

Версия

Текущая версия: v1.0.0 (первичный релиз с поддержкой 6 голосов и интеграцией OpenAI TTS API).


Файл из источника

11214_openai-tts-1.0.0.zip