Установка скиллов и плагинов OpenClaw осуществляется на ваш страх и риск. Все файлы были получены из открытых источников и предоставляются «как есть». Мы не гарантируем их корректную работу, безопасность или совместимость с вашей системой. Перед установкой настоятельно рекомендуется ознакомиться с содержимым кода и убедиться, что вы понимаете, какие изменения будут внесены в вашу систему.
Голосовые взаимодействия в реальном времени внутри Discord — это следующий шаг в развитии AI-агентов. Плагин Discord Voice для Clawdbot позволяет пользователям просто говорить в голосовом канале, а система автоматически распознаёт речь, обрабатывает её через Claude и воспроизводит ответ обратно в аудиоформате.
В результате обычный голосовой канал превращается в полноценную интерактивную среду общения с искусственным интеллектом — без необходимости печатать сообщения.
Основные возможности
- Подключение к голосовым каналам: через slash-команды, CLI или инструменты агента
- Определение голосовой активности (VAD): автоматическое распознавание начала и окончания речи
- Speech-to-Text: поддержка OpenAI Whisper, Deepgram и локального Whisper
- Стриминговая транскрипция: почти мгновенная обработка речи через WebSocket (~на 1 секунду быстрее)
- Интеграция с агентом: текст передаётся в Clawdbot для генерации ответа
- Text-to-Speech: OpenAI TTS, ElevenLabs, Deepgram Aura, Amazon Polly, Edge TTS или локальные решения
- Воспроизведение аудио: ответы озвучиваются прямо в канале
- Barge-in: система мгновенно замолкает, если пользователь начинает говорить
- Автовосстановление: переподключение при обрыве соединения
Как это работает
- Бот подключается к голосовому каналу
- VAD отслеживает, когда пользователь начинает говорить
- Аудио записывается и буферизуется
- Речь преобразуется в текст через STT-провайдер
- Текст отправляется агенту Claude для обработки
- Ответ синтезируется в аудио
- Голос воспроизводится обратно в канале
Требования
- Discord-бот с правами: Connect, Speak, Use Voice Activity
- API-ключи для STT и TTS сервисов
- Системные зависимости:
ffmpegдля обработки аудио- инструменты сборки для
@discordjs/opusиsodium-native
Установка
1. Установка системных зависимостей
# Ubuntu / Debian
sudo apt-get install ffmpeg build-essential python3
# Fedora / RHEL
sudo dnf install ffmpeg gcc-c++ make python3
# macOS
brew install ffmpeg
2. Установка через ClawHub
clawhub install discord-voice
Также возможна ручная установка через клонирование репозитория и запуск npm install. :
Применение
- Голосовые AI-ассистенты в Discord-сообществах
- Интерактивные Q&A-сессии с AI
- Поддержка пользователей с ограничениями по вводу текста
- Игровые и ролевые сценарии с живым AI-персонажем
- Автоматизация модерации и поиска информации
Благодаря низкой задержке, гибкости выбора провайдеров и поддержке офлайн-режимов, этот плагин становится мощным инструментом для создания голосовых AI-интерфейсов нового поколения. :
Файл из источника