Влад Соколовский

AI-инженер, автор статей и ментор для разработчиков

Telegram-пост

Голосовой Telegram-бот на ElevenLabs за выходные

Влад Соколовский

Голосовой Telegram-бот на ElevenLabs за выходные

ElevenLabs как раз выпустили v3 модель для генерации эмоционального голоса, чтобы эмоции работали нужно вручную добавлять тэги типа [смех], [беспокойство], [прочистил горло]. Также, они зашэрили промпт для того, чтобы вы смогли органично добавлять эти тэги в любой текст с помощью LLM.

Какой алгоритм: 0. Получить API ключи для ElevenLabs и OpenAI

  1. Собрать голосовые сообщения человека где хорошо слышен его голос
  2. Зайти в ElevenLabs и выбрать Voice Cloning, загрузить туда эти голосовые, получите Voice ID
  3. Попросить CLAUDE написать aiogram бота который будет по команде /fm читать сообщение, добавлять эмоциональные тэги и генерировать аудишку с выбранным Voice ID
  4. Deployнуть всё это дело на сервер

Весь процесс занял 1.5-2 часа, тюнинг клонированного голоса самая времязатратная вещь, вккпе с v3 он работал не очень похоже на целевого человечка.

Если кому-то интересно посмотреть на код/промпт или запустить такого бота для своего чатика — дайте FIRE 🔥 и поделюсь репой после соточки я уже поделился кодом в комментах к этому посту.

  • #ai
  • #dev_help

Рассылка

Письма из Багодельни

Письма с новыми статьями, инструментами и мыслями о том, куда катится AI-разработка. Только то, что проверил на себе.

Письма из Багодельни

Письма с новыми статьями, инструментами и мыслями о том, куда катится AI-разработка. Только то, что проверил на себе.

Отписаться можно в любой момент