Проект: Генератор Аудиокниг

Автоматическая озвучка текстовых книг с помощью Edge TTS от Microsoft

Задачи проекта:

Описание проекта:

Проект предназначен для генерации аудиокниг на основе текстовых файлов или книг в формате FB2. Используется синтез речи Edge TTS от Microsoft с поддержкой нейросетевых голосов. Система автоматически разбивает текст на главы, форматирует, озвучивает и сохраняет результат в MP3. Подходит для личной библиотеки, адаптации для слабовидящих, контент-маркетинга или подкастов.

Архитектура решения

Компоненты

Ключевые особенности

📖 Работа с книгами FB2

  • Конвертация с помощью lxml
  • Извлечение текста, форматирование, сохранение структуры

🧠 Интеллектуальное разбиение

  • Глава → части по смыслу
  • Разделение с учётом длины и границ предложений

🔊 Озвучка Microsoft Edge TTS

  • Голос: ru-RU-DmitryNeural / SvetlanaNeural
  • Контроль длительности и повторная генерация при сбоях
  • Поддержка русского и других языков

🎧 Выходной результат

  • MP3-файлы по главам
  • Автоматическое удаление временных данных
  • Прогресс-бар и визуальная обратная связь

Примеры использования: