Проект: Генератор Аудиокниг

Автоматическая озвучка текстовых книг с помощью Edge TTS от Microsoft

Задачи проекта:

Конвертация книг в формат FB2 в аудиоформат MP3
Интеллектуальное разбиение текста на главы и части
Озвучка текста голосами Microsoft Edge TTS
Контроль качества, повторная генерация при сбоях

Описание проекта:

Проект предназначен для генерации аудиокниг на основе текстовых файлов или книг в формате FB2. Используется синтез речи Edge TTS от Microsoft с поддержкой нейросетевых голосов. Система автоматически разбивает текст на главы, форматирует, озвучивает и сохраняет результат в MP3. Подходит для личной библиотеки, адаптации для слабовидящих, контент-маркетинга или подкастов.

Архитектура решения

Компоненты

FB2 → TXT: конвертация с сохранением структуры
Форматирование текста для синтеза
Разделение на главы и фрагменты
Голосовая генерация через Edge TTS API
Сборка итоговых MP3-файлов

Ключевые особенности

📖 Работа с книгами FB2

Конвертация с помощью lxml
Извлечение текста, форматирование, сохранение структуры

🧠 Интеллектуальное разбиение

Глава → части по смыслу
Разделение с учётом длины и границ предложений

🔊 Озвучка Microsoft Edge TTS

Голос: ru-RU-DmitryNeural / SvetlanaNeural
Контроль длительности и повторная генерация при сбоях
Поддержка русского и других языков

🎧 Выходной результат

MP3-файлы по главам
Автоматическое удаление временных данных
Прогресс-бар и визуальная обратная связь

Примеры использования:

Личная аудиобиблиотека
Создание аудиоформата для блога или подкаста
Обучение, в том числе для слабовидящих
Быстрая конвертация документации в голос