Проект: Генератор Аудиокниг
Автоматическая озвучка текстовых книг с помощью Edge TTS от Microsoft
Задачи проекта:
- Конвертация книг в формат FB2 в аудиоформат MP3
- Интеллектуальное разбиение текста на главы и части
- Озвучка текста голосами Microsoft Edge TTS
- Контроль качества, повторная генерация при сбоях
Описание проекта:
Проект предназначен для генерации аудиокниг на основе текстовых файлов или книг в формате FB2. Используется
синтез речи Edge TTS от Microsoft с поддержкой нейросетевых голосов. Система автоматически разбивает текст
на главы, форматирует, озвучивает и сохраняет результат в MP3.
Подходит для личной библиотеки, адаптации для слабовидящих, контент-маркетинга или подкастов.
Архитектура решения
Компоненты
- FB2 → TXT: конвертация с сохранением структуры
- Форматирование текста для синтеза
- Разделение на главы и фрагменты
- Голосовая генерация через Edge TTS API
- Сборка итоговых MP3-файлов
Ключевые особенности
📖 Работа с книгами FB2
- Конвертация с помощью lxml
- Извлечение текста, форматирование, сохранение структуры
🧠 Интеллектуальное разбиение
- Глава → части по смыслу
- Разделение с учётом длины и границ предложений
🔊 Озвучка Microsoft Edge TTS
- Голос: ru-RU-DmitryNeural / SvetlanaNeural
- Контроль длительности и повторная генерация при сбоях
- Поддержка русского и других языков
🎧 Выходной результат
- MP3-файлы по главам
- Автоматическое удаление временных данных
- Прогресс-бар и визуальная обратная связь
Примеры использования:
- Личная аудиобиблиотека
- Создание аудиоформата для блога или подкаста
- Обучение, в том числе для слабовидящих
- Быстрая конвертация документации в голос
×