
Команда Яндекса сообщила о запуске интересного нововведения в фирменном книжном сервисе. В «Яндекс Книгах» стала доступна новая версия виртуального рассказчика — с улучшенной нейросетевой моделью синтеза голоса.
Виртуальный рассказчик позволяет слушать книги, у которых пока нет аудиоверсии. Прежняя нейросетевая модель быстро синтезировала голос, но он мог звучать слишком монотонно. Новая технология решает эту проблему.
В Яндексе рассказали:
Благодаря обновлению технологии, интонации рассказчика стали более живыми и естественными, а манера чтения теперь меняется в зависимости от жанра книги. Новая модель демонстрирует высокое качество синтеза на русском языке, превосходя решения крупнейших мировых игроков в области синтеза речи — например, в 80% случаев она синтезирует голос лучше ElevenLabs.
Для обучения модели использовали фрагменты речи, которые записали вместе с профессиональными дикторами. Они зачитывали тексты разных жанров: фантастику, детективы, романы и учебники. Благодаря этому виртуальный рассказчик меняет интонацию в зависимости от жанра произведения. Модель научилась определять, когда начинается диалог, и выделять интонационно реплики героев. Такая озвучка доступна более чем для 120 тысяч произведений. Функция работает в веб-версии и мобильном приложении сервиса.
Напомним, «Яндекс Книги» (ранее «Букмейт») — книжный сервис экосистемы Яндекса, доступный по подписке «Яндекс Плюс». Он объединяет электронные и аудиокниги, а также интерактивные функции для чтения. «Букмейт» сменил название на «Яндекс Книги» в сентябре 2024 года. В июне 2024 года в сервис внедрили виртуального рассказчика на базе ИИ, который озвучивает 13 тыс. книг в реальном времени.