В Google создали систему синтеза речи, которая почти неотличима от голоса человека

В Google создали систему синтеза речи, которая почти неотличима от голоса человека
AOinformIT 28.12.2017 в 16:209320 Иллюстрация / Фото: из открытых источников Google показал новую систему синтеза речи Google разработала продвинутый синтезатор речи нового поколения. Он называется Tacotron 2 и основан на нейросети. Система преобразования текста в естественно звучащую речь Tacotron 2 справляется с этой задачей эффективнее своих предшественников Tacotron и WaveNet, пишет TechCrunch. Предыдущие системы генерации речи обладали рядом существенных недостатков. WaveNet, к примеру, издавала очень резкие звуки. Tacotron лучше справлялся с интонациями, но не мог выдавать полноценный "речевой продукт". Алгоритм Tacotron 2, который представлен командой разработчиков Google при участии Джонатана Шена, работает на основе двух нейронных сетей. Печатная версия конвертируется в специальную Tacotron-спектрограмму, в которой распределяются ритм и ударения, а слова генерируются в аналоге WaveNet. Кроме того, добавлена система сбора данных для обучения нейросети. Аудиозапись действительно похожа на речь живого человек. Темп речи звучит весьма убедительно, а основные запинки происходят на словах с необычным произношением. Правда, часть слушателей в комментариях утверждает, что некоторые слова система выговаривает "ломано". Образцы работы Tacorton 2 можно прослушать на официальном сайте Google. Эта технология, скорее всего, сразу начнет использоваться в продуктах компании. Одной из основных проблем нового алгоритма является отсутствие регулировки тона речи. Нельзя предугадать, какая фраза будет произнесена приподнято, а какая — грубо. Дмитрий Вовчок / nomid Главред AOinform
28.12.2017 в 16:20 932 IT 1 2 3 4 5 0.0 Google, синтез речи

Комментариев: 0

Войдите, чтобы оставить комментарий.