За считанные секунды можно создать копию голоса — появилась новая упрощённая модель для синтеза речи, способная воспроиз
За считанные секунды можно создать копию голоса — появилась новая упрощённая модель для синтеза речи, способная воспроизводить чужой голос по короткому аудиофрагменту. Все очень просто: достаточно предоставить нейросети несколько секунд записи человека, и она сможет произносить любой текст тем же голосом. Результат звучит довольно натурально: качество достигает 48 кГц, что сопоставимо с обычной аудиозаписью. Самое удивительное — это скорость. Модель генерирует речь в 150 раз быстрее, чем происходит реальное воспроизведение. Проще говоря, минутный текст она озвучит за доли секунды. При этом искусственному интеллекту требуется менее 1 ГБ видеопамяти, поэтому его можно запускать локально даже на стандартном ПК или ноутбуке. Скачать можно здесь (https://github.com/ysharma3501/LuxTTS).
Подписывайся на Telegram-канал Нейроньюс: нейросети и ИИ сервисы https://t.me/neuro_services_news