OpenAI, создавшая ChatGPT, представила платформу преобразования текста в голос — Voice Engine. Нейросеть способна клонировать голос человека, основываясь на 15-секундной записи.
По мнению разработчиков, такая модель будет полезна многим людям. Например, она поможет слабовидящим или тем, у кого трудности с чтением. Нейросеть также способна исправить проблемы с речью человека.
Более того, Voice Engine может переводить аудио на разные языки, сохраняя особенности голоса оригинала. Эта функция будет полезна контент-мейкерам с широкой аудиторией.
OpenAI разрабатывала Voice Engine с конца 2022 года. Сейчас модель доступна узкому кругу людей, тестирующих технологию. Вероятно, нейросеть так и не станет достоянием общественности из-за высокого риска злоупотребления в целях мошенничества и создания фейков.
Заглавное фото: РИА Новости
0 комментариев