Наука и технологииРазработка

Нейросеть научилась рисовать портреты по голосу (ФОТО)

05:35 29 май 2019.  2184Читайте на: УКРРУС

Специалисты обучили технологию рисовать с помощью нескольких миллионов видео.

Группа американских разработчиков представила нейросеть Speech2Face, способную нарисовать портрет человека по его голосу. Об этом сообщило arXiv.org.

Модели под силу нарисовать изображение, взяв за основу пол, расу, возраст. Разработкой занимался коллектив из Массачусетского технологического института, в составе которого был Тахён О.

Читайте также: Ученые рассказали, как роботы колонизируют Луну

Ученые решили использовать для обучения нейросети датасет AVSpeech. Он содержит порядка миллиона коротких видео более сотни тысяч различных людей. При этом видео- и аудиодорожки разделены.

Точность работы технологии создатели определили согласно трем демографическим показателям. Сравнению подвергли пол, ориентировочный возраст и расу людей из оригинальных роликов и «вывод», сделанный нейросетью.

Также были выявлены недостатки модели. Она не всегда в состоянии определить возраст с точностью до десяти лет, а лучше всего изображает европеоидов и азиатов. Считается, что последняя проблема связана с неравномерностью присутствия различных рас в выборке для обучения.

По словам исследователей, в их планы не входило доскональное копирование внешности человека. Они стремились к точной идентификации пола, возраста, этноса.

На фото: оригинальные изображения, восстановленные и «нарисованные» по голосу.

Читайте также: Китайцы планируют создать робота-юмориста

Stanislav Karlov

Самое читаемое