¿Cuántas veces hemos imaginado el rostro de una persona tan solo con escuchar su voz? Muchas veces. Y es una práctica muy común, por ejemplo, cuando escuchamos a los locutores de radio. Pero ¿qué pasa cuando dicha práctica roza los niveles de la tecnología? Pues desemboca en la creación de una IA (inteligencia artificial) capaz de predecir y reconocer el rostro de una persona solo con escuchar su voz.
Resulta que un grupo de investigadores del Instituto de Tecnología de Massachusetts (MIT, por sus siglas en inglés) inició un proyecto cuyo objetivo es crear un algoritmo capaz de emular los rasgos físicos de un ser humano únicamente cuando habla.
El resultado fue Speech2Face, una página web dotada de IA que sirve para recrear un rostro humano de la vida real con tan solo reproducir algunos segundos de un audio con su voz. Básicamente, este sistema se basa en una especie de red neuronal capaz de reconocer ciertos rasgos físicos de las personas. Dichos rasgos pueden ser el origen étnico, la edad y el género.
Asimismo, hacen énfasis en que la correlación de voces y rostros se basa en un sinfín de personas que aparecen en videos de YouTube.
Los resultados son una gama de rostros virtuales muy similares a personas reales. Es decir, la IA no replica exactamente el rostro de una persona humana. Más bien lo que hace es crear una imagen virtual muy parecida que recupera los aspectos/rasgos físicos que estén correlacionados con el habla de una persona humana.