No cabe duda que la Inteligencia Artificial sorprende cada día, para bien, pero también para mal si se llega a usar con fines ilegales, como es el caso de un modelo de IA que crea videos hiperrealistas a partir de una foto y ¡con audio!
Microsoft Research, la división investigativa del gigante informático, comienza a desarrollando una herramienta de IA generativa capaz de crear "rostros parlantes" hiperrealistas.
Ello a partir de una imagen estática y un clip de audio, de acuerdo con un artículo publicado este martes, citado por el portal de noticias RT.
Te podría interesar
Explican sus creadores, el VASA-1 (Visual Affective Skills Animator o Animador de Habilidades Afectivas Visuales en español) toma el retrato de una persona y hace que literalmente hable, produciendo una muy convincente sincronización entre sus labios y el archivo de audio que se desee.
Captura un "amplio espectro de matices faciales y movimientos naturales de la cabeza que contribuyen a la percepción de autenticidad y vivacidad".
Te podría interesar
Microsoft compartió varios ejemplos utilizando rostros humanos inexistentes —por razones de privacidad— creados con las redes neuronales de generación de imágenes DALL-E 3 y StyleGAN2.
La galería incluye avatares cantando y hablando en sincronización con pistas de audio pregrabadas y muestras de cómo se pueden controlar para que expresen diferentes estados de ánimo o cambien su mirada.
VASA-1 también puede procesar "fotografías artísticas, audios cantados y de habla no inglesa". Como prueba, sus creadores lograron que la famosa obra maestra de Leonardo da Vinci, la 'Mona Lisa', interpretara el 'Paparazzi Rap' que una vez cantó la actriz Anne Hathaway.
Peligros de la tecnología
Microsoft dijo que VASA-1 está en etapa de aprendizaje y lo revelado esta semana es solo una demostración de la investigación, por lo cual no está disponible para que lo pruebe nadie ajeno al equipo de Microsoft Research.
De hecho, la empresa no tiene previsto lanzarlo al público, en la medida en que es consciente de los peligros de este tipo de tecnología.
Aunque reconoce que no es perfecto, supera significativamente a otros similares de animación de voz en términos de realismo, expresividad y eficiencia, por lo que existe el riesgo de ser "potencialmente mal utilizado" para suplantar identidades, afirma Microsoft.
Así, podría prestarse para que personas inescrupulosas falsifiquen material audiovisual creando contenido engañoso o perjudicial, como los famosos 'deepfakes' que a menudo implican fraudes o desinformación.
No cabe duda que la Inteligencia Artificial sorprende cada día, para bien, pero también para mal si se llega a usar con fines ilegales, como es el caso de este modelo de IA que crea videos hiperrealistas a partir de una foto y ¡con audio!