OpenAI, la empresa detrás del conocido ChatGPT, ha anunciado avances significativos en su herramienta Voice Engine, capaz de crear voces sintéticas utilizando tan solo 15 segundos de audio como muestra.
Los últimos ejemplos presentados por la compañía, en su blog, demuestran la capacidad del software para replicar sonidos emotivos y realistas mediante inteligencia artificial.
Esta voz generada puede interpretar textos en el mismo idioma que el usuario o en cualquier otro deseado.
Te podría interesar
La tecnología, que comenzó a desarrollarse a fines de 2022, está en una fase de acceso previo limitado, disponible para un selecto grupo de desarrolladores, según Jeff Harris, miembro del equipo de producto.
Aún no se ha anunciado si OpenAI tiene planes de lanzar este servicio al público, similar a como lo hizo con ChatGPT.
Te podría interesar
Según los creadores, estas implementaciones en pequeña escala están ayudando a modelar su enfoque, salvaguardas y consideraciones éticas sobre el uso de Voice Engine en diversas industrias.
Desafíos a la seguridad
La empresa es consciente de los posibles riesgos asociados con la disponibilidad generalizada de esta tecnología, especialmente en un contexto de aumento de los deepfakes en internet.
Por esta razón, se han implementado medidas de seguridad, como marcas de agua para rastrear el origen del audio generado por la herramienta, y un monitoreo proactivo de su uso.
Chat GPT reconoce los serios riesgos de crear discursos que se asemejen a las voces de las personas, especialmente en un año electoral en EU y se compromete a tener en cuenta las recomendaciones de diversas entidades, como el gobierno estadounidense.
Con información de RT