Los puntos clave no están disponibles para este artículo en este momento.
Con el avance de la inteligencia artificial, los métodos para generar deepfakes de audio han mejorado, pero la tecnología detrás de ellos se ha vuelto más compleja. A pesar de esto, los usuarios no expertos pueden generar deepfakes de audio debido a la mayor accesibilidad de las últimas tecnologías. Estas tecnologías pueden ser utilizadas para apoyar a creadores de contenido, cantantes y empresas, como las industrias de publicidad o entretenimiento. Sin embargo, también pueden ser mal utilizadas para crear desinformación, fraude de CEO y estafas de voz. Por lo tanto, con la creciente demanda de contramedidas contra su mala utilización, se requiere un intercambio interdisciplinario continuo. Este trabajo presenta técnicas recientes para generar deepfakes de audio, con un enfoque en la síntesis de texto a voz y la conversión de voz para no expertos. Cubre conocimientos básicos, las últimas tendencias y modelos, así como software de código abierto y cerrado para explorar tanto los aspectos tecnológicos como prácticos de los deepfakes de audio.
Choi et al. (Sat,) estudiaron esta cuestión.