Los puntos clave no están disponibles para este artículo en este momento.
El éxito de los modelos de IA depende de la disponibilidad de conjuntos de datos grandes, diversos y de alta calidad, lo que puede ser un desafío debido a la escasez de datos, preocupaciones de privacidad y altos costos. Los datos sintéticos han surgido como una solución prometedora al generar datos artificiales que imitan patrones del mundo real. Este documento proporciona una visión general de la investigación sobre datos sintéticos, discutiendo sus aplicaciones, desafíos y direcciones futuras. Presentamos evidencia empírica de trabajos anteriores para demostrar su efectividad y destacar la importancia de asegurar su veracidad, fidelidad e imparcialidad. Enfatizamos la necesidad de un uso responsable de los datos sintéticos para construir modelos de lenguaje más poderosos, inclusivos y confiables.
Liu et al. (Thu,) estudiaron esta cuestión.