Los puntos clave no están disponibles para este artículo en este momento.
CRISP-DM (CRoss-Industry Standard Process for Data Mining) tiene su origen en la segunda mitad de los años noventa y, por lo tanto, tiene aproximadamente dos décadas de antigüedad. Según muchas encuestas y sondeos de usuarios, sigue siendo el estándar de facto para desarrollar proyectos de minería de datos y descubrimiento de conocimiento. Sin embargo, indudablemente el campo ha avanzado considerablemente en veinte años, siendo ahora la ciencia de datos el término predominante, preferido sobre la minería de datos. En este artículo investigamos si, y en qué contextos, CRISP-DM aún es adecuado para proyectos de ciencia de datos. Argumentamos que si el proyecto está dirigido por objetivos y guiado por procesos, la visión del modelo de proceso sigue siendo válida en gran medida. Por otro lado, cuando los proyectos de ciencia de datos se vuelven más exploratorios, los caminos que el proyecto puede tomar se vuelven más variados y se requiere un modelo más flexible. Sugerimos cómo podrían ser los contornos de dicho modelo basado en trayectorias y cómo puede usarse para categorizar proyectos de ciencia de datos (dirigidos a objetivos, exploratorios o de gestión de datos). Examinamos siete ejemplos de la vida real donde las actividades exploratorias juegan un papel importante y los comparamos con 51 casos de uso extraídos del NIST Big Data Public Working Group. Anticipamos que esta categorización puede ayudar en la planificación del proyecto en términos de características de tiempo y costo.
Martínez‐Plumed et al. (vie,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: