Key points are not available for this paper at this time.
تعود أصول CRISP-DM (العملية القياسية عبر الصناعة لاستخراج البيانات) إلى النصف الثاني من التسعينيات، وبالتالي فهو عمره حوالي عقدين من الزمن. وفقاً للعديد من الاستطلاعات واستطلاعات الرأي، لا يزال هو المعيار الفعلي لتطوير مشاريع استخراج البيانات واكتشاف المعرفة. ومع ذلك، لا شك أن هذا المجال قد تقدم بشكل ملحوظ خلال عشرين عاماً، حيث أصبح علم البيانات الآن المصطلح الرائد المفضل على استخراج البيانات. في هذا البحث، نحقق فيما إذا كانت، وفي أي سياقات، لا يزال CRISP-DM مناسباً لمشاريع علم البيانات. نحن نجادل بأنه إذا كان المشروع موجهًا نحو هدف ويدفعه العملية، فإن نموذج العملية لا يزال ساريًا إلى حد كبير. من ناحية أخرى، عندما تصبح مشاريع علم البيانات أكثر استكشافًا، تصبح المسارات التي يمكن أن يتخذها المشروع أكثر تنوعًا، ويتطلب الأمر نموذجًا أكثر مرونة. نحن نقترح كيف يمكن أن تبدو ملامح نموذج قائم على المسارات وكيف يمكن استخدامه لتصنيف مشاريع علم البيانات (موجهة نحو هدف، استكشافية أو إدارة بيانات). نحن نExam سبعة أمثلة حقيقية حيث تلعب الأنشطة الاستكشافية دورًا مهمًا ونت_compareها مع 51 حالة استخدام مستخرجة من مجموعة العمل العامة للبيانات الضخمة NIST. نتوقع أن تساعد هذه التصنيف في تخطيط المشروع من حيث خصائص الزمن والتكلفة.
درس مارتينيز-بلوميد وآخرون (Fri,) هذا السؤال.
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: