Key points are not available for this paper at this time.
لقد كان التعلم الآلي حجر الأساس في تحليل واستخراج المعلومات من البيانات وغالبًا ما يواجه مشكلة القيم المفقودة. تحدث القيم المفقودة بسبب عوامل مختلفة مثل المفقود تمامًا بشكل عشوائي، المفقود بشكل عشوائي أو المفقود ليس بشكل عشوائي. وقد تنتج كل هذه عن خلل في النظام أثناء جمع البيانات أو خطأ بشري أثناء معالجة البيانات. ومع ذلك، من المهم التعامل مع القيم المفقودة قبل تحليل البيانات، حيث إن تجاهل أو حذف القيم المفقودة قد يؤدي إلى تحليل متحيز أو مضلل. في الأدبيات، كان هناك العديد من الاقتراحات للتعامل مع القيم المفقودة. في هذه الورقة، نقوم بتجميع بعض الأدبيات حول البيانات المفقودة مع التركيز بشكل خاص على تقنيات التعلم الآلي. كما نقدم رؤى حول كيفية عمل أساليب التعلم الآلي من خلال تسليط الضوء على الميزات الرئيسية لتقنيات تقدير القيم المفقودة، وكيفية أدائها، ومحدداتها، ونوع البيانات الأكثر ملاءمة لها. نقترح ونقيم طريقتين، الأقرب الكلّي (k-nearest neighbor) وطريقة تقدير تكراري (missForest) تعتمد على خوارزمية الغابات العشوائية. يتم إجراء التقييم على بيانات مروحة مصنع الطاقة إيريس وبيانات جديدة مع قيم مفقودة بمعدل مفقود يتراوح من 5% إلى 20%. ونوضح أن كل من missForest والأقرب الكلّي قادران على التعامل بنجاح مع القيم المفقودة وتقديم بعض الاتجاهات المحتملة للبحث المستقبلي.
Building similarity graph...
Analyzing shared references across papers
Loading...
SHILAP Revista de lepidopterología
Journal Of Big Data
Botswana International University of Science and Technology
Add This Paper to Your Research Feed
Any time a new paper drops it will be there.
درس إيمانويل وآخرون (الأربعاء) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: