Key points are not available for this paper at this time.
مع النمو السريع في حجم البيانات، أصبح من الجذاب أكثر من أي وقت مضى الاستفادة من التقديرات للإجابة على الاستفسارات التحليلية. يعتبر أخذ العينات تقنية قوية تم دراستها بشكل موسع من منظور تسهيل التقدير. ومع ذلك، لم يكن هناك دراسة واسعة النطاق حول فعالية تقنيات أخذ العينات في أنظمة البيانات الكبيرة. في هذه الورقة، نصف دراسة متعمقة لتقنيات التقدير المستندة إلى أخذ العينات التي قمنا بتطبيقها في مجموعات بيانات مايكروسوفت الكبيرة. نشرح الخيارات التي اتخذناها لتنفيذ التقدير، ونحدد حالات الاستخدام، وندرس بيانات تفصيلية توضح الفائدة من إجراء تقدير قائم على أخذ العينات.
قام كاندولا وزملاؤه (الخميس) بدراسة هذا السؤال.