Key points are not available for this paper at this time.
تم الترويج لتركيب البيانات كنهج مهم لاستخدام البيانات مع حماية خصوصية البيانات. تم اقتراح عدد كبير من خوارزميات تركيب البيانات الجدولية (التي نسميها المُركبين). يحقق بعض المُركبين خصوصية تفاضلية، بينما يهدف الآخرون إلى توفير الخصوصية بشكل حدسي. لا يزال الفهم الشامل لنقاط القوة والضعف في هذه المُركبين غير واضح بسبب نقص معايير التقييم المنهجية وعدم وجود مقارنات متكافئة للمركبين الجدد الذين يستفيدون من نماذج التشتت ونماذج اللغة الكبيرة مع المُركبين المعتمدين على الهوامش. في هذه الورقة، نقدم إطار تقييم منهجي ومبدئي لتقييم خوارزميات تركيب البيانات الجدولية. على وجه الخصوص، نقوم بفحص وانتقاد معايير التقييم الحالية، ونقدم مجموعة من المعايير الجديدة من حيث الدقة والخصوصية والمنفعة لمعالجة قيودها. استنادًا إلى المعايير المقترحة، نضع أيضًا هدفًا موحدًا لضبط الإعدادات، والذي يمكن أن يحسن بشكل متسق جودة البيانات الاصطناعية لجميع الطرق. أجرينا تقييمات شاملة لثمانية أنواع مختلفة من المُركبين على 12 مجموعة بيانات وحددنا بعض الاكتشافات المثيرة للاهتمام، والتي تقدم اتجاهات جديدة لتركيب البيانات مع الحفاظ على الخصوصية.
درس دو وآخرون (جمعة) هذا السؤال.