Key points are not available for this paper at this time.
يتم استخدام التجميع لتعلم تمثيل البيانات بشكل ثنائي مع توقع الحفاظ على بنية الجوار في الفضاء الأصلي للخصائص. نظراً لسرعة استعلامها العالية وانخفاض تكلفة التخزين، تم استخدام التجميع على نطاق واسع للبحث الفعال عن أقرب الجيران في مجموعة متنوعة كبيرة من التطبيقات مثل استرجاع النصوص والصور. معظم طرق التجميع الحالية تعتمد على مسافة هامينغ لقياس التشابه (الجوار) بين النقاط في فضاء الشفرة التجميعية. ومع ذلك، تكمن إحدى مشاكل مسافة هامينغ في أنها قد تدمر بنية الجوار في الفضاء الأصلي للخصائص، مما ينتهك الهدف الأساسي للتجميع. في هذه الورقة، تم اقتراح تجميع مانهاتن (MH)، الذي يستند إلى مسافة مانهاتن، لحل مشكلة التجميع القائم على مسافة هامينغ. الفكرة الأساسية لـ MH هي تشفير كل بُعد متوقع باستخدام عدة بتات من الشفرة الثنائية الطبيعية (NBC)، بناءً على ذلك يتم حساب مسافة مانهاتن بين النقاط في فضاء الشفرة التجميعية للبحث عن أقرب الجيران. يمكن لـ MH الحفاظ بفاعلية على بنية الجوار في البيانات لتحقيق هدف التجميع. إلى أفضل معرفتنا، هذه هي أول دراسة تعتمد على مسافة مانهاتن مع NBC للتجميع. تُظهر التجارب على عدة مجموعات بيانات صور كبيرة تحتوي على ما يصل إلى مليون نقطة أن طريقتنا MH يمكن أن تتفوق بشكل كبير على طرق أخرى متقدمة.
درس كونغ وآخرون (سون) هذا السؤال.
Synapse has enriched 4 closely related papers on similar clinical questions. Consider them for comparative context: