August 12, 2012

تجميع مانهاتن لاسترجاع الصور على نطاق واسع

Key Points

Key points are not available for this paper at this time.

Abstract

يتم استخدام التجميع لتعلم تمثيل البيانات بشكل ثنائي مع توقع الحفاظ على بنية الجوار في الفضاء الأصلي للخصائص. نظراً لسرعة استعلامها العالية وانخفاض تكلفة التخزين، تم استخدام التجميع على نطاق واسع للبحث الفعال عن أقرب الجيران في مجموعة متنوعة كبيرة من التطبيقات مثل استرجاع النصوص والصور. معظم طرق التجميع الحالية تعتمد على مسافة هامينغ لقياس التشابه (الجوار) بين النقاط في فضاء الشفرة التجميعية. ومع ذلك، تكمن إحدى مشاكل مسافة هامينغ في أنها قد تدمر بنية الجوار في الفضاء الأصلي للخصائص، مما ينتهك الهدف الأساسي للتجميع. في هذه الورقة، تم اقتراح تجميع مانهاتن (MH)، الذي يستند إلى مسافة مانهاتن، لحل مشكلة التجميع القائم على مسافة هامينغ. الفكرة الأساسية لـ MH هي تشفير كل بُعد متوقع باستخدام عدة بتات من الشفرة الثنائية الطبيعية (NBC)، بناءً على ذلك يتم حساب مسافة مانهاتن بين النقاط في فضاء الشفرة التجميعية للبحث عن أقرب الجيران. يمكن لـ MH الحفاظ بفاعلية على بنية الجوار في البيانات لتحقيق هدف التجميع. إلى أفضل معرفتنا، هذه هي أول دراسة تعتمد على مسافة مانهاتن مع NBC للتجميع. تُظهر التجارب على عدة مجموعات بيانات صور كبيرة تحتوي على ما يصل إلى مليون نقطة أن طريقتنا MH يمكن أن تتفوق بشكل كبير على طرق أخرى متقدمة.

Bookmark

تجميع مانهاتن لاسترجاع الصور على نطاق واسع

Key Points

Abstract

Cite This Study

Also Consider

Also Consider