Key points are not available for this paper at this time.
Hashing-Methoden wurden aufgrund der Explosion von Multimedia-Daten umfassend für die effiziente Indizierung und Abfrage von Multimediadaten angewendet. Cross-Modal Hashing lernt in der Regel binäre Codes, indem es multimodale Daten in einen gemeinsamen Hamming-Raum abbildet. Die meisten überwachten Methoden nutzen Beziehungsinformationen wie Klassenlabels als paarweise Ähnlichkeiten von Cross-Modal-Datenpaaren, um die intra-modal und inter-modal Lücke zu verringern. In diesem Papier schlagen wir eine neuartige überwachte Cross-Modal Hashing-Methode vor, die als Subspace Relation Learning for Cross-modal Hashing (SRLCH) bezeichnet wird und die Beziehungsinformationen von Labels im semantischen Raum ausnutzt, um ähnliche Daten aus verschiedenen Modalitäten im niederdimensionalen Hamming-Teilraum näher zusammenzubringen. SRLCH bewahrt die Modalitätsbeziehungen, die diskreten Einschränkungen und nichtlinearen Strukturen und erlaubt eine geschlossene Lösung für binäre Codes, was die Trainingseffizienz effektiv steigert. Ein iterativer alternativer Optimierungsalgorithmus wird entwickelt, um gleichzeitig sowohl Hash-Funktionen als auch einheitliche binäre Codes zu lernen. Mit diesen binären Codes und Hash-Funktionen können wir Multimediadaten indizieren und sie effizient durchsuchen. Bewertungen in zwei Cross-Modal-Abfrageaufgaben auf mehreren weit verbreiteten Datensätzen zeigen, dass das vorgeschlagene SRLCH die meisten Cross-Modal-Hashing-Methoden übertrifft. Theoretische Analysen illustrieren auch die Gründe für die Verbesserungen unserer Methode im Lernen von Teilraumbeziehungen.
Shen et al. (Mi.) haben diese Frage untersucht.