October 1, 2021

Kontextentkopplungs-Augmentierung für schwach überwachtes semantisches Segmentieren

Key Points

Key points are not available for this paper at this time.

Abstract

Datenaugmentation ist entscheidend für tiefe Lernneuronale Netzwerke. Durch die Bereitstellung massiver Trainingsbeispiele hilft sie, die Generalisierungsfähigkeit des Modells zu verbessern. Schwach überwachtes semantisches Segmentieren (WSSS) ist ein herausforderndes Problem, das in den letzten Jahren intensiv untersucht wurde. Konventionelle Ansätze zur Datenaugmentation für WSSS verwenden normalerweise geometrische Transformationen, zufälliges Zuschneiden und Farbvariationen. Allerdings bringt die bloße Erhöhung derselben kontextuellen semantischen Daten nicht viel Gewinn für die Netzwerke, um die Objekte zu unterscheiden. Beispielsweise kann die korrekte bildweite Klassifikation von "Flugzeug" nicht nur auf die Erkennung des Objekts selbst zurückzuführen sein, sondern auch auf den Kontext seiner Ko-Erwähnung, wie "Himmel", was dazu führt, dass das Modell weniger auf die Objektmerkmale fokussiert. Zu diesem Zweck präsentieren wir eine Methode der Kontextentkopplungs-Augmentierung (CDA), um den inhärenten Kontext zu ändern, in dem die Objekte erscheinen, und somit das Netzwerk dazu zu bringen, die Abhängigkeit zwischen Objektinstanzen und kontextuellen Informationen zu beseitigen. Um die Wirksamkeit der vorgeschlagenen Methode zu validieren, zeigen umfassende Experimente an den PASCAL VOC 2012- und COCO-Datensätzen mit mehreren alternativen Netzwerkarchitekturen, dass CDA verschiedene beliebte WSSS-Methoden erheblich auf den neuen Stand der Technik anheben kann. Der Code ist verfügbar unter https://github.com/suyukun666/CDA.

Kontextentkopplungs-Augmentierung für schwach überwachtes semantisches Segmentieren

Key Points

Abstract

Cite This Study