Abwehr gegen feindliche Angriffe basierend auf Farbtransformation

Key Points

Key points are not available for this paper at this time.

Abstract

Deep Learning-Algorithmen haben in verschiedenen wichtigen Aufgaben eine Spitzenleistung erzielt. Neuere Studien haben jedoch gezeigt, dass eine ausgeklügelte Störung ein Netzwerk dazu bringen kann, falsch zu klassifizieren, was als feindlicher Angriff bekannt ist. Basierend auf aktuellen Forschungen wird vorgeschlagen, dass feindliche Beispiele nicht vollständig eliminiert werden können. Folglich ist es immer möglich, einen Angriff zu bestimmen, der gegen ein Verteidigungsmodell wirksam ist. Wir machen bestehende feindliche Beispiele ungültig, indem wir die Klassifikationsgrenzen ändern. In der Zwischenzeit werden die feindlichen Störungen für gültige feindliche Beispiele, die gegen das Verteidigungsmodell erzeugt werden, erhöht, sodass sie mit dem menschlichen Auge unterschieden werden können. Dieses Papier schlägt eine Methode zur Implementierung der oben genannten Konzepte durch Farbtransformation vor. Experimente mit CIFAR-10, CIFAR-100 und Mini-ImageNet zeigen die Wirksamkeit und Vielseitigkeit unserer Verteidigungsmethode. Soweit wir wissen, ist dies das erste Verteidigungsmodell, das auf der Verstärkung feindlicher Störungen basiert.

Abwehr gegen feindliche Angriffe basierend auf Farbtransformation

Key Points

Abstract

Cite This Study