Key points are not available for this paper at this time.
Zusammenfassung Die rechtzeitige Diagnose und Identifizierung von Krankheiten der Apfelblätter ist entscheidend, um die Ausbreitung von Krankheiten zu verhindern und eine gesunde Entwicklung der Apfelindustrie zu gewährleisten. Convolutional Neural Networks (CNNs) haben im Bereich der Erkennung von Blattkrankheiten phenomalen Erfolg erzielt, was der Landwirtschaft von großem Nutzen sein kann. Dennoch stellt ihre große Größe und komplizierte Struktur eine Herausforderung beim Einsatz dieser Modelle auf leichten Geräten dar. Obwohl mehrere erfolgreiche Modelle (z.B. EfficientNets und MobileNets) entwickelt wurden, um sich an ressourcenbeschränkte Geräte anzupassen, konnten diese Modelle keine signifikanten Ergebnisse bei der Erkennung von Blattkrankheiten erzielen und hinterlassen eine Leistungslücke. Diese Forschungslücke hat uns motiviert, ein Modell zur Erkennung von Apfelblattkrankheiten zu entwickeln, das nicht nur auf leichten Geräten eingesetzt werden kann, sondern auch bestehende Modelle übertrifft. In dieser Arbeit schlagen wir AppViT vor, ein hybrides Vision-Modell, das die Merkmale von Faltungsblöcken und Multi-Head-Selbstaufmerksamkeit kombiniert, um mit den leistungsstärksten Modellen zu konkurrieren. Insbesondere beginnen wir mit der Einführung der Faltungsblöcke, die die Größe der Merkmalskarten reduzieren und dem Modell helfen, lokale Merkmale schrittweise zu kodieren. Anschließend stapeln wir ViT-Blöcke in Kombination mit Faltungsblöcken, die es dem Netzwerk ermöglichen, nicht-lokale Abhängigkeiten und räumliche Muster zu erfassen. Durch diese Designs und eine hierarchische Struktur zeigt AppViT hervorragende Leistungen bei Aufgaben zur Erkennung von Apfelblattkrankheiten. Es erreicht eine Präzision von 96,38 % bei Plant Pathology 2021—FGVC8 mit etwa 1,3 Millionen Parametern, was 11,3 % und 4,3 % genauer ist als ResNet-50 und EfficientNet-B3. Die Präzision, der Rückruf und der F-Score unseres vorgeschlagenen Modells bei Plant Pathology 2021—FGVC8 sind 0,967, 0,959 und 0,963.
Ullah et al. (Di,) untersuchten diese Frage.