Das vorgeschlagene KI-Rahmenwerk zur Erkennung von Körperhaltungen im traditionellen chinesischen Tanz nutzt Mehransichtenanpassung und auf Aufmerksamkeit basierendes zeitliches Modellieren, um expressive Bewegungssemantiken zu erfassen. Es verarbeitet, extrahiert Merkmale und klassifiziert Posen zur Bewahrung des Kulturerbes und übertrifft bestehende Ansätze in der Genauigkeit. Bestehende Tanz-erkennungssysteme weisen jedoch oft eine unzureichende robuste Anpassungsfähigkeit über Ansichten hinweg und effektives langzeitliches zeitliches Modellieren auf, was ihre Fähigkeit limitiert, expressive Bewegungsdynamiken im traditionellen Tanz zu erfassen. Dies zeigt eine Forschungslücke in der Entwicklung eines kulturell anpassungsfähigen und zeitlich aufmerksamen Erkennungsrahmenwerks. Skelettpose-Sequenzen werden normalisiert und segmentiert, wobei ResNet diskriminierende räumliche Merkmale extrahiert. Diese Merkmale werden mithilfe von BiLSTM mit Selbstaufmerksamkeit modelliert, um langzeitige zeitliche Abhängigkeiten in der Vergangenheit und Zukunft zu erfassen, was eine robuste Erkennung kulturell ausdrucksstarker Tanzbewegungen ermöglicht. Generative adversariales Training unter Verwendung des Archive of Motion Capture as Surface Shapes (AMASS) Datensatzes und räumliche Merkmalsextraktion durch ResNet verbessern den Realismus und die Generalisierbarkeit der Bewegungen. Das Modell erzielt eine Genauigkeit von 96 %, eine Präzision von 94,90 %, eine Rückrufrate von 96,17 % und einen F1-Score von 95,53 %, was eine robuste Klassifizierungsleistung demonstriert. Das Rahmenwerk unterstützt die digitale Bewahrung des traditionellen chinesischen Tanzes und ermöglicht Anwendungen in interaktiven Aufführungen, Initiativen zum Kulturerbe und KI-gesteuerten Tanzforschung.
夏月曼 (Fri,) hat diese Frage untersucht.