What question did this study set out to answer?

Ziel ist es, ein KI-Rahmenwerk zur genauen Erkennung von Posen im traditionellen chinesischen Tanz zu entwickeln, um das Kulturerbe zu bewahren.

May 11, 2026Open Access

KI-gesteuerte Aktions- und Körperhaltungserkennung für traditionelle chinesische darstellende Kunst in der digitalen Kulturskommunikation

Key Points

Ziel ist es, ein KI-Rahmenwerk zur genauen Erkennung von Posen im traditionellen chinesischen Tanz zu entwickeln, um das Kulturerbe zu bewahren.
Nutzung von Mehransichtenanpassung und auf Aufmerksamkeit basierendem zeitlichen Modellieren zur Pose-Erkennung.
Einsatz von ResNet zur räumlichen Merkmalsextraktion und BiLSTM mit Selbstaufmerksamkeit für das zeitliche Modellieren.
Durchführung von generativem adversarialem Training unter Verwendung des AMASS-Datensatzes.
Erzielte eine Genauigkeit von 96 % und demonstrierte eine robuste Klassifizierungsleistung in verschiedenen Tanzkategorien.
Berichtete von 94,90 % Präzision, 96,17 % Rückruf und 95,53 % F1-Score, was starke Erkennungsfähigkeiten anzeigt.

Abstract

Das vorgeschlagene KI-Rahmenwerk zur Erkennung von Körperhaltungen im traditionellen chinesischen Tanz nutzt Mehransichtenanpassung und auf Aufmerksamkeit basierendes zeitliches Modellieren, um expressive Bewegungssemantiken zu erfassen. Es verarbeitet, extrahiert Merkmale und klassifiziert Posen zur Bewahrung des Kulturerbes und übertrifft bestehende Ansätze in der Genauigkeit. Bestehende Tanz-erkennungssysteme weisen jedoch oft eine unzureichende robuste Anpassungsfähigkeit über Ansichten hinweg und effektives langzeitliches zeitliches Modellieren auf, was ihre Fähigkeit limitiert, expressive Bewegungsdynamiken im traditionellen Tanz zu erfassen. Dies zeigt eine Forschungslücke in der Entwicklung eines kulturell anpassungsfähigen und zeitlich aufmerksamen Erkennungsrahmenwerks. Skelettpose-Sequenzen werden normalisiert und segmentiert, wobei ResNet diskriminierende räumliche Merkmale extrahiert. Diese Merkmale werden mithilfe von BiLSTM mit Selbstaufmerksamkeit modelliert, um langzeitige zeitliche Abhängigkeiten in der Vergangenheit und Zukunft zu erfassen, was eine robuste Erkennung kulturell ausdrucksstarker Tanzbewegungen ermöglicht. Generative adversariales Training unter Verwendung des Archive of Motion Capture as Surface Shapes (AMASS) Datensatzes und räumliche Merkmalsextraktion durch ResNet verbessern den Realismus und die Generalisierbarkeit der Bewegungen. Das Modell erzielt eine Genauigkeit von 96 %, eine Präzision von 94,90 %, eine Rückrufrate von 96,17 % und einen F1-Score von 95,53 %, was eine robuste Klassifizierungsleistung demonstriert. Das Rahmenwerk unterstützt die digitale Bewahrung des traditionellen chinesischen Tanzes und ermöglicht Anwendungen in interaktiven Aufführungen, Initiativen zum Kulturerbe und KI-gesteuerten Tanzforschung.

KI-gesteuerte Aktions- und Körperhaltungserkennung für traditionelle chinesische darstellende Kunst in der digitalen Kulturskommunikation

Key Points

Abstract

Cite This Study