Wir betrachten eine Verallgemeinerung des renommierten Rahmens der Online-konvexen Optimierung (OCO) mit online gegnerischen Beschränkungen. Wir präsentieren zwei Algorithmen mit einfachen modularen Strukturen, die universelle dynamische Bedauerns- und kumulative Beschränkungsverletzungsgrenzen ergeben und die bestehenden Ergebnisse verbessern. Unsere Ergebnisse gelten im allgemeinsten Fall, wenn sowohl die Kosten- als auch die Beschränkungsfunktionen willkürlich von einem Gegner gewählt werden und die Beschränkungsfunktionen keinen gemeinsamen zulässigen Punkt enthalten müssen. Die Ergebnisse werden durch die Reduzierung des eingeschränkten Lernproblems auf ein Beispiel des Standard-OCO-Problems mit speziell konstruierten Ersatzkostenfunktionen etabliert.
Supantha et al. (Do,) untersuchten diese Frage.