Key points are not available for this paper at this time.
コンピュータビジョンの問題に取り組む標準的なアプローチは、ターゲットタスクを代表する大規模な画像データセットを使用して深層畳み込みニューラルネットワーク(CNN)モデルを訓練することです。しかし、多くのシナリオでは、ターゲットタスクに対する十分な画像データを取得することはしばしば困難です。データ拡張はこの課題を緩和する方法の一つです。一般的な実践は、既存の画像を希望する方法で明示的に変換し、良好な一般化性能を達成するために必要なトレーニングデータのボリュームと多様性を生成することです。ターゲットドメインのデータが入手できない状況では、実用的な回避策はトレーニングデータをゼロから合成すること—すなわち、合成データ拡張です。本論文は合成データ拡張技術の広範なレビューを提示します。現実的な3Dグラフィックスモデリング、ニューラルスタイル転送(NST)、微分ニューラルレンダリング、生成的敵対ネットワーク(GANs)や変分オートエンコーダ(VAEs)などの生成的人工知能(AI)技術に基づくデータ合成アプローチをカバーします。これらの手法の各クラスについて、重要なデータ生成と拡張技術、応用の一般的範囲、特定の使用ケース、および既存の制限と可能な回避策に焦点を当てます。さらに、コンピュータビジョンモデルの訓練に使用される一般的な合成データセットの概要を提供し、主要な特徴、応用分野、サポートされるタスクを強調します。最後に、合成データ拡張手法の効果を議論します。本論文は合成データ拡張手法を詳細に探求する最初のものであるため、読者に必要な背景情報と既存の手法およびそれに伴う問題に関する深い知識を提供することを期待しています。
Building similarity graph...
Analyzing shared references across papers
Loading...
Alhassan Mumuni
Cape Coast Technical University
Fuseini Mumuni
University of Mines and Technology
Nana Kobina Gerrar
Cape Coast Technical University
Building similarity graph...
Analyzing shared references across papers
Loading...
ムムニら(Fri、)はこの問題を研究しました。
synapsesocial.com/papers/68e73cb2b6db6435876b5f31 — DOI: https://doi.org/10.1007/s11633-022-1411-7