Key points are not available for this paper at this time.
IoT(モノのインターネット)は非常に深い影響を持ち、参加者がスマートデバイスを通じてデータを測定しプラットフォームに集約するクラウドセンシングが最も人気のあるセンシングパラダイムとして現れてきました。しかし、参加者が十分な報酬を得られない場合や、個人のプライベート情報が開示される場合、データセンシングと集約に関与したくない可能性があります。これらの問題を克服するために、本稿では、各参加者が指定されたプライバシー保護レベル(PPL)でセンシングデータを提出し、プラットフォームが参加者に対して対応する報酬を選択するPPLゲームを提案します。さらに、ゲームのナッシュ均衡点を導出します。実際には報酬-PPLモデルが未知であることを考慮し、動的報酬-PPLゲームにおける報酬-PPL戦略を得るために強化学習技術、すなわちQ学習を採用します。さらに、深層学習技術とQ学習を組み合わせた深層Qネットワーク(DQN)を使用して学習速度を加速します。広範なシミュレーションを通じて、DQNを使用した我々の提案したアルゴリズムは、Q学習を使用したものと比べて、プラットフォームと参加者のユーティリティおよびデータ集約精度の面で優れた性能を達成することを検証しました。
Liu et al.(火曜日、)はこの問題を研究しました。