توليد سياسات التعلم التعزيزي البرمجي من خلال بحث موجه بواسطة نموذج لغة كبير | Synapse