تعتبر مجموعات بيانات تسلسل الميكروبيوم متناثرة وعالية الأبعاد وتراكيبية ومرتبة هيكليًا. يعتمد النمذجة التنبؤية من هذه البيانات عادةً على خيارات عشوائية لتمثيل الميزات، مما يعتم على تأثيرها على الأداء والتفسير البيولوجي. هناك حاجة إلى إطار عمل معياري وفعال من حيث الحوسبة لتحسين تمثيل الميزات الميكروبية وخوارزميات النموذج بشكل مشترك مع تقييم واضح للنموذج. هنا، نقدم ritme، حزمة البرمجيات مفتوحة المصدر التي تنفذ اختيار الخوارزمية المدمجة وتحسين المعلمات الفائقة المصممة لبيانات تسلسل الميكروبيوم. تستكشف ritme بانتظام طرق هندسة الميزات — التجميع التصنيفي، الاختيار المدرك للندرة، التحولات التركيبية، وإثراء البيانات الوصفية — جنبًا إلى جنب مع فئات نماذج متنوعة باستخدام مُحسّنات ومتعقبات نموذج متقدمة. عند تطبيقها على ثلاث حالات عملية في العالم الحقيقي، تتفوق ritme على خطوط الأنابيب الأصلية والدلائل العامة لـ AutoML. كما توفر للباحثين رؤى حول كيفية تأثير خيارات الميزات والنماذج على الأداء التنبؤي. معًا، تؤسس هذه النتائج ritme كإطار عمل معياري لتحديد تركيبات الميزات والنماذج المثلى من بيانات التسلسل ذات الإنتاجية العالية. ritme هي حزمة بايثون مفتوحة المصدر متاحة على https://github.com/adamovanja/ritme.
Building similarity graph...
Analyzing shared references across papers
Loading...
Add This Paper to Your Research Feed
Any time a new paper drops it will be there.
أدى آدموف وآخرون (يوم الثلاثاء) دراسة هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: