Key points are not available for this paper at this time.
لقد تقدمت مصنفات النواة والانحدارات المصممة للبيانات الهيكلية، مثل التسلسلات والأشجار والرسوم البيانية، بشكل كبير في عدد من المجالات متعددة التخصصات مثل البيولوجيا الحاسوبية وتصميم الأدوية. عادةً ما يتم تصميم نوى مسبقًا لنوع البيانات التي تستغل إحصائيات الهياكل أو تستخدم نماذج توليدية احتمالية، ومن ثم يتم تعلم مصنف تمييزي بناءً على النوى عبر تحسين مقعري. ومع ذلك، أتاح هذا النهج الأنيق ذو المرحلتين أيضًا تقليل طرق النواة من التوسع إلى ملايين نقاط البيانات، واستغلال المعلومات التمييزية لتعلم تمثيلات الميزات. نقترح، structure2vec، نهج فعال وقابل للتوسع لتمثيل البيانات الهيكلية مبني على فكرة تضمين نماذج المتغيرات الكامنة في فضاءات الميزات، وتعلم مثل هذه الفضاءات باستخدام المعلومات التمييزية. من المثير للاهتمام أن structure2vec يستخرج الميزات عن طريق تنفيذ سلسلة من تعيينات الدوال بطريقة مشابهة لإجراءات استدلال النموذج الرسومي، مثل ميدان متوسط ونشر المعتقدات. في التطبيقات التي تتضمن ملايين نقاط البيانات، أظهرنا أن structure2vec يعمل بشكل أسرع مرتين، وينتج نماذج أصغر بمقدار 10,000 مرة، بينما يحقق في نفس الوقت أداءً تنبؤيًا يعتبر الأفضل في مجاله.
درس داي وزملاؤه (يوم الخميس) هذا السؤال.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: