Key points are not available for this paper at this time.
بينما توفر العديد من قواعد البيانات الكبيرة المتاحة للجمهور تعليقات ممتازة للجزيئات الحيوية الكبيرة، فإن نفس الشيء لا ينطبق على المركبات الكيميائية الصغيرة. كما أن المصادر التجارية للبيانات تفشل في توفير واجهة تعليق للعديد من المركبات و تميل إلى كونها مكلفة للغاية لتكون متاحة على نطاق واسع للباحثين في المجال الطبي الحيوي. لذلك، فإن استخدام معلومات التعليق لاختيار المركبات الرائدة من حملة الفحص عالي الإنتاجية الحديثة يحدث حاليًا فقط على نطاق محدود جدًا. يوفر التوسع السريع الأخير في قاعدة بيانات NIH PubChem فرصة لربط قواعد البيانات البيولوجية الموجودة مع كتالوجات المركبات ويوفر معلومات ذات صلة قد تحسن المعلومات المستمدة من جهود الفحص على نطاق واسع. باستخدام مجموعة مركبات تضم 2.5 مليون مركب في معهد الجينوم التابع لمؤسسة أبحاث نوفارتس (GNF) كنموذج، حددنا أن حوالي 4٪ من المكتبة تحتوي على مركبات لها تعليقات محتملة في قواعد بيانات مثل PubChem وفهرس الأدوية العالمي (WDI) وكذلك قواعد بيانات ذات صلة مثل موسوعة كيوتو للجينات والجينومات (KEGG) وChemIDplus. علاوة على ذلك، أظهرت تحليل المطابقة الدقيقة للهيكل أن 32٪ من مركبات GNF يمكن ربطها بقواعد بيانات الطرف الثالث عبر PubChem. كما أظهرنا أن التعليقات مثل مصطلحات MeSH (عناوين الموضوع الطبي) يمكن تطبيقها على قواعد بيانات HTS الداخلية في تحديد ملفات التثبيط البيولوجية المميزة ذات الصلة بالإضافة إلى تسريع عملية التحقق من التجارب. إن التعليق المؤتمت لآلاف الاكتشافات في الفحص على دفعات أصبح ممكنًا وله القدرة على اللعب دور أساسي في عملية اتخاذ القرار من الاكتشاف إلى القيادة.
درس Zhou et al. (Sun) هذا السؤال.