Key points are not available for this paper at this time.
إن رقمنة بيانات التنوع البيولوجي تؤدي إلى التطبيق الواسع لأسماء الأنواع التي تعتبر زائدة أو غامضة أو غير صحيحة، مما يؤدي إلى سجلات غير متطابقة وأعداد مبالغ فيها من الأنواع. العواقب النهائية للأسماء المكتوبة بشكل خاطئ وعلم التصنيف السيء هي استنتاجات علمية خاطئة وقرارات سياسة معيبة. إن عدم وجود أدوات لتصحيح هذه "مشكلة الأسماء" أصبح عقبة أساسية أمام دمج مصادر البيانات المتباينة وتقدم علم التنوع البيولوجي. إن خدمة حل الأسماء الضريبية (TNRS) هي تطبيق عبر الإنترنت من أجل توحيد الأسماء العلمية للنباتات بشكل آلي وتحت إشراف المستخدم. يعتمد TNRS على التطبيقات مفتوحة المصدر الحالية لفرز الأسماء والمطابقة الضبابية ويوسعها. يتم توحيد الأسماء بناءً على عدة تصنيفات مرجعية، بما في ذلك قاعدة بيانات تروبيكوس الخاصة بحديقة ميزوري النباتية. قادر على معالجة آلاف الأسماء في عملية واحدة، يقوم TNRS بفرز وتصحيح الأسماء والسلطات المكتوبة بشكل خاطئ، ويوحد أوجه الاختلاف في الكتابة، ويحول المرادفات التسمية إلى أسماء مقبولة. يمكن تضمين أسماء العائلات لزيادة دقة المطابقة وحل العديد من أنواع الأسماء المتجانسة. يسمح المطابقة الجزئية للأنواع العليا مع استخراج التعليقات، وأرقام الدخول والأشكال المتنوعة لـ TNRS بتوحيد التصنيف عبر مجموعة واسعة من مجموعات البيانات النشطة والتاريخية. نعرض كيف يمكن لـ TNRS حل العديد من أشكال التباين الدلالي في التصنيف، وتصحيح الأخطاء الإملائية وإزالة الأسماء الزائفة. نتيجة لذلك، يمكن لـ TNRS أن يساعد في دمج مجموعات البيانات البيولوجية المتباينة. على الرغم من أن TNRS تم تطويره للمساعدة في توحيد أسماء النباتات، إلا أن خوارزمياته وتصميمه الأساسية يمكن توسيعها لتشمل جميع الكائنات الحية وأكواد التسمية. يمكن الوصول إلى TNRS من خلال واجهة ويب على http://tnrs.iplantcollaborative.org/ وكخدمة ويب RESTful وواجهة برمجة تطبيقات. يتوفر رمز المصدر على https://github.com/iPlantCollaborativeOpenSource/TNRS/.
درس بويل وزملاؤه (الأربعاء) هذا السؤال.