La detección de objetos alimenticios ha surgido como un área de investigación crítica en la intersección de la visión por computadora y la informática nutricional. Este documento presenta un estudio integral sobre la aplicación de modelos YOLO (You Only Look Once) para el reconocimiento y clasificación en tiempo real de alimentos. La detección precisa de alimentos es fundamental para la estimación de calorías, el seguimiento dietético y las aplicaciones de cocina inteligente. Investigamos la evolución de YOLOv1 a YOLOv8, analizando mejoras arquitectónicas, estrategias de entrenamiento y compromisos de rendimiento en conjuntos de datos alimentarios de referencia, incluyendo FOOD-101, UEC-Food256 y un conjunto de datos anotado personalizado de cocinas indias. Los resultados experimentales demuestran que YOLOv8 logra una Precisión Media Promedio (mAP@0.5) del 91.3% en el conjunto de datos FOOD-101, manteniendo velocidades de inferencia en tiempo real de 42 FPS en hardware GPU estándar. El estudio explora además el aprendizaje por transferencia, la augmentación de datos y la optimización de cajas de anclaje como técnicas para mejorar la precisión de detección en diversas categorías de alimentos. Nuestros hallazgos sugieren que las arquitecturas basadas en YOLO son adecuadas para su implementación en entornos móviles y de computación en el borde para aplicaciones de evaluación dietética.
Machindra K. Gaikwad (Jue,) estudió esta cuestión.