What question did this study set out to answer?

목표는 혁신적인 기술을 통해 이전 YOLO 버전을 초월하는 고급 객체 탐지기로 YOLOX를 제시하는 것입니다.

July 18, 2021Open Access

YOLOX: 2021년 YOLO 시리즈를 초월하다

Key Points

목표는 혁신적인 기술을 통해 이전 YOLO 버전을 초월하는 고급 객체 탐지기로 YOLOX를 제시하는 것입니다.
앵커 기반 탐지를 앵커 없는 설계로 대체하였습니다.
디커플 머리와 SimOTA와 같은 고급 탐지 기술을 구현하였습니다.
여러 모델 크기에서 COCO 데이터셋의 성능을 평가하였습니다.
YOLO-Nano는 COCO에서 25.3% AP를 달성하여 NanoDet를 1.8% AP 초과하였습니다.
YOLOv3는 COCO에서 47.3% AP로 향상되어 기존의 최상의 방법을 3.0% AP 초과하였습니다.
YOLOX-L은 Tesla V100에서 68.9 FPS로 COCO에서 50.0% AP에 도달하여 YOLOv5-L을 1.8% AP 초과하였습니다.

Abstract

이 보고서에서는 YOLO 시리즈의 몇 가지 경험적인 개선점을 소개하며, 새로운 고성능 검출기인 YOLOX를 형성합니다. 우리는 YOLO 검출기를 앵커 없는 방식으로 전환하고, 분리된 헤드 및 선도적인 레이블 할당 전략인 SimOTA와 같은 고급 검출 기술을 수행하여 다양한 모델에서 최첨단 결과를 달성합니다: 0.91M 파라미터와 1.08G FLOPs만을 가진 YOLO-Nano의 경우, COCO에서 25.3% AP를 달성하여 NanoDet보다 1.8% AP를 초과합니다; 업계에서 가장 널리 사용되는 검출기 중 하나인 YOLOv3의 경우, COCO에서 47.3% AP로 향상시켜 현재의 최상 관행을 3.0% AP 초과합니다; 약 YOLOv4-CSP, YOLOv5-L과 동일한 파라미터를 가진 YOLOX-L의 경우, Tesla V100에서 초당 68.9 FPS 속도로 COCO에서 50.0% AP를 달성하며 YOLOv5-L을 1.8% AP 초과합니다. 더 나아가, 우리는 CVPR 2021에서 자율 주행 워크숍인 Streaming Perception Challenge에서 단일 YOLOX-L 모델을 사용하여 1위에 오르는 쾌거를 이루었습니다. 이 보고서가 개발자와 연구자들에게 실용적인 장면에서 유용한 경험을 제공할 수 있기를 바라며, ONNX, TensorRT, NCNN 및 Openvino를 지원하는 배포 버전도 제공합니다. 소스 코드는 https://github.com/Megvii-BaseDetection/YOLOX에 있습니다.

AI에게 질문

Bookmark

View Full Paper