반응형
⭐ MOT 챌린지란 Multiple object tracking 벤치마크이다. MOT dataset으로는 현재까지 MOT15, MOT16, MOT17, MOT20 이 나와있다. 본 포스팅에서 다룰 내용은 MOT16 데이터셋이다. MOT16을 활용하여 2D object detection을 진행하기 위해서 알아야하는 데이터셋의 기본적인 내용들을 정리했다.
MOT Challenge
In the recent past, the computer vision community has relied on several centralized benchmarks for performance evaluation of numerous tasks including object detection, pedestrian detection, 3D reconstruction, optical flow, single-object short-term tracking
motchallenge.net
MOT16 Dataset
1. 다운로드 받는 방법
- 아래의 링크로 접속하여 MOT16 dataset 페이지로 이동하자.
- https://motchallenge.net/data/MOT16/
- 아래로 내리다보면 download가 나온다. 로그인을 해야 다운로드 받을 수 있으므로 로그인 한다.
- Get all data 버튼을 클릭하면 다운로드가 시작된다.
2. Dataset 살펴보기
- 다운로드 받은 파일의 압축을 풀면 다음과 같이 된 것을 볼 수 있다.
/test
/MOT16-01
/det
det.txt
/img1
000001.jpg
....
seqinfo.ini
/MOT16-03
/...
/train
/MOT16-02
/det
det.txt
/gt
gt.txt
/img1
000001.jpg
....
seqinfo.ini
/MOT16-04
/...
- test와 train으로 폴더가 나뉘어 있다. train에만 gt (ground truth )폴더가 있다.
- img 폴더 내에는 jpg 이미지가 들어있다.
- seqinfo.ini 에는 이미지에 대한 기본적인 정보가 들어있는 파일이다.
[Sequence]
name=MOT16-02
imDir=img1
frameRate=30
seqLength=600
imWidth=1920
imHeight=1080
imExt=.jpg
- gt폴더 안에는 ground truth 정보가 들어있다. gt.txt 의 일부분을 살펴보자.
1,1,912,484,97,109,0,7,1
2,1,912,484,97,109,0,7,1
- 1번 frame에 id값 1을 부여 받은 static person(class label: 7)이 left = 912, top = 484, w = 97, h=109라는 의미이다.아래는 gt.txt의 일부분이다.
- bounding box는 1-based bounding box이다. 즉 왼쪽-위가 (1,1) 좌표라는 의미이다.
- 따라서 left, top, width, height의 값을 left, top, right, bottom으로 바꾸어주어야한다면 bottom의 값은 top+height 를 해주어야 한다.
- class label : class가 나타내는 숫자는 아래의 label에 해당한다.
반응형