반응형
⭐ MOT 챌린지란 Multiple object tracking 벤치마크이다. MOT dataset으로는 현재까지 MOT15, MOT16, MOT17, MOT20 이 나와있다. 본 포스팅에서 다룰 내용은 MOT16 데이터셋이다. MOT16을 활용하여 2D object detection을 진행하기 위해서 알아야하는 데이터셋의 기본적인 내용들을 정리했다.
MOT16 Dataset
1. 다운로드 받는 방법
- 아래의 링크로 접속하여 MOT16 dataset 페이지로 이동하자.
- https://motchallenge.net/data/MOT16/
- 아래로 내리다보면 download가 나온다. 로그인을 해야 다운로드 받을 수 있으므로 로그인 한다.
- Get all data 버튼을 클릭하면 다운로드가 시작된다.
2. Dataset 살펴보기
- 다운로드 받은 파일의 압축을 풀면 다음과 같이 된 것을 볼 수 있다.
/test
/MOT16-01
/det
det.txt
/img1
000001.jpg
....
seqinfo.ini
/MOT16-03
/...
/train
/MOT16-02
/det
det.txt
/gt
gt.txt
/img1
000001.jpg
....
seqinfo.ini
/MOT16-04
/...
- test와 train으로 폴더가 나뉘어 있다. train에만 gt (ground truth )폴더가 있다.
- img 폴더 내에는 jpg 이미지가 들어있다.
- seqinfo.ini 에는 이미지에 대한 기본적인 정보가 들어있는 파일이다.
[Sequence]
name=MOT16-02
imDir=img1
frameRate=30
seqLength=600
imWidth=1920
imHeight=1080
imExt=.jpg
- gt폴더 안에는 ground truth 정보가 들어있다. gt.txt 의 일부분을 살펴보자.
1,1,912,484,97,109,0,7,1
2,1,912,484,97,109,0,7,1
- 1번 frame에 id값 1을 부여 받은 static person(class label: 7)이 left = 912, top = 484, w = 97, h=109라는 의미이다.아래는 gt.txt의 일부분이다.
- bounding box는 1-based bounding box이다. 즉 왼쪽-위가 (1,1) 좌표라는 의미이다.
- 따라서 left, top, width, height의 값을 left, top, right, bottom으로 바꾸어주어야한다면 bottom의 값은 top+height 를 해주어야 한다.
- class label : class가 나타내는 숫자는 아래의 label에 해당한다.
반응형