joanne

docs: update 0412.md

......@@ -63,6 +63,24 @@
## Metrics
### Precision & Recall
* Precision은 관련 Object만을 식별하는 능력을 나타낸다.
Precision = TP / (TP + FP) 이며, 있는 것을 있다고 예측한 것을 있든 없든 있다고 예측한 것으로 나눈 값이다.
* Recall은 모든 관련 케이스(모든 ground truth bounding boxes)를 찾는 능력을 나타낸다.
Recall = TP / (TP + FN) 이며, 있는 것을 있다고 예측한 것을 있는 것을 있다고든 없다고든 예측한 결과로 나눈 값이다.
### PR Curve
x축을 Recall, y축을 Precision으로 하여 나타낸 그래프이다. 이 그래프를 통해 object detector의 퍼포먼스를 측정할 수 있다.
## Average Precision(AP)
PR Curve 내부의 면적 값을 계산한다. 모든 Recall 값에서 평균화된 Precision을 나타내는 값이다.
## mAP
모든 클래스들에 대한 AP의 평균 값이다. . . (https://towardsdatascience.com/map-mean-average-precision-might-confuse-you-5956f1bfa9e2)
다시 확인하고 글 남기기.
## MOTA (Multiple Object Tracking Accuracy)
## R-CNN
![rcnn](./images/rcnn.png)
......@@ -135,8 +153,6 @@ FPN이 상위 피쳐맵과 하위 피쳐맵을 어떻게 합쳐주는지 알아
## Mask R-CNN
> 미팅 당일 교수님 설명 듣고 추가할 예정.
---
# About Detectron2
우선 Detectron2란 FAIR에서 파이토치를 베이스로 개발한 Object Detection & Segmentation Library이다. 고수준의 API가 아주 이용하기 쉽게 작성되어있고, 친절한 document를 제공하기 때문에 누구나 쉽게 이용할 수 있다. 하지만 좋은 API 내부에는 복잡한 구조가 있기 마련, 캡슐화가 잘 되어있기 때문에 내부를 뜯어보려면 매우 어렵다고 한다.
......@@ -144,21 +160,30 @@ FPN이 상위 피쳐맵과 하위 피쳐맵을 어떻게 합쳐주는지 알아
Detectron2는 최신의 Object Detection 알고리즘이 구현을 포함하고 있다. Fast R-CNN, Mask R-CNN을 비롯하여 여러 알고리즘들이 포함되어있다. 더불어 Modular design이기 때문에, Object Detection System의 어디든 내가 커스텀하여 갖다 붙일 수 있다. 그리고 매우 빠른 트레이닝 속도를 자랑한다.
Detectron2는 다음과 같은 모델 구조를 갖는다.
![d2](./images/detectron2.png)
![d2](./images/d2.png)
* Backbone Network
Input: Images
Output: Multi-Scaled Feature Maps
Input: Images
Output: Multi-Scaled Feature Maps
Backbone 네트워크에는 이미지들이 인풋으로 들어간다. 그리고 결과물로서는 피라미드 형태의 서로 다른 스케일을 갖는 피쳐맵을 얻을 수 있다. 백본 네트워크의 결과물로 얻어진 피쳐맵은 다음 단계인 Region Proposal Network와, ROI Heads 둘 모두의 Input으로 이용된다.
* Region Proposal Network
Input: Mutli-Scaled Feature Maps
Output: Object Regions(Region Proposals)
Input: Mutli-Scaled Feature Maps
Output: Object Regions(Region Proposals)
Region Proposal Network에서는 Multi-Scaled Feature Maps를 바탕으로 Object Region을 얻는 과정을 거친다. 해당 물체가 위치한 박스를 얻는다고 보면 될 것 같다. 이 단계에서 얻은 결과는 ROI Heads의 Input으로도 이용된다.
* ROI Heads
Input: Multi-Scaled Feature Maps, Region Proposals
Output: Box
Input: Multi-Scaled Feature Maps, Region Proposals
Output: Box
RPN과 매우 유사하지만 더 fine-tuned 된 박스를 얻어내는 과정이다.
![d2_detail](./images/d2_detail.png)
......