joanne

docs: update 0412.md

...@@ -63,6 +63,24 @@ ...@@ -63,6 +63,24 @@
63 63
64 ## Metrics 64 ## Metrics
65 65
66 +### Precision & Recall
67 +* Precision은 관련 Object만을 식별하는 능력을 나타낸다.
68 +Precision = TP / (TP + FP) 이며, 있는 것을 있다고 예측한 것을 있든 없든 있다고 예측한 것으로 나눈 값이다.
69 +* Recall은 모든 관련 케이스(모든 ground truth bounding boxes)를 찾는 능력을 나타낸다.
70 +Recall = TP / (TP + FN) 이며, 있는 것을 있다고 예측한 것을 있는 것을 있다고든 없다고든 예측한 결과로 나눈 값이다.
71 +
72 +### PR Curve
73 +x축을 Recall, y축을 Precision으로 하여 나타낸 그래프이다. 이 그래프를 통해 object detector의 퍼포먼스를 측정할 수 있다.
74 +
75 +## Average Precision(AP)
76 +PR Curve 내부의 면적 값을 계산한다. 모든 Recall 값에서 평균화된 Precision을 나타내는 값이다.
77 +
78 +## mAP
79 +모든 클래스들에 대한 AP의 평균 값이다. . . (https://towardsdatascience.com/map-mean-average-precision-might-confuse-you-5956f1bfa9e2)
80 +다시 확인하고 글 남기기.
81 +
82 +## MOTA (Multiple Object Tracking Accuracy)
83 +
66 ## R-CNN 84 ## R-CNN
67 ![rcnn](./images/rcnn.png) 85 ![rcnn](./images/rcnn.png)
68 86
...@@ -135,8 +153,6 @@ FPN이 상위 피쳐맵과 하위 피쳐맵을 어떻게 합쳐주는지 알아 ...@@ -135,8 +153,6 @@ FPN이 상위 피쳐맵과 하위 피쳐맵을 어떻게 합쳐주는지 알아
135 ## Mask R-CNN 153 ## Mask R-CNN
136 > 미팅 당일 교수님 설명 듣고 추가할 예정. 154 > 미팅 당일 교수님 설명 듣고 추가할 예정.
137 155
138 ----
139 -
140 # About Detectron2 156 # About Detectron2
141 157
142 우선 Detectron2란 FAIR에서 파이토치를 베이스로 개발한 Object Detection & Segmentation Library이다. 고수준의 API가 아주 이용하기 쉽게 작성되어있고, 친절한 document를 제공하기 때문에 누구나 쉽게 이용할 수 있다. 하지만 좋은 API 내부에는 복잡한 구조가 있기 마련, 캡슐화가 잘 되어있기 때문에 내부를 뜯어보려면 매우 어렵다고 한다. 158 우선 Detectron2란 FAIR에서 파이토치를 베이스로 개발한 Object Detection & Segmentation Library이다. 고수준의 API가 아주 이용하기 쉽게 작성되어있고, 친절한 document를 제공하기 때문에 누구나 쉽게 이용할 수 있다. 하지만 좋은 API 내부에는 복잡한 구조가 있기 마련, 캡슐화가 잘 되어있기 때문에 내부를 뜯어보려면 매우 어렵다고 한다.
...@@ -144,21 +160,30 @@ FPN이 상위 피쳐맵과 하위 피쳐맵을 어떻게 합쳐주는지 알아 ...@@ -144,21 +160,30 @@ FPN이 상위 피쳐맵과 하위 피쳐맵을 어떻게 합쳐주는지 알아
144 Detectron2는 최신의 Object Detection 알고리즘이 구현을 포함하고 있다. Fast R-CNN, Mask R-CNN을 비롯하여 여러 알고리즘들이 포함되어있다. 더불어 Modular design이기 때문에, Object Detection System의 어디든 내가 커스텀하여 갖다 붙일 수 있다. 그리고 매우 빠른 트레이닝 속도를 자랑한다. 160 Detectron2는 최신의 Object Detection 알고리즘이 구현을 포함하고 있다. Fast R-CNN, Mask R-CNN을 비롯하여 여러 알고리즘들이 포함되어있다. 더불어 Modular design이기 때문에, Object Detection System의 어디든 내가 커스텀하여 갖다 붙일 수 있다. 그리고 매우 빠른 트레이닝 속도를 자랑한다.
145 161
146 Detectron2는 다음과 같은 모델 구조를 갖는다. 162 Detectron2는 다음과 같은 모델 구조를 갖는다.
147 -![d2](./images/detectron2.png) 163 +![d2](./images/d2.png)
148 164
149 * Backbone Network 165 * Backbone Network
150 - Input: Images 166 +
151 - Output: Multi-Scaled Feature Maps 167 +Input: Images
168 +
169 +Output: Multi-Scaled Feature Maps
170 +
152 Backbone 네트워크에는 이미지들이 인풋으로 들어간다. 그리고 결과물로서는 피라미드 형태의 서로 다른 스케일을 갖는 피쳐맵을 얻을 수 있다. 백본 네트워크의 결과물로 얻어진 피쳐맵은 다음 단계인 Region Proposal Network와, ROI Heads 둘 모두의 Input으로 이용된다. 171 Backbone 네트워크에는 이미지들이 인풋으로 들어간다. 그리고 결과물로서는 피라미드 형태의 서로 다른 스케일을 갖는 피쳐맵을 얻을 수 있다. 백본 네트워크의 결과물로 얻어진 피쳐맵은 다음 단계인 Region Proposal Network와, ROI Heads 둘 모두의 Input으로 이용된다.
153 172
154 * Region Proposal Network 173 * Region Proposal Network
155 - Input: Mutli-Scaled Feature Maps 174 +
156 - Output: Object Regions(Region Proposals) 175 +Input: Mutli-Scaled Feature Maps
176 +
177 +Output: Object Regions(Region Proposals)
178 +
157 Region Proposal Network에서는 Multi-Scaled Feature Maps를 바탕으로 Object Region을 얻는 과정을 거친다. 해당 물체가 위치한 박스를 얻는다고 보면 될 것 같다. 이 단계에서 얻은 결과는 ROI Heads의 Input으로도 이용된다. 179 Region Proposal Network에서는 Multi-Scaled Feature Maps를 바탕으로 Object Region을 얻는 과정을 거친다. 해당 물체가 위치한 박스를 얻는다고 보면 될 것 같다. 이 단계에서 얻은 결과는 ROI Heads의 Input으로도 이용된다.
158 180
159 * ROI Heads 181 * ROI Heads
160 - Input: Multi-Scaled Feature Maps, Region Proposals 182 +
161 - Output: Box 183 +Input: Multi-Scaled Feature Maps, Region Proposals
184 +
185 +Output: Box
186 +
162 RPN과 매우 유사하지만 더 fine-tuned 된 박스를 얻어내는 과정이다. 187 RPN과 매우 유사하지만 더 fine-tuned 된 박스를 얻어내는 과정이다.
163 188
164 ![d2_detail](./images/d2_detail.png) 189 ![d2_detail](./images/d2_detail.png)
......