20200413.md 1.27 KB

토의 기록 - 2020-04-13 [13:00~15:00]

내용

  • 결정된 사항
    • Text Detection시, 글자단위가 아닌 단어, 문장 단위로 Crop하여 ML모델 예측 시행
    • SVHN 데이터 셋 이용하여, 가변길이 Text Image 인식
    • 카메라영상 프레임 조절을 통해서 Process 부하 해소 결정
  • 요구사항
    • Text Detection시 윤곽선을 둘러싼 Box크기 문제 : 크기를 작게하면 잡음이 지나치게 발생. 잡음 해소 방안 마련 필요.
    • Text Crop Image 현재 수준, 20장중 19장 노이즈수치. 1/20비율로 제대로된 이미지 반환. Crop의 정확률이 너무 낮음
    • SVHN 데이터셋 파이썬호환문제
    • Depth Detection : 하나의 카메라모듈로는 구현이 힘듦. 바닥의 타일 개수를 통해 Object와의 거리 측정 시도.
    • 현재 한 프레임당 Crop이미지 적중률이 12~20%. Noise가 약 80%. 보다 정확한 Crop기준 마련 필요
  • 역할 분담
    • 공통 : 프레임 조정문제, Latency-Accuracy 상관관계 분석, SVHN 실행환경 구축
    • 이재빈 : Text 인식 정형화 - Crop Rectangle width-height 비율 결정, Text Detection Noise 해소 방안 강구
    • 김명현 : SVHN 기반 Text인식 모델링, 가변길이 이미지 평가모델 확립