Untitled.ipynb 2.27 KB
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "TEST할것\n",
    "<입력값>\n",
    "1. 일정 데시벨파워 이하는 다 지운 멜스펙토그램 <-아... 원래 데이터셋 새소리 어느정도 작은 소리까지 잡는겨\n",
    "2. mel filter 80 & axis=1평균을 뺀 멜스펙토그램\n",
    "3. 새소리 주파수 이하는 주파수대는 짜름\n",
    "5. 커널씩 보면서 차이나는것만 뽑아내기 (그주변만 비교하는게 있을거같은데)\n",
    "6. 멜필터 안씌운거 보고 새소리 주파수 이하 짤라버릴때등.. 안씌운거 보기\n",
    "\n",
    "<모델>\n",
    "1. 일반 뛰어난 CNN모델. 첫번째 모델이 왜 더 좋은지 보자\n",
    "3. C+RNN <- RNN 부분 잘 된건가?\n",
    "4. Capsul network\n",
    "\n",
    "<추가적>\n",
    "1.  라벨링 : 확실히 귀에 잘 들리고 눈에 잘 보이는 애들만 1로 라벨링, 희미한건 0으로 라벨링 \n",
    "    -> 필드테스트 한 애들만 맞춘거 비율이 높도록 보이기. 머신이 새라고 한거중에 0인애들만 또 보여주기\n",
    "2. 필드테스트랑 원래하던거랑 왜안될까? -> 짹짹이가 데이터셋에 별로없거나 모델이 안좋거나.. (먼저 컴한테 분류시켜보고 판단?)\n",
    "3. 그경우, 찌르레기 소리에 초점을 맞춰서 저 패턴을 학습시키고 아예 그걸 찾도록 하는것도 나쁘지 않을듯\n",
    "4. 아이폰녹음이랑 뭐가다른지, 실제로 차이가 난건지도 봐야함. "
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "1. CRNN - RNN 코드 다시 보고 돌리기\n",
    "2. CNN - 논문1네 모델 돌리기\n",
    "3. 캡슐 네트워크 돌리기\n",
    "\n",
    "#### scipy / librosa 둘다로 mel spectogram 짜봤는데 librosa가 더 좋았음."
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}