Untitled.ipynb
2.27 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"TEST할것\n",
"<입력값>\n",
"1. 일정 데시벨파워 이하는 다 지운 멜스펙토그램 <-아... 원래 데이터셋 새소리 어느정도 작은 소리까지 잡는겨\n",
"2. mel filter 80 & axis=1평균을 뺀 멜스펙토그램\n",
"3. 새소리 주파수 이하는 주파수대는 짜름\n",
"5. 커널씩 보면서 차이나는것만 뽑아내기 (그주변만 비교하는게 있을거같은데)\n",
"6. 멜필터 안씌운거 보고 새소리 주파수 이하 짤라버릴때등.. 안씌운거 보기\n",
"\n",
"<모델>\n",
"1. 일반 뛰어난 CNN모델. 첫번째 모델이 왜 더 좋은지 보자\n",
"3. C+RNN <- RNN 부분 잘 된건가?\n",
"4. Capsul network\n",
"\n",
"<추가적>\n",
"1. 라벨링 : 확실히 귀에 잘 들리고 눈에 잘 보이는 애들만 1로 라벨링, 희미한건 0으로 라벨링 \n",
" -> 필드테스트 한 애들만 맞춘거 비율이 높도록 보이기. 머신이 새라고 한거중에 0인애들만 또 보여주기\n",
"2. 필드테스트랑 원래하던거랑 왜안될까? -> 짹짹이가 데이터셋에 별로없거나 모델이 안좋거나.. (먼저 컴한테 분류시켜보고 판단?)\n",
"3. 그경우, 찌르레기 소리에 초점을 맞춰서 저 패턴을 학습시키고 아예 그걸 찾도록 하는것도 나쁘지 않을듯\n",
"4. 아이폰녹음이랑 뭐가다른지, 실제로 차이가 난건지도 봐야함. "
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"1. CRNN - RNN 코드 다시 보고 돌리기\n",
"2. CNN - 논문1네 모델 돌리기\n",
"3. 캡슐 네트워크 돌리기\n",
"\n",
"#### scipy / librosa 둘다로 mel spectogram 짜봤는데 librosa가 더 좋았음."
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.5"
}
},
"nbformat": 4,
"nbformat_minor": 2
}