mplotmo.ipynb
12.6 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"링크 유형이 http://www.playdb.co.kr/playdb/PlaydbDetail.asp?sReqPlayNo=146154 였는데 \n",
"모바일로 변환해야 하기 때문에 뒤에 숫자만 떼어서 \"http://m.playdb.co.kr/Play/Info/\" 뒤에 붙일 것.\n",
" \n",
"url = \"http://m.playdb.co.kr/Play/Info/146154\" + playno\n",
"\n",
"// 여기까지 성공했고\n",
"csv 파일로 저장할지 말지는 나중에 결정."
]
},
{
"cell_type": "code",
"execution_count": 58,
"metadata": {},
"outputs": [],
"source": [
"import pandas as pd\n",
"import csv\n",
"matrix=[]\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"csv에서 숫자만 빼서 matrix에 저장"
]
},
{
"cell_type": "code",
"execution_count": 59,
"metadata": {
"scrolled": false
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"['143818', '146697', '144410', '149312', '148191', '127158', '146831', '137155', '141462', '152732', '149078', '136149', '135950', '', '', '', '', '', '149232', '150369', '135993', '143609', '133753', '144125', '147848', '144130', '149458', '147727', '139426', '146398', '151099', '136105', '149041', '', '', '', '', '', '136245', '140596', '145152', '139898', '137724', '143304', '144159', '144788', '145494', '150671', '141592', '145526', '149035', '149701', '', '', '', '', '', '135845', '139711', '141886', '150121', '147531', '148633', '139826', '143750', '149930', '134077', '145223', '146150', '147222', '151181', '', '', '', '', '', '142779', '140394', '141712', '134281', '135981', '146112', '146186', '148376', '148378', '151720', '137672', '139357', '139585', '143246', '', '', '', '', '', '151283', '136692', '140243', '144791', '145843', '148936', '133812', '144870', '139136', '139605', '142152', '142391', '143421', '144172', '', '', '', '', '', '145956', '147367', '141737', '143428', '143929', '147093', '150099', '151229', '151562', '136168', '137643', '139399', '139906', '', '', '', '', '', '141430', '135516', '137865', '141952', '144876', '146703', '151870', '153597', '', '', '', '', '', '135960', '137783', '139649', '139950', '142821', '148141', '149233', '149388', '151102', '131625', '136573', '137518', '137587', '139784', '', '', '', '', '', '139940', '140156', '141236', '141543', '143311', '149293', '150565', '152122', '136806', '138163', '142194', '142923', '145767', '', '', '', '', '', '147675', '148557', '148791', '149340', '149995', '152594', '135726', '137091', '137358', '138750', '138881', '138905', '', '', '', '', '']\n"
]
}
],
"source": [
"with open('/Users/김서영/Desktop/temp/playdblink.csv','r') as f:\n",
" reader = csv.reader(f)\n",
" for row in reader:\n",
" #matrix.append(row)\n",
" #print(row[1])\n",
" #a_list = list(reader)\n",
" for i in range(1,200):\n",
" replaceAll= row[i].replace(\"http://www.playdb.co.kr/playdb/PlaydbDetail.asp?sReqPlayNo=\",\"\")\n",
" replace_t1 = row[i].replace(\"http://www.playdb.co.kr/playdb/PlaydbDetail.asp?sReqPlayNo=\", \"\",1)\n",
" # print(replace_t1)\n",
" matrix.append(replace_t1)\n",
"print(matrix)\n"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"링크 열어서 텍스트 파일로 저장"
]
},
{
"cell_type": "code",
"execution_count": 40,
"metadata": {
"scrolled": true
},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
" \n",
"스위니토드\n",
"\n",
"\n",
"\n",
"작품설명\n",
"\r\n",
" 브로드웨이 초연 40주년 완성도 높은 새로운 프로덕션 뮤지컬 <스위니토드> 1979년 3월, 유리스시어터(Uris Theatre) 오리지널 브로드웨이 프로덕션 초연 이후 Drama Desk Awards, Tony Awards, Laurence Olivier Award 등 세계 유수 시상식 석권 작품성과 흥행성을 동시에 인정받은 최고의 작품! 브로드웨이 사상 가장 혁신적인 작곡가 스티븐 손드하임 ‘지킬앤하이드’, ‘맨오브라만차’, ‘드라큘라’ 등을 흥행시킨 뛰어난 감각의 프로듀서 신춘수 손드하임의 작품을 27차례 올린 '스티븐 손드하임' 뮤지컬의 대가 연출 에릭 셰퍼 창의적인 생각과 독창적인 디자인으로 주목 받는 무대 디자이너 폴 테이트 드푸 그들이 펼치는 드라마, 무대, 음악의 완벽한 결합! 그리고 캐릭터들의 심리와 스토리를 미학적으로 표현한 그로테스크한 조명 드라마 흡인력을 높이는 웅장하고 압도적인 무대연출 19세기 시대상을 반영한 파격적이고 소름 돋는 반전 스토리와 입체적인 캐릭터 턱 끝에서 느껴지는 긴장감, 들어는 봤나 스위니토드\r\n",
"\t\t\r\n",
"\t\n",
"\n",
"줄거리\n",
"\r\n",
" 빅토리아 여왕 시대의 런던. 영국의 귀족 문화는 정점에 달하고, 상인들이 산업혁명을 통해 더욱 부유해졌으며, 권력층은 무소불위의 힘을 휘둘렀다. 젊고 재능 있는 이발사 벤자민바커는 아내인 루시, 그리고 어린 딸 조안나와 행복하게 살고 있었지만 그의 아내를 탐한 터핀 판사에 의해 억울한 누명을 쓰고 멀리 추방을 당하게 된다. 15년 후, 벤자민바커는 스위니 토드로 이름을 바꾸고 젊은 선원인 안소니의 도움을 받아 런던으로 돌아와 복수를 계획한다. 그가 원래 살던 집의 아래층에서 파이 가게를 운영하는 러빗 부인은 조안나가 터핀 판사의 수양딸로 끌려갔다는 사실을 스위니 토드에게 전하고, 그가 다시 이발관을 열 수 있도록 돕는다. 스위니 토드의 광기 어린 복수심은 점점 인간 전체를 향해 번지고, 그의 이발소에 발을 들인 자는 살아 나가지 못한다. 러빗 부인은 파이에 정체가 묘연한 '새로운 고기'를 쓰기 시작하고, 가게는 날이 갈수록 번창하는데...\r\n",
"\t\t\r\n",
"\t\n",
"\n"
]
}
],
"source": [
"import urllib.request\n",
"from bs4 import BeautifulSoup\n",
"import pandas as pd\n",
"\n",
"\n",
"url = \"http://m.playdb.co.kr/Play/Info/146154\"\n",
"req = urllib.request.urlopen(url)\n",
"res = req.read()\n",
"\n",
"soup = BeautifulSoup(res,'html.parser')\n",
"paramcode = soup.find('div',{'class':'goods_info'})\n",
"muname = soup.find('ul',{'class':'goods_name'})\n",
"name = muname.get_text()\n",
"plot = paramcode.get_text()\n",
"print(name)\n",
"print(plot)\n",
"\n",
"#텍스트 파일로 저장\n",
"f=open(\"/Users/김서영/Desktop/temp/data/스위니토드.txt\",'w')\n",
"f.write(name+\"\\n\")\n",
"f.write(plot+\"\\n\")\n",
"f.close()\n"
]
},
{
"cell_type": "code",
"execution_count": 62,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"http://m.playdb.co.kr/Play/Info/146697\n",
"http://m.playdb.co.kr/Play/Info/144410\n",
"http://m.playdb.co.kr/Play/Info/149312\n",
"http://m.playdb.co.kr/Play/Info/148191\n",
"http://m.playdb.co.kr/Play/Info/127158\n",
"http://m.playdb.co.kr/Play/Info/146831\n",
"http://m.playdb.co.kr/Play/Info/137155\n",
"http://m.playdb.co.kr/Play/Info/141462\n",
"http://m.playdb.co.kr/Play/Info/152732\n",
"http://m.playdb.co.kr/Play/Info/149078\n",
"http://m.playdb.co.kr/Play/Info/136149\n",
"http://m.playdb.co.kr/Play/Info/135950\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/149232\n",
"http://m.playdb.co.kr/Play/Info/150369\n",
"http://m.playdb.co.kr/Play/Info/135993\n",
"http://m.playdb.co.kr/Play/Info/143609\n",
"http://m.playdb.co.kr/Play/Info/133753\n",
"http://m.playdb.co.kr/Play/Info/144125\n",
"http://m.playdb.co.kr/Play/Info/147848\n",
"http://m.playdb.co.kr/Play/Info/144130\n",
"http://m.playdb.co.kr/Play/Info/149458\n",
"http://m.playdb.co.kr/Play/Info/147727\n",
"http://m.playdb.co.kr/Play/Info/139426\n",
"http://m.playdb.co.kr/Play/Info/146398\n",
"http://m.playdb.co.kr/Play/Info/151099\n",
"http://m.playdb.co.kr/Play/Info/136105\n",
"http://m.playdb.co.kr/Play/Info/149041\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/136245\n",
"http://m.playdb.co.kr/Play/Info/140596\n",
"http://m.playdb.co.kr/Play/Info/145152\n",
"http://m.playdb.co.kr/Play/Info/139898\n",
"http://m.playdb.co.kr/Play/Info/137724\n",
"http://m.playdb.co.kr/Play/Info/143304\n",
"http://m.playdb.co.kr/Play/Info/144159\n",
"http://m.playdb.co.kr/Play/Info/144788\n",
"http://m.playdb.co.kr/Play/Info/145494\n",
"http://m.playdb.co.kr/Play/Info/150671\n",
"http://m.playdb.co.kr/Play/Info/141592\n",
"http://m.playdb.co.kr/Play/Info/145526\n",
"http://m.playdb.co.kr/Play/Info/149035\n",
"http://m.playdb.co.kr/Play/Info/149701\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/135845\n",
"http://m.playdb.co.kr/Play/Info/139711\n",
"http://m.playdb.co.kr/Play/Info/141886\n",
"http://m.playdb.co.kr/Play/Info/150121\n",
"http://m.playdb.co.kr/Play/Info/147531\n",
"http://m.playdb.co.kr/Play/Info/148633\n",
"http://m.playdb.co.kr/Play/Info/139826\n",
"http://m.playdb.co.kr/Play/Info/143750\n",
"http://m.playdb.co.kr/Play/Info/149930\n",
"http://m.playdb.co.kr/Play/Info/134077\n",
"http://m.playdb.co.kr/Play/Info/145223\n",
"http://m.playdb.co.kr/Play/Info/146150\n",
"http://m.playdb.co.kr/Play/Info/147222\n",
"http://m.playdb.co.kr/Play/Info/151181\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/142779\n",
"http://m.playdb.co.kr/Play/Info/140394\n",
"http://m.playdb.co.kr/Play/Info/141712\n",
"http://m.playdb.co.kr/Play/Info/134281\n",
"http://m.playdb.co.kr/Play/Info/135981\n",
"http://m.playdb.co.kr/Play/Info/146112\n",
"http://m.playdb.co.kr/Play/Info/146186\n",
"http://m.playdb.co.kr/Play/Info/148376\n",
"http://m.playdb.co.kr/Play/Info/148378\n",
"http://m.playdb.co.kr/Play/Info/151720\n",
"http://m.playdb.co.kr/Play/Info/137672\n",
"http://m.playdb.co.kr/Play/Info/139357\n",
"http://m.playdb.co.kr/Play/Info/139585\n",
"http://m.playdb.co.kr/Play/Info/143246\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/\n",
"http://m.playdb.co.kr/Play/Info/151283\n",
"http://m.playdb.co.kr/Play/Info/136692\n",
"http://m.playdb.co.kr/Play/Info/140243\n",
"http://m.playdb.co.kr/Play/Info/144791\n",
"http://m.playdb.co.kr/Play/Info/145843\n"
]
}
],
"source": [
"import urllib.request\n",
"from bs4 import BeautifulSoup\n",
"\n",
"for idnum in range(1,100):\n",
" url = \"http://m.playdb.co.kr/Play/Info/\"+str(matrix[idnum])\n",
" print(url)\n",
"\n"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.6"
}
},
"nbformat": 4,
"nbformat_minor": 4
}