mplotmo.ipynb 12.6 KB
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "링크 유형이 http://www.playdb.co.kr/playdb/PlaydbDetail.asp?sReqPlayNo=146154 였는데 \n",
    "모바일로 변환해야 하기 때문에 뒤에 숫자만 떼어서 \"http://m.playdb.co.kr/Play/Info/\" 뒤에 붙일 것.\n",
    "    \n",
    "url = \"http://m.playdb.co.kr/Play/Info/146154\" + playno\n",
    "\n",
    "// 여기까지 성공했고\n",
    "csv 파일로 저장할지 말지는 나중에 결정."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 58,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "import csv\n",
    "matrix=[]\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "csv에서 숫자만 빼서 matrix에 저장"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 59,
   "metadata": {
    "scrolled": false
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "['143818', '146697', '144410', '149312', '148191', '127158', '146831', '137155', '141462', '152732', '149078', '136149', '135950', '', '', '', '', '', '149232', '150369', '135993', '143609', '133753', '144125', '147848', '144130', '149458', '147727', '139426', '146398', '151099', '136105', '149041', '', '', '', '', '', '136245', '140596', '145152', '139898', '137724', '143304', '144159', '144788', '145494', '150671', '141592', '145526', '149035', '149701', '', '', '', '', '', '135845', '139711', '141886', '150121', '147531', '148633', '139826', '143750', '149930', '134077', '145223', '146150', '147222', '151181', '', '', '', '', '', '142779', '140394', '141712', '134281', '135981', '146112', '146186', '148376', '148378', '151720', '137672', '139357', '139585', '143246', '', '', '', '', '', '151283', '136692', '140243', '144791', '145843', '148936', '133812', '144870', '139136', '139605', '142152', '142391', '143421', '144172', '', '', '', '', '', '145956', '147367', '141737', '143428', '143929', '147093', '150099', '151229', '151562', '136168', '137643', '139399', '139906', '', '', '', '', '', '141430', '135516', '137865', '141952', '144876', '146703', '151870', '153597', '', '', '', '', '', '135960', '137783', '139649', '139950', '142821', '148141', '149233', '149388', '151102', '131625', '136573', '137518', '137587', '139784', '', '', '', '', '', '139940', '140156', '141236', '141543', '143311', '149293', '150565', '152122', '136806', '138163', '142194', '142923', '145767', '', '', '', '', '', '147675', '148557', '148791', '149340', '149995', '152594', '135726', '137091', '137358', '138750', '138881', '138905', '', '', '', '', '']\n"
     ]
    }
   ],
   "source": [
    "with open('/Users/김서영/Desktop/temp/playdblink.csv','r') as f:\n",
    "    reader = csv.reader(f)\n",
    "    for row in reader:\n",
    "        #matrix.append(row)\n",
    "        #print(row[1])\n",
    "        #a_list = list(reader)\n",
    "        for i in range(1,200):\n",
    "            replaceAll= row[i].replace(\"http://www.playdb.co.kr/playdb/PlaydbDetail.asp?sReqPlayNo=\",\"\")\n",
    "            replace_t1 = row[i].replace(\"http://www.playdb.co.kr/playdb/PlaydbDetail.asp?sReqPlayNo=\", \"\",1)\n",
    "           # print(replace_t1)\n",
    "            matrix.append(replace_t1)\n",
    "print(matrix)\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "링크 열어서 텍스트 파일로 저장"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 40,
   "metadata": {
    "scrolled": true
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      " \n",
      "스위니토드\n",
      "\n",
      "\n",
      "\n",
      "작품설명\n",
      "\r\n",
      "        브로드웨이 초연 40주년 완성도 높은 새로운 프로덕션 뮤지컬 <스위니토드> 1979년 3월, 유리스시어터(Uris Theatre) 오리지널 브로드웨이 프로덕션 초연 이후 Drama Desk Awards, Tony Awards, Laurence Olivier Award 등 세계 유수 시상식 석권 작품성과 흥행성을 동시에 인정받은 최고의 작품! 브로드웨이 사상 가장 혁신적인 작곡가 스티븐 손드하임 ‘지킬앤하이드’, ‘맨오브라만차’, ‘드라큘라’ 등을 흥행시킨 뛰어난 감각의 프로듀서 신춘수 손드하임의 작품을 27차례 올린 '스티븐 손드하임' 뮤지컬의 대가 연출 에릭 셰퍼 창의적인 생각과 독창적인 디자인으로 주목 받는 무대 디자이너 폴 테이트 드푸 그들이 펼치는 드라마, 무대, 음악의 완벽한 결합! 그리고 캐릭터들의 심리와 스토리를 미학적으로 표현한 그로테스크한 조명 드라마 흡인력을 높이는 웅장하고 압도적인 무대연출 19세기 시대상을 반영한 파격적이고 소름 돋는 반전 스토리와 입체적인 캐릭터 턱 끝에서 느껴지는 긴장감, 들어는 봤나 스위니토드\r\n",
      "\t\t\r\n",
      "\t\n",
      "\n",
      "줄거리\n",
      "\r\n",
      "        빅토리아 여왕 시대의 런던. 영국의 귀족 문화는 정점에 달하고, 상인들이 산업혁명을 통해 더욱 부유해졌으며, 권력층은 무소불위의 힘을 휘둘렀다. 젊고 재능 있는 이발사 벤자민바커는 아내인 루시, 그리고 어린 딸 조안나와 행복하게 살고 있었지만 그의 아내를 탐한 터핀 판사에 의해 억울한 누명을 쓰고 멀리 추방을 당하게 된다. 15년 후, 벤자민바커는 스위니 토드로 이름을 바꾸고 젊은 선원인 안소니의 도움을 받아 런던으로 돌아와 복수를 계획한다. 그가 원래 살던 집의 아래층에서 파이 가게를 운영하는 러빗 부인은 조안나가 터핀 판사의 수양딸로 끌려갔다는 사실을 스위니 토드에게 전하고, 그가 다시 이발관을 열 수 있도록 돕는다. 스위니 토드의 광기 어린 복수심은 점점 인간 전체를 향해 번지고, 그의 이발소에 발을 들인 자는 살아 나가지 못한다. 러빗 부인은 파이에 정체가 묘연한 '새로운 고기'를 쓰기 시작하고, 가게는 날이 갈수록 번창하는데...\r\n",
      "\t\t\r\n",
      "\t\n",
      "\n"
     ]
    }
   ],
   "source": [
    "import urllib.request\n",
    "from bs4 import BeautifulSoup\n",
    "import pandas as pd\n",
    "\n",
    "\n",
    "url = \"http://m.playdb.co.kr/Play/Info/146154\"\n",
    "req = urllib.request.urlopen(url)\n",
    "res = req.read()\n",
    "\n",
    "soup = BeautifulSoup(res,'html.parser')\n",
    "paramcode = soup.find('div',{'class':'goods_info'})\n",
    "muname = soup.find('ul',{'class':'goods_name'})\n",
    "name = muname.get_text()\n",
    "plot = paramcode.get_text()\n",
    "print(name)\n",
    "print(plot)\n",
    "\n",
    "#텍스트 파일로 저장\n",
    "f=open(\"/Users/김서영/Desktop/temp/data/스위니토드.txt\",'w')\n",
    "f.write(name+\"\\n\")\n",
    "f.write(plot+\"\\n\")\n",
    "f.close()\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 62,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "http://m.playdb.co.kr/Play/Info/146697\n",
      "http://m.playdb.co.kr/Play/Info/144410\n",
      "http://m.playdb.co.kr/Play/Info/149312\n",
      "http://m.playdb.co.kr/Play/Info/148191\n",
      "http://m.playdb.co.kr/Play/Info/127158\n",
      "http://m.playdb.co.kr/Play/Info/146831\n",
      "http://m.playdb.co.kr/Play/Info/137155\n",
      "http://m.playdb.co.kr/Play/Info/141462\n",
      "http://m.playdb.co.kr/Play/Info/152732\n",
      "http://m.playdb.co.kr/Play/Info/149078\n",
      "http://m.playdb.co.kr/Play/Info/136149\n",
      "http://m.playdb.co.kr/Play/Info/135950\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/149232\n",
      "http://m.playdb.co.kr/Play/Info/150369\n",
      "http://m.playdb.co.kr/Play/Info/135993\n",
      "http://m.playdb.co.kr/Play/Info/143609\n",
      "http://m.playdb.co.kr/Play/Info/133753\n",
      "http://m.playdb.co.kr/Play/Info/144125\n",
      "http://m.playdb.co.kr/Play/Info/147848\n",
      "http://m.playdb.co.kr/Play/Info/144130\n",
      "http://m.playdb.co.kr/Play/Info/149458\n",
      "http://m.playdb.co.kr/Play/Info/147727\n",
      "http://m.playdb.co.kr/Play/Info/139426\n",
      "http://m.playdb.co.kr/Play/Info/146398\n",
      "http://m.playdb.co.kr/Play/Info/151099\n",
      "http://m.playdb.co.kr/Play/Info/136105\n",
      "http://m.playdb.co.kr/Play/Info/149041\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/136245\n",
      "http://m.playdb.co.kr/Play/Info/140596\n",
      "http://m.playdb.co.kr/Play/Info/145152\n",
      "http://m.playdb.co.kr/Play/Info/139898\n",
      "http://m.playdb.co.kr/Play/Info/137724\n",
      "http://m.playdb.co.kr/Play/Info/143304\n",
      "http://m.playdb.co.kr/Play/Info/144159\n",
      "http://m.playdb.co.kr/Play/Info/144788\n",
      "http://m.playdb.co.kr/Play/Info/145494\n",
      "http://m.playdb.co.kr/Play/Info/150671\n",
      "http://m.playdb.co.kr/Play/Info/141592\n",
      "http://m.playdb.co.kr/Play/Info/145526\n",
      "http://m.playdb.co.kr/Play/Info/149035\n",
      "http://m.playdb.co.kr/Play/Info/149701\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/135845\n",
      "http://m.playdb.co.kr/Play/Info/139711\n",
      "http://m.playdb.co.kr/Play/Info/141886\n",
      "http://m.playdb.co.kr/Play/Info/150121\n",
      "http://m.playdb.co.kr/Play/Info/147531\n",
      "http://m.playdb.co.kr/Play/Info/148633\n",
      "http://m.playdb.co.kr/Play/Info/139826\n",
      "http://m.playdb.co.kr/Play/Info/143750\n",
      "http://m.playdb.co.kr/Play/Info/149930\n",
      "http://m.playdb.co.kr/Play/Info/134077\n",
      "http://m.playdb.co.kr/Play/Info/145223\n",
      "http://m.playdb.co.kr/Play/Info/146150\n",
      "http://m.playdb.co.kr/Play/Info/147222\n",
      "http://m.playdb.co.kr/Play/Info/151181\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/142779\n",
      "http://m.playdb.co.kr/Play/Info/140394\n",
      "http://m.playdb.co.kr/Play/Info/141712\n",
      "http://m.playdb.co.kr/Play/Info/134281\n",
      "http://m.playdb.co.kr/Play/Info/135981\n",
      "http://m.playdb.co.kr/Play/Info/146112\n",
      "http://m.playdb.co.kr/Play/Info/146186\n",
      "http://m.playdb.co.kr/Play/Info/148376\n",
      "http://m.playdb.co.kr/Play/Info/148378\n",
      "http://m.playdb.co.kr/Play/Info/151720\n",
      "http://m.playdb.co.kr/Play/Info/137672\n",
      "http://m.playdb.co.kr/Play/Info/139357\n",
      "http://m.playdb.co.kr/Play/Info/139585\n",
      "http://m.playdb.co.kr/Play/Info/143246\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/\n",
      "http://m.playdb.co.kr/Play/Info/151283\n",
      "http://m.playdb.co.kr/Play/Info/136692\n",
      "http://m.playdb.co.kr/Play/Info/140243\n",
      "http://m.playdb.co.kr/Play/Info/144791\n",
      "http://m.playdb.co.kr/Play/Info/145843\n"
     ]
    }
   ],
   "source": [
    "import urllib.request\n",
    "from bs4 import BeautifulSoup\n",
    "\n",
    "for idnum in range(1,100):\n",
    "    url = \"http://m.playdb.co.kr/Play/Info/\"+str(matrix[idnum])\n",
    "    print(url)\n",
    "\n"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}