양지수

hannanum delte number_x

No preview for this file type
No preview for this file type
No preview for this file type
No preview for this file type
......@@ -9,7 +9,10 @@ import pandas as pd
#okt = Okt()
hannanum = Hannanum()
#filename= input("분석할 파일이름 입력:") #파일명
kfile=openpyxl.load_workbook('C:/Users/yangj/PycharmProjects/pythonProject1/고려아연2월.xlsx')#파일이름입력
filefolder = input("종목폴더입력: ")
filename=input("파일이름입력:")
filepos = "C:/Users/yangj/PycharmProjects/pythonProject1/뉴스크롤링/"+filefolder+"/" + filename + ".xlsx"
kfile = openpyxl.load_workbook(filepos)#파일이름입력
sheet=kfile.worksheets[0]#sheet1에 있는 데이터 가죠오기
#print(sheet)
data=[]
......@@ -26,7 +29,17 @@ newData2=[]
#print(newData)
for i in range(len(data)-1):
newData2.append(hannanum.nouns(data[i+1])) #명사만 추출hannanum가 okt보다 성능좋음
#print(newData2)
print(newData2)
newData3=[]
for i in range(len(newData2)):
newData3.append([])
for j in newData2[i]:
if any(map(str.isdigit,j))==False:
newData3[i].append(j)
print(newData3)
#print(type(newData2))#newData2 데이터 형식은 list
df= pd.DataFrame.from_records(newData2)#newData2 dataframe으로 변환
df.to_excel('test.xlsx')#test라는 파일명의 엑셀로 변환
\ No newline at end of file
df= pd.DataFrame.from_records(newData3)#newData2 dataframe으로 변환
df.to_excel(filename+'_명사추출_숫자제외'+'.xlsx') #파일명의 엑셀로 변환
......