textAnalystic.js
2.98 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
const apiRequest = require('./apiRequest');
/**
* @param {{lemma:string, position:number, type:string}[][]} tempMorps - 공백 단위로 묶어둠 ex) [[{감기}],[{걸리},{었},{을}],[{때}]]
* @returns {{needMorp : {}[][], noNeedMorp : {}[][]}} morp를 needMorp와 noNeedMorp로 나눴습니다.
* @description 공백 단위로 나뉜 morp를 받아 type과 의미에 따라 2가지로 분류합니다.
*/
const divideMorpbyMean = ( tempMorps ) => {
let needMorp = [],
noNeedMorp = [];
tempMorps.forEach( ( word, j ) => {
if( word[ 0 ].type === "VV" || word[ 0 ].type === "VA" || word[ 0 ].type === "MAG") { // 동사, 형용사, 부사
let checkV = true
word.find( ( Morp ) => {
if( Morp.type === "EF" ) { // 종결어미
checkV = false;
} else if( Morp.type === "EC" ) { // 연결어미
if( tempMorps.length > j + 1 ) {
tempMorps[ j + 1 ].forEach( ( morp ) => {
if( allowMorpChecklist.indexOf( morp.type ) === -1 ) {
checkV = false;
}
});
}
}
});
}
else {
checkMorp( word, needMorp, noNeedMorp );
}
});
return [ needMorp, noNeedMorp ];
}
/**
* 수정중...
* @param {String} result - 결과 담던거
* @param {{NE : {}[], Morp : {}[]}} analysisResult 분석 결과가 담겼습니다.
* @description morp를 처리하는 함수 입니다 ^^
*/
const divideMorp = async ( result, analysisResult ) => {
let tempResult = {},
tempMorps = [];
analysisResult.NE.forEach( ( word ) => {
analysisResult.morp.forEach( ( morp, index ) => {
if( word.begin <= index && word.end >= index ) {
morp.type = "NOG";
}
});
});
analysisResult.word.forEach( ( word ) => {
tempMorps.push( analysisResult.morp.slice( word.begin, word.end + 1 ) );
});
}
/**
* @param {Object} clientData - 클라이언트에서 받아온 데이터
* @param {String} clientData.text - 분석할 텍스트
* @returns {Object} 분석 결과 데이터
* @description 클라이언트 데이터를 받아 의미를 분석하고 맞춤법을 교정해 돌려줍니다.
*/
const textAnalystic = async ( clientData ) => {
let result = { "originalText" : clientData.text },
fixedClientData,
textAnalystic;
fixedClientData = await apiRequest.Korean( result.originalText );
result.korean = fixedClientData;
result.fixedText = result.korean.notag_html;
try {
textAnalystic = await apiRequest.ETRI( "WiseNLU", { "analysis_code" : "ner", "text" : result.fixedText } );
}
catch( err ) {
throw new Error( err.message );
}
await divideMorp( result, textAnalystic.return_object.sentence[ 0 ] );
return result;
}
module.exports = textAnalystic;