Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
CLIENT
SERVER
ML SERVER
TRAININGMODEL
DATABASE(Datasets)
“ CNN을이용한빠른학습과 BiLSTM을이용한정확한예측기대가능"
거기 중국집 배달 되나요?INPUT
WordEmbedding
CNN
BiLSTM
명사:음식점OUTPUT
ENCODER
DECODER
명사:행위
TAG 정의 세부사항
MN 메뉴 음식메뉴로완제품을의미한다. 반찬을포함한다.
IN 재료 완제품이아닌상태의식재료를의미한다. 소스를포함한다.
DR 음료 커피, 콜라등액체류의식음료를의미한다.
CN 수량 물건에대한수량을의미한다.
SI 사이즈 음식및물건에대한사이즈를의미한다. 액체의경우, 리터단위, 메뉴의경우대/중/소등을포함한다.
PR 가격 물건의가격을의미한다.
PM 결제수단 현금, 카드등결제수단을의미한다.
PC 인원수 사람의수를의미한다.
PX 식기 숟가락, 젓가락등식기를의미한다.
DA 날짜 숫자형태의날짜, 혹은오늘/내일등을포함한다.
TI 시간 숫자형태의시간, 오전/오후/저녁등을포함한다.
LO 장소 장소를의미한다. 시/군/도단위와화장실등작은단위의장소를모두포함한다.
파일명 자질 설명
vocab 형태소 non-static word2vec, static word2vec (mecab 사용, gensim으로 word2vec)
char_vocab 음절단위 character cnn
pos_vocab POS 형태소에따른품사. mecab 사용
gazette 사전정보 사전에처리한형태소와, 그에따른 Tag 쌍
lex_dict 형태소와그에따른 Tag gazette을 vocabulary object로변환
Cnn+Bilstm을 Seq2Seq 모델에맞게변경, 개체명인식 Decoder와의도분석 Decoder를하나의공통된 Encoder로연결
[개체명인식] 현재제공된전처리데이터 8376문장중가공된 188문장을제외한나머지문장가공및학습데이터추가후성능향상
최적의 Batch Size와 Learning Rate을찾고성능향상에주력
가장성능이좋은모델로웹사이트구축
감 사 합 니 다