데이터제작 NLP..

1-6번까지는 설명을 했음..

데이터 부분 관련 설명..

annotation tool / tagtog, google 스프레드 시트

그나마 괜찮았던 tagtog과 스프레드시트의 장점을 활용해.. 사용

wikipedia 데이터를 kowikiapi를 사용해서.. 추출..!

추출된 것을 구글 스프레드 시트로 옮김..

어떤 entity가 나올지 서로 브레인스토밍..!

제공된 말뭉치를 적절한 길이/ 내용의 문장으로 나눠야 함..! → KSS나 Regax 등으로 cleansing

new project생성..!

entities, relations.. 주목