데이터제작 NLP..
1-6번까지는 설명을 했음..
데이터 부분 관련 설명..
annotation tool / tagtog, google 스프레드 시트
그나마 괜찮았던 tagtog과 스프레드시트의 장점을 활용해.. 사용
wikipedia 데이터를 kowikiapi를 사용해서.. 추출..!
추출된 것을 구글 스프레드 시트로 옮김..
어떤 entity가 나올지 서로 브레인스토밍..!
제공된 말뭉치를 적절한 길이/ 내용의 문장으로 나눠야 함..! → KSS나 Regax 등으로 cleansing
new project생성..!
entities, relations.. 주목