MRC와 Retrieval을 연결하는 방법에 대해 알아본다.
1. Introduction to Open-domain Question Answering
기존의 MRC : 지문이 주어진 상황에서 질의응답
ODQA는 지문이 따로 주어지지 않음. 방대한 World Knowledge에 기반해 질의응답
ODQA는 예전부터 논의되던 task인데.. 조금 다른 부분이 있긴 하지만 전체적인 파이프라인은 비슷..
2. Retriever-Reader Approach
이게 ODQA에서 가장 많이 쓰이는 approach
Retriever
- 입력 : 문서set(Document corpus), 질문(query)
- 출력 : 관련성 높은 문서
- TF-IDF, BM25 → 학습 없음 (Self-supervised한 형태로 학습)
- Dense → 학습 있음
Reader