1. Generation-based MRC

모든 Extraction-based MRC 문제는 Generation-based MRC 문제로 치환이 가능하다 ! but 역은 성립하지 않는다

Extraction-based MRC : 지문 내 답의 위치를 예측 ! → 분류 문제 (각 token이 정답인지 아닌지 예측)

Generation-based MRC : 주어진 지문과 질의를 보고 답변을 생성

지문 내에 정답이 존재한다고 하더라도 위치를 찾는게 아니라 모델이 해당 정답을 생성하도록 학습 !

생성하는거니까.. 평가 방법이 달라질 수 밖에 없다 ! → EM이나 F1을 사용할수는 있지만, ROUGE, BLEU 등을 사용함

Input은 Extraction-based model과 비슷하지만 output이 정답 text를 만들어준다 ! seq2seq이라고 보면 된다 ! BERT는 사용 불가.. 어떤 모델을 사용 가능한지도 알아볼 예정..

MRC 모델 구조

Seq2Seq PLM 구조 vs PLM + Classification (PLM : pretrained LM ?)

Loss 계산을 위한 답의 형태, prediction의 형태도 다르다..

Free-form text 형태 vs 지문 내 답의 위치 (extraction)

free form text 경우 text decoding할 때 teacher forcing 느낌으로 정답을 예측..

Extraction-based MRC의 경우 F1 계산하기 위해서는 text로 별도 변환 과정이 필요하다.

2. Pre-processing

Input은 Extraction based model과 동일