엘라스틱서치를 이용한.. retrieval 설정

boolean retrieval

rank retrieval

쿼리와 문서에 대한 유사도 계산 !

log를 사용해서 빈도수에 대해서도 조금 고려를 할 수 있게 해줌 !

log로 완화

두 벡터 간의 유사도를 계산..

TF-IDF

많은 문서에 등장하는 단어는 변별력이 없어서 낮은 가중치 !

나 너 우리 같은 불용어도 낮은 가중치

IDF가 높다 ? 단어가 등장하는 문서가 적다

BM25

엘라스틱 서치에서 기본 랭킹 함수 !