2.2 Vector Database와 Embedding Model 성능 비교
Previous2.1 Retrieval Augmented Generation(RAG)란?Next3. LangChain을 활용한 Retrieval Augmented Generation(RAG) 구성
Last updated
Last updated
주요 용어
Vector : 텍스트를 수학적으로 변경한 상태
Embedding : 텍스트를 Vector로 변경하는 방법
Vector Database : Embedding을 통해 생성된 Vector를 저장하는 데이터베이스
LangChain에서는 Vector Store라는 용어를 사용하는데 같은 개념
유사도 검색 (사진출처 - Pinecone Vector Similarity ↗️)
두 개의 Vector가 얼마나 "가까운지"를 계산하는 방법.
Eucledian: 두 Vector 사이의 거리를 재는 것
Cosine: 원점으로부터 두 Vector에 선을 긋고, 각도의 차이를 계산하는 것
Dot Product: Vector의 dot product를 활용