2.2 Vector Database와 Embedding Model 성능 비교

  • 주요 용어

    • Vector : 텍스트를 수학적으로 변경한 상태

    • Embedding : 텍스트를 Vector로 변경하는 방법

    • Vector Database : Embedding을 통해 생성된 Vector를 저장하는 데이터베이스

      • LangChain에서는 Vector Store라는 용어를 사용하는데 같은 개념

  • 유사도 검색 (사진출처 - Pinecone Vector Similarity ↗️)

    • 두 개의 Vector가 얼마나 "가까운지"를 계산하는 방법.

    • Eucledian: 두 Vector 사이의 거리를 재는 것

Euclidean Distance
  • Cosine: 원점으로부터 두 Vector에 선을 긋고, 각도의 차이를 계산하는 것

Cosine Similarity
  • Dot Product: Vector의 dot product를 활용

Dot Product

Last updated