익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
벡터 데이터베이스
편집하기
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
벡터 데이터베이스는 고차원 벡터 형태로 표현된 데이터를 효율적으로 저장하고 검색하는 데이터베이스 시스템이다. ==개요== 벡터 데이터베이스는 이미지, 오디오, 자연어 등 비정형 데이터를 수치적 벡터로 변환한 후 이를 효율적으로 인덱싱하고 유사성 검색을 수행할 수 있도록 설계된 데이터베이스이다. 이 데이터베이스는 특히 인공지능과 머신러닝 분야에서 중요하게 사용되며, 유사한 객체를 빠르게 찾아야 하는 추천 시스템, 검색 엔진, 얼굴 인식 등 다양한 응용에 활용된다. ==특징== *고차원 데이터 처리를 위한 최적화된 인덱싱 구조 *유사도 기반 검색(Similarity Search)을 위한 근사 최근접 이웃(Approximate Nearest Neighbor, ANN) 알고리즘 사용 *정형 데이터보다 비정형 데이터에 적합 *벡터 삽입, 삭제, 갱신 등의 연산 지원 *GPU 기반 연산 및 분산 처리를 통한 고속 처리 가능 ==동작 구조== 벡터 데이터베이스는 다음과 같은 단계로 동작한다: #데이터 임베딩: 텍스트, 이미지, 오디오 등의 데이터를 고차원 벡터로 변환한다. 예: 문장 "고양이는 귀엽다" → [0.23, -0.45, ..., 0.78] #벡터 저장: 생성된 벡터는 데이터베이스에 저장되며, 고속 검색을 위해 인덱스가 생성된다. #질의 변환: 사용자의 검색 질의도 동일한 방식으로 벡터화된다. #유사도 계산: 질의 벡터와 데이터베이스에 저장된 벡터 간의 유사도를 계산한다. 일반적으로 코사인 유사도 또는 유클리드 거리를 사용한다. #결과 반환: 유사도가 높은 벡터들을 정렬하여 반환한다. ==데이터 예시== 예를 들어, 자연어 문장을 임베딩한 벡터 데이터는 다음과 같이 저장될 수 있다: {| class="wikitable" ! 문장 !! 벡터 (일부) |- | 나는 커피를 좋아해 || [0.12, -0.34, 0.56, ..., -0.87] |- | 고양이는 귀엽다 || [0.23, -0.45, 0.67, ..., 0.78] |- | 오늘은 날씨가 좋다 || [-0.11, 0.45, -0.22, ..., 0.36] |} ==주요 기술== *HNSW(Hierarchical Navigable Small World) *IVF(Inverted File Index) *PQ(Product Quantization) *ScaNN(Scalable Nearest Neighbors) *Faiss, Annoy, Milvus 등의 벡터 검색 라이브러리 및 시스템 ==활용 사례== *이미지 및 비디오 검색: 콘텐츠 기반 검색 *자연어 처리: 문장 또는 단어 임베딩을 통한 유사 문서 검색 *추천 시스템: 사용자 행동 벡터 기반 유사 사용자 추천 *보안: 생체 인식 기반 인증 시스템 *로보틱스: 공간 인식 및 장애물 회피 ==같이 보기== *[[근사 최근접 이웃]] *[[자연어 임베딩]] *[[기계 학습]] *[[유사도 검색]] *[[데이터베이스]] ==참고 문헌== *Johnson, J., Douze, M., & Jégou, H. (2019). Billion-scale similarity search with GPUs. *IEEE Transactions on Big Data*, 7(3), 535–547. *Malkov, Y. A., & Yashunin, D. A. (2018). Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. *IEEE Transactions on Pattern Analysis and Machine Intelligence*, 42(4), 824–836. ==각주 ==
요약:
IT 위키에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
IT 위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
특수 문서 목록
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
문서 기록