Word2Vec

IT위키
Itwiki (토론 | 기여)님의 2018년 10월 13일 (토) 11:50 판 (새 문서: == 개요 == ; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 도구이다. * 단어의 연결을 기반으로 단어의 연관성을 벡...)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

개요

파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 도구이다.
  • 단어의 연결을 기반으로 단어의 연관성을 벡터로 만들어 준다.
  • 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산할 수 있다.

변환 방식

CBOW 변환

Continuous Bag-of-Words
  • 연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다.

skip-gram 변환

  • 입력된 단어의 주변 단어를 예측한다.

공식 사이트

[링크 https://code.google.com/archive/p/word2vec/]