Word2Vec: 두 판 사이의 차이
IT위키
편집 요약 없음 |
편집 요약 없음 |
||
1번째 줄: | 1번째 줄: | ||
[[분류:인공지능]] | [[분류:인공지능]] | ||
== 개요 == | == 개요 == | ||
; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 | ; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환하는 [[워드 임베딩]] 도구 | ||
* 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화 | * 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화 |
2020년 1월 29일 (수) 01:15 기준 최신판
개요[편집 | 원본 편집]
- 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환하는 워드 임베딩 도구
- 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화
- 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산
라이센스[편집 | 원본 편집]
Apache License 2.0
변환 방식[편집 | 원본 편집]
CBoW 변환[편집 | 원본 편집]
- Continuous Bag-of-Words
- 연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다.
skip-gram 변환[편집 | 원본 편집]
- 입력된 단어의 주변 단어를 예측한다.