Word2Vec: Difference between revisions

From IT Wiki
(새 문서: == 개요 == ; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 도구이다. * 단어의 연결을 기반으로 단어의 연관성을 벡...)
 
No edit summary
 
(4 intermediate revisions by 2 users not shown)
Line 1: Line 1:
[[분류:인공지능]]
== 개요 ==
== 개요 ==
; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환(임베딩)하는 도구이다.
; 파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환하는 [[워드 임베딩]] 도구


* 단어의 연결을 기반으로 단어의 연관성을 벡터로 만들어 준다.
* 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화
* 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산할 수 있다.  
* 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산
 
== 라이센스 ==
Apache License 2.0


== 변환 방식 ==
== 변환 방식 ==
=== CBOW 변환 ===
=== CBoW 변환 ===
; Continuous Bag-of-Words
; Continuous Bag-of-Words
*연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다.  
* 연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다.  


=== skip-gram 변환 ===
=== skip-gram 변환 ===
Line 14: Line 18:


== 공식 사이트 ==
== 공식 사이트 ==
[링크 https://code.google.com/archive/p/word2vec/]
[https://code.google.com/archive/p/word2vec/ 링크]

Latest revision as of 01:15, 29 January 2020

개요[edit | edit source]

파이썬 라이브러리로, 문장 내부의 단어를 벡터로 변환하는 워드 임베딩 도구
  • 단어와 단어간 거리를 기준으로 단어의 연관성을 벡터화
  • 단어와 단어간의 유사도를 쉽게 확인할 수 있고 의미를 선형으로 계산

라이센스[edit | edit source]

Apache License 2.0

변환 방식[edit | edit source]

CBoW 변환[edit | edit source]

Continuous Bag-of-Words
  • 연속 단어 꾸러미 방식이라고 하며, 주변 범위 안의 맥락 단어로부터 하나의 대상 단어를 예측한다.

skip-gram 변환[edit | edit source]

  • 입력된 단어의 주변 단어를 예측한다.

공식 사이트[edit | edit source]

링크