BERT

IT위키
김형교 (토론 | 기여)님의 2019년 12월 30일 (월) 16:06 판
Bidirectional Encoder Representations from Transformers
자연어 처리 언어 모델
  • RNN을 사용하지 않는 Attention 모델

주요 기술

  • WordPiece tokenizing
    • 접두사, 접미사를 구분
    • ex) playing, coming, loving → ##ing
    • ex) 서울특별시, 세종특별시, 성남시, 안양시 → ##특별시, ##시