LeNet: 두 판 사이의 차이

IT 위키
(새 문서: LeNet(영어: LeNet)은 손글씨 숫자 인식 등 문서 이미지 인식을 위해 설계된 초기 컨볼루션 신경망(CNN) 계열 모델로, 특히 1998년에 제안된 LeNet-5가 가장 널리 알려져 있다. ==개요== LeNet은 컨볼루션과 서브샘플링(당시 평균 풀링)을 반복해 공간 정보를 보존하며 특징을 추출하고, 마지막에 완전연결층으로 분류를 수행하는 구조를 갖는다. 원래 목적은 우편번호나 수표의...)
 
(차이 없음)

2025년 10월 25일 (토) 05:09 기준 최신판

LeNet(영어: LeNet)은 손글씨 숫자 인식 등 문서 이미지 인식을 위해 설계된 초기 컨볼루션 신경망(CNN) 계열 모델로, 특히 1998년에 제안된 LeNet-5가 가장 널리 알려져 있다.

개요[편집 | 원본 편집]

LeNet은 컨볼루션과 서브샘플링(당시 평균 풀링)을 반복해 공간 정보를 보존하며 특징을 추출하고, 마지막에 완전연결층으로 분류를 수행하는 구조를 갖는다. 원래 목적은 우편번호나 수표의 손글씨 숫자를 자동 인식하는 산업적 응용이었다.

역사[편집 | 원본 편집]

LeNet 계열은 1980년대 후반부터 AT&T Bell Labs에서 연구가 진행되었고, 1998년 논문을 통해 LeNet-5 구조와 함께 대규모 문서 인식 파이프라인이 보고되었다. 당시 하드웨어 제약에도 불구하고, 합리적인 매개변수 수와 가중치 공유로 실용적 성능을 달성하여 이후 CNN 발전의 토대를 마련했다.

아키텍처[편집 | 원본 편집]

LeNet-5의 대표적 구성은 다음과 같다.

  • 입력: 32×32 그레이스케일 이미지
  • C1: 5×5 컨볼루션, 6채널 → 28×28×6
  • S2: 2×2 평균 풀링(서브샘플링) → 14×14×6
  • C3: 5×5 컨볼루션, 16채널(부분 연결 패턴) → 10×10×16
  • S4: 2×2 평균 풀링 → 5×5×16
  • C5: 5×5 컨볼루션(실질적으로 전결합) → 120 유닛
  • F6: 완전연결층 → 84 유닛
  • 출력층: 10개 클래스(0–9)

활성화 함수로는 시그모이드나 하이퍼볼릭탄젠트가 사용되었으며, 현대적 CNN에서 흔한 ReLU나 배치정규화는 포함되지 않았다.

응용[편집 | 원본 편집]

  • 손글씨 숫자 인식: 수표 처리, 우편번호 판독 등 문서 인식 시스템에서 실사용 사례가 보고되었다.
  • 교육·연구용 베이스라인: 간결한 구조로 CNN의 동작 원리를 설명하고 실험 비교의 기준으로 널리 활용된다.

장점과 한계[편집 | 원본 편집]

장점[편집 | 원본 편집]

  • 가중치 공유와 지역 수용영역으로 매개변수 효율성이 높다.
  • 단순하고 해석 가능하여 입문 및 교육에 적합하다.

한계[편집 | 원본 편집]

  • 입력 크기와 채널 수 가정(32×32, 1채널)에 묶여 복잡한 자연 이미지에 바로 확장하기 어렵다.
  • 현대적 기법(ReLU, 배치정규화, 드롭아웃 등)이 부재해 대규모 데이터셋에서 성능이 제한적이다.

현대적 영향[편집 | 원본 편집]

LeNet은 컨볼루션–풀링–전결합의 표준적 흐름을 정립하여 이후 AlexNet을 비롯한 현대 CNN들의 설계에 직접적인 영향을 주었다. 또한 경량·제한 자원 환경에서의 모델 설계 아이디어(지역 연결, 매개변수 공유)의 중요성을 보여주며, 오늘날에도 베이스라인과 교육 자료로 널리 쓰인다.

같이 보기[편집 | 원본 편집]

참고 문헌[편집 | 원본 편집]

  • Y. LeCun, L. Bottou, Y. Bengio, P. Haffner, "Gradient-Based Learning Applied to Document Recognition," Proceedings of the IEEE, 86(11), 2278–2324, 1998.

각주[편집 | 원본 편집]

없음