합성곱 신경망 편집하기 (부분)

==작동 원리==
CNN은 일반적으로 다음과 같은 층들로 구성된다.

===합성곱 층 (Convolution Layer) ===
* 입력의 국소 영역에 작용하는 작은 필터(커널)를 사용하여 합성곱 연산을 수행한다.
* 커널이 입력 위를 슬라이딩하면서 입력과 커널 간의 내적을 취해 특징 맵(feature map)을 생성한다.
* 스트라이드(stride), 패딩(padding), 커널 크기 등이 하이퍼파라미터로 사용된다.
* 여러 개의 필터를 사용하면 여러 개의 출력 채널(feature map)을 얻을 수 있다.
* 합성곱 층의 연산량은 보통 다음과 같이 계산된다:
** MACs = (필터 수) × (채널 수) × (필터 높이) × (필터 너비) × (출력 높이) × (출력 너비)

===활성화 함수 (Activation)===
* 일반적으로 ReLU(Rectified Linear Unit)가 많이 쓰이며, 입력 값을 비선형으로 변환하여 비선형 표현력을 부여한다.
* 다른 활성화 함수도 사용 가능하다 (sigmoid, tanh 등).

===풀링 층 (Pooling Layer) ===
* 공간 크기를 감소시켜 연산량을 줄이고 특징의 불변성(invariance)을 강화한다.
* 대표적으로 max pooling, average pooling 등이 있다.
* 예: 2×2 영역에서 최대값을 취하는 max pooling 방식이 흔히 사용된다.

=== 완전 연결층 (Fully Connected Layer) ===
* 최종적으로 추출된 특징 벡터를 입력으로 받아 분류(classification) 또는 회귀(regression)를 수행하는 층이다.
* 소프트맥스(softmax) 계층을 통해 확률 분포로 변환되는 경우가 많다.

===기타 기법들===
* 드롭아웃(dropout), 배치 정규화(batch normalization) 등을 통해 과적합(overfitting)을 방지
* 전이 학습(transfer learning)을 위해 사전 학습된 CNN을 활용
* 다운샘플링을 위한 스트라이드 사용
* 확장 합성곱(dilated convolution), 전치 합성곱(transposed convolution) 등 다양한 변형
* CNN의 학습 중 Network Slimming 기법을 적용하여 Batch Normalization의 스케일링 인자를 기준으로 불필요한 채널을 제거할 수 있음.