1. 합성곱층
합성곱층은 커널이라고 불리는 합성곱 필터를 이용해 입력된 이미지를 새로운 이미지로 만들어 출력한다.
모든 커널(kernel)은 합성곱 행렬 형태로 가중치를 가지고 있다. 커널을 이미지 위로 이동시켜 필터가 위치한 부분의 값들을 합성곱 행렬을 이용해 처리한 뒤 새로운 이미지의 픽셀값으로 결정한다. 여기서 필터가 위치한 부분을 수용 영역(receptive field)라고 한다. 필터를 픽셀 단위로 움직이며 계산한 픽셀값들을 모아 하나의 새로운 이미지를 만들어낸다. 이러한 방식으로 만들어진 새로운 이미지를 특징 맵 또는 활성화 맵(activation map)이라고 한다. 특징 맵은 입력 이미지에서 불필요한 정보를 걸러내고, 원하는 정보를 강조한 형태로 만들어진다.
합성곱층은 필터 수, 커널의 크기, 스트라이드, 패딩, 활성화 함수를 결정해 구현할 수 있다.
필터 수는 출력의 깊이를 결정한다. 필터 한 개당 새로운 이미지 한 장를 만들어낸다. 커널의 크기는 한번에 처리하는 수용영역을 결정한다. 크기가 작을수록 이미지의 세세한 부분을 잡아낼 수 있고, 크기가 클수록 복잡한 패턴을 학습할 수 있다. 하지만 필터가 너무 커지면 과적합을 일으킬 수 있으므로 조심해야 한다. 스트라이드는 필터가 한 번에 이동하는 픽셀 수를 의미한다. 너무 많은 픽셀을 건너뛰면 출력의 크기가 너무 작아지므로 조심해야 한다. 패딩은 출력 이미지를 입력 이미지의 크기와 같게 유지하기 위해 이미지의 둘레에 픽셀값이 0인 추가 픽셀을 덧붙이는 것을 말한다.
2. 풀링층과 서브샘플링
풀링은 통계 함수로 입력 크기를 축소하여 계산 복잡도를 줄이는 것을 의미한다.
풀링(pooling)은 커널을 이용하여 이미지를 처리한다. 풀링 커널은 윈도우와 스트라이드로 구성되는데, 윈도우는 커널의 크기이다. 윈도우 내 픽셀의 최댓값을 찾거나 평균값을 찾아 출력 이미지의 픽셀값으로 삼는다. 풀링은 서브샘플링(subsampling)이라고도 불린다. 풀링을 이용하면 중요한 특징을 유지하면서 이미지의 해상도를 떨어뜨링 수 있기 때문에 계산 복잡도를 줄일 수 있어 유용하다. 주로 합성곱층 사이사이에 배치한다.
3. 전결합층
MLP는 분류에 효과적이다. 따라서 분류작업을 위해 마지막에 전결합층을 배치한다.
'인공지능 공부 > 비전 시스템 공부' 카테고리의 다른 글
chapter 3 합성곱 신경망 - 2절 합성곱 신경망 구조 (0) | 2022.08.03 |
---|---|
chapter 3 합성곱 신경망 - 1절 다층 퍼셉트론을 이용한 이미지 분류 (0) | 2022.08.03 |
chapter 2 딥러닝과 신경망 - 7절 역전파 알고리즘 (0) | 2022.07.12 |
chapter 2 딥러닝과 신경망 - 6절 최적화 알고리즘 (0) | 2022.07.12 |
chapter 2 딥러닝과 신경망 - 5절 오차 함수 (0) | 2022.07.12 |