본문 바로가기

인공지능 공부/비전 시스템 공부

chapter 1 컴퓨터 비전 입문 - 3절 컴퓨터 비전 파이프라인 전체 처리 과정

1. 컴퓨터 비전 파이프라인의 구성 요소

 비전 시스템은 일련의 서로 구분되는 단계를 거쳐 이미지를 분석하고 처리한다. 이 단계를 컴퓨터 비전 파이프라인(computer vision pipeline)이라고 한다. 컴퓨터 비전 파이프라인은 데이터 입력, 전처리, 특징 추출, 머신러닝 모델 단계로 구성되어 있다.

1. 데이터 입력
 컴퓨터가 이미지나 동영상을 입력 받는 단계이다. 감지 장치 등으로부터 이미지들이나 동영상들을 입력 받는다. 동영상은 일련의 이미지들로 구성되어있기 때문에 입력은 모두 이미지라고 할 수 있다.

2. 전처리
 이미지를 표준화하는 단계이다. 서로 다른 이미지들을 비교하기 위해서는 표준화 작업이 필요하다. 이미지 크기를 조정하거나 흐릿하게 하기, 회전, 모양 변경, 색상 조정 등이 이 과정에 포함된다.

3. 특징 추출
 이미지로부터 특징을 추출하는 단계이다. 가령 모터사이클 이미지에서 특징을 추출한다면, 바퀴, 헤드라이트, 흙받기 등이 특징이 될 수 있다. 이 특징들로부터 특징 벡터(feature vecter)를 만들어낸다.

4. 머신러닝 모델
 특징 벡터를 분류 모델(classification model)에 입력하는 단계이다. 입력된 특징 벡터들을 통해 이미지가 속한 카테고리를 예측한다. 이미지 속 대상이 각 카테고리에 속할 확률을 모두 계산해 본 뒤, 가장 높은 확률의 카테고리로 이미지 속 대상을 분류한다.

 

2.  컴퓨터 비전 파이프라인의 정확도 개선 방법

 비전 시스템의 정확도를 개선하기 위해서는 1단계를 반복해 이미지를 더 학습하거나, 2단계를 반복해 노이즈를 더 많이 제거하거나, 3단계를 개선해 더 나은 특징을 추출하거나, 4단계를 개선하기 위해 알고리즘의 하이퍼파라미터를 튜닝할 수 있다.