코드를 느껴바라

컴퓨터 비전 : 특징 기술(Feature Descriptor) 본문

CS/컴퓨터 비전(Computer Vision)

컴퓨터 비전 : 특징 기술(Feature Descriptor)

feelTheCode 2025. 4. 24. 23:30

특징 기술 (Feature Descriptor)

영상처리에서 특징 기술자(Feature Descriptor)는 물체를 인식하거나 매칭할 때 사용하는 숫자 벡터입니다.
영상 속 관심점이나 영역의 특징을 요약한 정보죠. 이 포스팅에서는 다양한 특징 기술자의 원리와 종류를 살펴보겠습니다.


1. 특징 기술의 기본 원리

특징 기술자의 조건:

  1. 분별력(Discriminating Power):
    • 서로 다른 물체를 잘 구분할 수 있어야 합니다.
  2. 불변성(Invariance):
    • 회전, 이동, 스케일 변화 같은 변형에도 특징이 유지되어야 합니다.
  3. 차원의 효율성(Dimensionality):
    • 벡터의 차원이 너무 높으면 계산이 느리기 때문에
      필요한 정보만 담고 최소한의 차원을 가져야 합니다.

예시: SIFT 기술자는 회전·스케일 변형에도 강인하고, 128차원으로 구성됩니다​.


2. 관심점에서 기술자 추출

대상:

4장에서 검출한 관심점(예: SIFT 키포인트) 주위.

방법:

  • 관심점 주변윈도우를 설정해
    그 안의 명암, 색상, 그래디언트(방향) 같은 정보를 요약합니다.
  • 스케일이 다른 경우엔 윈도우 크기를 조정하고,
    회전된 경우엔 방향을 정렬해서 불변성을 확보합니다.

대표 기법:

  • SIFT: 회전, 스케일 변화에 강인한 128차원 벡터 생성.
  • SURF: SIFT보다 빠르게 작동, 64차원 벡터 사용​.
  • PCA-SIFT, GLOH 등등

3. 영역에서 기술자 추출

대상:

분할한 영역(예: 물체 전체, 배경).

방법:

  • 영역 전체의 모양, 크기, 분포 같은 정보를 계산합니다.
  • 대표적인 기술자:
    • 모멘트(Moments): 화소의 분포를 통계적으로 요약.
    • 푸리에 기술자(Fourier Descriptors): 영역의 외곽선을 주파수 공간에서 요약.
    • 형태 기술자(Shape Descriptors): 길쭉한 정도, 주축 방향 등.

특징:

  • 형태구조적인 정보를 잘 담음.
  • 복잡한 형태도 주파수로 요약할 수 있음 (푸리에 기술자)​.

4. 텍스처 특징 추출

텍스처란?

  • 영상에서 일정 패턴이 반복되는 것을 의미합니다.
    예: 잔디, 나뭇잎, 벽돌 등.

추출 방법:

  • 통계적 방법을 주로 사용:
    • 에지 밀도, 에지 방향 히스토그램 등.
  • 지역 이진 패턴(LBP):
    • 화소 주변 이웃과 값을 비교해 이진수 패턴 생성 → 히스토그램으로 요약.

활용:

  • 영상 분할, 물체 인식 등에 사용.
  • 잔디와 나무 같은 영역을 구분할 때 유용.

특징:

  • 색상이나 밝기보다 패턴 자체를 분석.
  • 에지나 반복 구조를 기반으로 세밀한 구분 가능​.

5. 주성분 분석 (PCA) 기법

원리:

  • 고차원 데이터낮은 차원으로 줄이는 방법.
  • 정보 손실 최소화하면서 가장 중요한 축(주성분)을 찾아내어
    데이터를 그 축으로 재표현합니다.

활용:

  • SIFT-PCA: SIFT의 128차원을 20차원으로 줄여
    계산 효율을 높이는 데 사용.
  • 다양한 패턴 인식 분야 (음성, 텍스트 등)에서 사용.

장점:

  • 계산량이 줄어들고, 잡음 제거 효과도 있음.

 


6. 주성분 분석을 이용한 얼굴 인식

원리:

  • 얼굴 이미지고유 얼굴(Eigenface) 벡터로 변환.
  • 얼굴 데이터셋에서 공통된 얼굴 패턴(주성분)을 찾아
    새로운 얼굴을 그 패턴으로 비교합니다.

과정:

  1. 여러 얼굴 이미지를 PCA로 분석 → 주성분(고유 얼굴) 추출.
  2. 새로운 얼굴을 주성분 공간으로 변환 →
    얼마나 비슷한지 비교.

특징:

  • 얼굴 전체를 하나의 벡터로 요약.
  • 조명 변화표정 차이에는 다소 민감할 수 있음.
반응형