Object Recognition

2023. 12. 1. 15:29컴퓨터비전

728x90

Classification

Nearest Neighbor

  • input에 대해 유사도 함수나 거리 함수를 사용한다.
  • training이 요구되지 않는다.

 

K-Nearest Neighbor

  • 새로운 점들에 대해, training data로부터 가장 가까운 점 k개를 찾는다.
  • 어느 부류에 속할지 판단

k가 1개,3,5개일 때

 

장점

  • 구현하기 단순하다
  • 부류가 몇 개든 작동한다.
  • 파라미터값이 필요하지 않다.

단점

  • test time이 오래 걸린다
    -> 많은 데이터들과 다 비교해야 하기 때문
  • 좋은 distance function이 필요하다

 

Linear Classifiers

: 부류를 분리하기 위한 linear function을 찾는다.

 

3개의 부류를 구분하려면 3개의 식이 필요

 

 

 

장점

  • 낮은 차원의 파라미터로 나타낼 수 있다
  • test time이 아주 빠르다

단점

  • 둘로만 나눌 수 있다.
  • 비선형으로는 분리할 수 없다.

 

 

Texture models

Texture

: 기본 요소의 반복에 의한 특징

 

 

히스토그램으로 나타내고 

이 히스토그램과 얼마나 유사한지 체크해서 Texture를 구별한다.

 

 

 

Bag of Features

1. 구별할 수 있는 특징점들을 추출

2. visual vocabulary 학습

  • training set으로부터 descriptor들을 추출하고
  • clustering 한 후 그 cluster의 대푯값들을 지정한다.

 

예) 

 

3. Image Representation

  •  이미지를 넣고 어느 대푯값에 해당하는 히스토그램이 높은지 확인 후, 이미지 구별
  • 기하학적 정보가 없어 위치에 상관없이 있기만 하면 맞다고 판단

 

 

Spatial Pyramids

: 기하학적 정보를 포함하고 있어 위치에 맞게 있어야 맞다고 판단하는 방법

728x90