-
[TIL] CS231n 2강 - Image Classfication 정리Computer Vision & AI/Computer Vision 2023. 7. 23. 22:32
Image classfication pipeline
- 이미지는 숫자로 구성된 3d array이다.
- challenges : 조명의 영향, occlusion(폐색) 등...
- 이미지 분류 : 이미지가 어떤 class에 속하는지 label을 return
- 기존의 방법 :
이미지의 특징점 (edge)을 찾고 다른 이미지가 들어올 때 전반적인 비교를 한다 (일반적인 방법)
- Data driven approach
data set에 대해 학습시킨 후 ,
train()
predict()
- nearest neighbor classfier
ex) 유클라디안 거리, 맨하탄 거리, 마할라노비스 거리...
- 하이퍼 파라미터는 어떻게 설정하는가?
문제에 따라 다르다. 각각의 파라미터를 실험적으로 테스트하여 성능이 가장 높은 것을 채택해야 한다.
(중요) test set은 최후의 성능평가에만 사용해야 한다(rule) = 테스트 셋을 학습때 사용하면 안 됨!!
- test case가 적은 경우에는 어떻게하지?
cross validation
- nearest방식은 현실에서 적용하기 어렵다. test성능이 너무 낮다.
linear classfication
과정
32x32x3의 이미지를 1열로 쭉 편다.
10x3072개의 weight를 컨트롤 할 수 있다 = parametric approach
f(x,w) = W*x
x는 이미지, w는 weigth
* 설명이 잘 된 블로그
https://velog.io/@dongho5041/CS231n-2%EA%B0%95-%EC%A0%95%EB%A6%AC
'Computer Vision & AI > Computer Vision' 카테고리의 다른 글
[TIL] CS231n 3강 - Loss function, Optimization (0) 2023.08.03 [TIL] 생성형 프롬프트 공부, 회의하며 정리한 것들 (0) 2023.07.25 [TIL] 230525 - 디자인 패턴 in 영상처리 (0) 2023.05.25 [TIL] Person Detection - 1. HOG (0) 2023.05.12 [YOLO] C++ 비주얼 스튜디오에서 yolo 사용시 에러 해결 방법 (0) 2022.12.13