-
(복습) YOLO, Gradient descentComputer Vision & AI/AI 2023. 7. 4. 23:11
yolo와 다른 디텍션간의 차이
YOLO는 빠른 처리 속도를 가지고 있어서 실시간 객체 탐지가 가능하다.
이미지를 그리드로 분할하여 각 셀에서 객체의 클래스와 Bounding box를 예측한다.
이 작업을 단일 전방향 패스로 수행하여 다른 알고리즘보다 빠르다.
그리고 객체 스케일에 영향을 덜 받는다. 피라미드 이미지로 다양한 스케일로 객체탐지를 수행한다.
YOLO 인코더에 대해 설명
컨볼루션 레이어와 풀링 레이어로 구성된다.
컨볼루션 레이어에서는 입력 이미지의 다양한 특징을 감지한다. kernel을 이용하여 입력 이미지를 스캔해서 각 부분의 특징을 추출한다.
이때 활성화 함수를 사용하여(ReLU같은) 컨볼루션 레이어의 출력에 비선형성을 부여한다.
활성화 함수는 선형 함수의 한계를 극복하기 위해 사용된다. 비선형 관계를 학습하여 복잡한 이미지 패턴을 모델링 할 수 있다.
풀링 레이어는 특성맵의 크기를 줄인다. 공간적인 크기를 줄임으로써 계산 비용을 줄일 수 있다.
max pooling은 지역적인 변화에 덜 민감하기 때문에 이미지 내의 객체가 약간 이동하더라도 객체를 탐지할 수 있다.
One-stage detector와 Two-stage detector의 차이
gradient descent 설명
경사 하강법은 함수의 최솟값을 찾기 위해 사용되는 최적화 알고리즘이다.
주어진 함수의 기울기(=그래디언트) 를 이용하여 함수의 최솟값을 찾아 과정을 반복한다.
이때 local minimum에 빠질 수 있는데 초기값을 변경하거나 learning rate를 조정하는 등으로 해결해야 한다.
local minimum이란 우리가 목표로 하는 global munimum이전에 다른 값에 수렴하여 알고리즘이 멈추는 지점을 말한다. 이것은 알고리즘의 성능을 저하시킨다.
'Computer Vision & AI > AI' 카테고리의 다른 글
DINO swin L 로 모델 성능 개선 (0) 2024.01.18 (MMDetection) DINO 모델 테스트 (1) 2024.01.16 (MMDetection) Cascade R-CNN 테스트 (1) 2024.01.15 구글 'Gemini' : on device와 cross-model (1) 2023.12.14 NeRF Studio 테스트 (0) 2023.08.23