ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • (복습) YOLO, Gradient descent
    Computer Vision & AI/AI 2023. 7. 4. 23:11

     

     

    yolo와 다른 디텍션간의 차이

     

    YOLO는 빠른 처리 속도를 가지고 있어서 실시간 객체 탐지가 가능하다.

    이미지를 그리드로 분할하여 각 셀에서 객체의 클래스와 Bounding box를 예측한다.

    이 작업을 단일 전방향 패스로 수행하여 다른 알고리즘보다 빠르다.

    그리고 객체 스케일에 영향을 덜 받는다. 피라미드 이미지로 다양한 스케일로 객체탐지를 수행한다.

     

     

     

     

     

    YOLO 인코더에 대해 설명

     

    컨볼루션 레이어와 풀링 레이어로 구성된다.

     

    컨볼루션 레이어에서는 입력 이미지의 다양한 특징을 감지한다. kernel을 이용하여 입력 이미지를 스캔해서 각 부분의 특징을 추출한다.

    이때 활성화 함수를 사용하여(ReLU같은) 컨볼루션 레이어의 출력에 비선형성을 부여한다.

    활성화 함수는 선형 함수의 한계를 극복하기 위해 사용된다. 비선형 관계를 학습하여 복잡한 이미지 패턴을 모델링 할 수 있다.

     

    풀링 레이어는 특성맵의 크기를 줄인다. 공간적인 크기를 줄임으로써 계산 비용을 줄일 수 있다.

    max pooling은 지역적인 변화에 덜 민감하기 때문에 이미지 내의 객체가 약간 이동하더라도 객체를 탐지할 수 있다.

     

     

     

     

     

    One-stage detector와 Two-stage detector의 차이

     

     

     

     

     

     

     

    gradient descent 설명

     

    경사 하강법은 함수의 최솟값을 찾기 위해 사용되는 최적화 알고리즘이다.

     

    주어진 함수의 기울기(=그래디언트) 를 이용하여 함수의 최솟값을 찾아 과정을 반복한다.

     

    이때 local minimum에 빠질 수 있는데 초기값을 변경하거나 learning rate를 조정하는 등으로 해결해야 한다.

     

    local minimum이란 우리가 목표로 하는 global munimum이전에 다른 값에 수렴하여 알고리즘이 멈추는 지점을 말한다. 이것은 알고리즘의 성능을 저하시킨다.

    'Computer Vision & AI > AI' 카테고리의 다른 글

    DINO swin L 로 모델 성능 개선  (0) 2024.01.18
    (MMDetection) DINO 모델 테스트  (1) 2024.01.16
    (MMDetection) Cascade R-CNN 테스트  (1) 2024.01.15
    구글 'Gemini' : on device와 cross-model  (1) 2023.12.14
    NeRF Studio 테스트  (0) 2023.08.23

    댓글

Designed by Tistory.