ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 재활용 쓰레기 분류를 위한 Object Detection 대회 회고
    Computer Vision & AI/Computer Vision 2024. 1. 23. 00:53

     

    경험의 누적과 발전

    지난 첫 대회의 경험을 통해 이번에는 빠르게 서버 구축을 할 수 있었다.

    딥러닝 경진 대회에서 어떤 과정이 필요한지 큰 흐름을 알기 때문에 

    이번에는 그런 기법들을 왜 사용해야 하는지, 그게 뭔지를 하나하나 확인하면서

    공부하고 기록하면서 진행했다.

     

    왜 validation set을 고정으로 하는게 중요한지,

    앙상블이 어떤 매커니즘으로 되는지, 

    딥러닝 학습이 어떤 구조로 돌아가는지,

    이해를 기반으로 작업했다.

     

    지난번에는 제대로 못 쓴 git issue, PR도 제대로 사용했다.

    wandb도 이번에 제대로 사용했고 

    팀 실험 전체를 함께 관리했다.

     

    mmdetection의 docs 페이지에서 직접 검색해가며 라이브러리를 사용했다.

    나의 실험에 맞게 custom 하는 방법을 터득했다.

     

     

    Object detection 추론 결과

    더보기

     

     

     

     

    이런 모양의 배터리는 데이터 증강을 통해 더 학습을 시켜야 정확도가 올라갈 것 같다.

     

     

    아쉬웠던 부분

    시간을 효율적으로 쓰지 못한 것 같다.

    전체적인 계획을 세우고 그에 맞게 스스로 점검해나갔어야 했는데 그러지 못했다.

    강의도 제대로 듣지 못했다.

    한번 밀리니 쭉쭉 밀렸다.

     

    대회 기간 이틀 남겨두고 성능이 좋은 모델을 찾았는데

    epoch 돌릴 시간이 부족해서 제대로 성능을 내지 못했다.

    대회 초반에 빠르게 모델 비교를 해서 학습을 했다면...

     

    모델에 집중하느라 데이터 관점으로 작업하지 못했다.

    남이 쓴걸 많이 갖다 쓴 것 같다.

     

     

     

     

    잘한 팀에게서 배울 점

    t-SNE로 고차원 특징을 2차원으로 축소하여 각 데이터셋의 분포를 확인함

    💌t-SNE 참고자료

    https://gaussian37.github.io/ml-concept-t_sne/

     

    t-SNE 개념과 사용법

    gaussian37's blog

    gaussian37.github.io

    👉데이터 분석에서 쓰이는 기법들에 대해 공부하고, 실제 프로젝트에서 분석시 잘 사용할 수 있도록 해야겠다.

    validation set 찾을 때 test set을 모사할 수 있는 valid set으로 찾아야 함.

     

     

     

    객체 분류 성능이 떨어져서 class loss weight 값을 변경했다.

    👉모델에서 사용되는 각 loss의 의미를 알고, 특정한 부분의 개선을 위해서 loss를 자유자재로 활용할 수 있도록 해야겠다.

     

     

     

    앙상블 실험을 여러 경우의 수로 하여 최대 점수를 냈다.

    👉앙상블 결과는 파일을 제출해서야 확인할 수 있으므로 잘 계획해서 결과를 확인해야겠다.

     

     

     

     

    실험 계획서 작성하기

    👉내가 이번에 어떤 실험을 해볼 것이고, 이런 이유에서 해보는 것이고, 이런 결과를 기대했는데 이렇게 되었다. 그 이유는 이렇기 때문이다

    이런식으로 실험의 과정을 잘 정리하고 기록하면 좋겠다.

     

     

     

     

    댓글

Designed by Tistory.