-
마스크 착용 이미지 분류 경진대회 회고 (2) - 인사이트개발자노트/네이버 부스트캠프 AI 2023. 12. 24. 00:24
혹시 경진대회를 참여하고 있다면, 이 글을 보지 않고 직접 해보신 후에 해당 글의 내용을 적용하는 것을 추천드립니다!
자기가 판 땅만큼 자기 것이 되는 것이니까요~
1, 2등팀에서 발표한 내용 중 좋았던 점
Data imvalance 해결
나이, 마스크에서 data 불균형을 파악한 이후 이를 해결하는 데에 초점을 맞추었다.
특히 age가 관건이라 생각하였고 해결을 위해 다양한 방법을 시도했다.
59,60세를 딱 나눌 수 없다는 점에 착안해서 근처의 나이대를 지운 시도가 인상적이었다. (down sampling)
부족한 데이터는 generation을 통해 증강했다.
Data cleansing
노이즈 데이터를 라벨링 툴로 빠르게 체킹함.
activation map 확인
활성화 맵은 딥러닝 모델에서 각 층에서 활성화되는 특징을 시각화 한 지도이다.
모델이 입력 이미지의 어느 부분에서 집중하고 있는지 이해하는 데 도움을 준다.
이를 통해 배경이 많이 잡힌다는 것을 확인하고 background를 제거했다.
모델을 분석하여 채택
이게 왜 좋은지를 분석함.
(ex. 클래스가 적기 때문에 small이 제일 잘 나왔다)
multi head + single을 섞었다
피드백
시간 안에 모든 것을 완벽하게 하기는 어렵다.
시간이 부족하면 어떤 것을 해결해야하는지를 먼저 설정해야 한다.
실제 상황에서는 데이터가 훨씬 좋지 않다.
가장 칭찬할 것은 주제를 명확히 잡은 것.
activation map도 잘 활용했다.
데이터를 잘 분석한 팀이 잘했다.
어떻게든 되겠지라는 식으로 접근하면 안 된다.
모델을 선택하는 데에는 이유가 있어야 한다. 그래야 다음 모델을 선정할 때에 이유가 된다.
면접 볼 때 대회 스코어를 기록하기보다는 뭘 시도했는지를 말하는 것이 좋다.
새롭게 알게 된 것
model의 block freeze를 할 때 무작위로 하면 안 된다.
그 블록이 어떤 역할을 하는지 알 수 없기 때문.
실험적으로 접근해야 한다.
개인적으로 좋았던 점
데이터에 집중하고 거기서 끝내는 것이 아니라 어떻게 그 문제를 해결할 것인지 심도 있게 접근했다.
반복적이고 오래 걸리는 작업을 간편한 툴을 만들어서 적용했다
실험 결과를 깔끔하고 보기 좋게 정리하였다
💌회고를 잘 정리한 블로그 글
https://eliza-dukim.tistory.com/33
'개발자노트 > 네이버 부스트캠프 AI' 카테고리의 다른 글
동료 피드백을 읽으며 느낀점 정리 (0) 2023.12.29 마스크 착용 이미지 분류 경진대회 회고 (1) - 나의 기록 (1) 2023.12.24 [네부캠 AI tech] 7주차 주간회고 (12/18~12/22) (2) 2023.12.22 [네부캠 AI tech] 6주차 주간회고 (12/11~12/15) (2) 2023.12.15 [네부캠 AI tech] 5주차 주간회고 (12/04~12/08) (4) 2023.12.08