Computer Vision & AI/논문리뷰
-
[논문리뷰] Depth Anything : Unleashing the Power of Large-Scale Unlabeled DataComputer Vision & AI/논문리뷰 2024. 2. 21. 02:31
github : https://github.com/LiheYoung/Depth-Anything Keyword : Semantic-Assisted Perception, Depth estimation, unlabeled image Depth Anything은 강건한 단안 카메라 depth estimation 기술이다. 어떤 환경의 이미지에서도 가능하게 하기 위해서, 62M의 매우 큰 언라벨드 데이터를 사용하였고, automatic하게 annotation하였다. 그 결과 일반화 에러를 줄였다. 데이터 증강 툴을 사용했고, 사전 학습된 인코더로 이전의 풍부한 정보를 상속받는다. depth 추론 영역에서 SOTA를 달성했다. labeled와 unlabeled 이미지를 모두 사용한다. Monocular Depth ..
-
Mask R-CNN 논문 리뷰 (2)Computer Vision & AI/논문리뷰 2023. 12. 5. 16:59
Mask R-CNN = Faster R-CNN + mask branch 🔹모델의 주요 특징 Instance Segmentation Segmentation mask prediction RoI Align 🔹 3가지 branch Classification branch Bbox Regression branch Mask branch mask branch segmentation mask를 예측 1. RoI Align Faster R-CNN : RoI pooling 사용 ⇒ object detection Mask R-CNN : RoI Align 사용 ⇒ segmentation 💭Faster R-CNN의 RoI Pooling feature map에서 region proposal에 해당하는 RoI를 지정한 크기의 gri..
-
Mask R-CNN 논문 리뷰 (1) BackgroundsComputer Vision & AI/논문리뷰 2023. 12. 5. 12:24
Mask R-CNN paper Abstract The method, called Mask R-CNN, extends Faster R-CNN by adding a branch for predicting an object mask in parallel with the existing branch for bounding box recognition. Mask R-CNN = Faster R-CNN + mask branch (segmentation mask를 예측) 🔹 개념정리 object detection : 객체가 위치하고 있는 bbox를 출력 object segmentation : 객체를 픽셀 단위로 분류 Sematic segmentation : 인스턴스의 구분없이 같은 클래스이면 함께 분류 Instance..
-
[논문리뷰] DDPM : Denoising Diffusion Probabilistic ModelsComputer Vision & AI/논문리뷰 2023. 11. 15. 11:50
https://arxiv.org/pdf/2006.11239.pdf https://github.com/hojonathanho/diffusion GitHub - hojonathanho/diffusion: Denoising Diffusion Probabilistic Models Denoising Diffusion Probabilistic Models. Contribute to hojonathanho/diffusion development by creating an account on GitHub. github.com Contents 1. Subject 2. Intro 3. Background 3-1. Forward(diffusion) process : q 3-2. Reverse(denoising) proces..