Computer Vision & AI/Computer Vision
-
[Segmentation] DeconvNet, SegNet, FC DenseNet, DeepLab, DilatedNetComputer Vision & AI/Computer Vision 2024. 2. 22. 17:55
2024.02.10 - [Computer Vision & AI/Computer Vision] - Semantic Segmentation - FCN Semantic Segmentation - FCN FCN Fully Convolutional Network end-to-end 딥러닝 모델의 기본인 FCN https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf end-to-end 딥러닝 모델 입력부터 출력까지 프 venypark.tistory.com FCN의 한계 객체의 크기가 크거나 작은 경우 예측을 잘 못함 큰 객체 - 유리창에 비친 자전거가 자전거..
-
[Semantic Segmentation] FCNComputer Vision & AI/Computer Vision 2024. 2. 10. 17:44
FCN Fully Convolutional Network end-to-end 딥러닝 모델의 기본인 FCN https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf end-to-end 딥러닝 모델 입력부터 출력까지 프로세스를 하나의 모델로 구현한 것 특징 VGG 네트워크 backbone을 그대로 사용 VGG 네트워크의 FC Layer (nn.Linear)를 Convolution으로 대체함 Transposed Convolution을 이용해서 Pixel Wise prediction을 수행함 VGG 3x3의 convolution을 깊게 쌓아서 적은 파라미터..
-
재활용 쓰레기 분류를 위한 Object Detection 대회 회고Computer Vision & AI/Computer Vision 2024. 1. 23. 00:53
경험의 누적과 발전 지난 첫 대회의 경험을 통해 이번에는 빠르게 서버 구축을 할 수 있었다. 딥러닝 경진 대회에서 어떤 과정이 필요한지 큰 흐름을 알기 때문에 이번에는 그런 기법들을 왜 사용해야 하는지, 그게 뭔지를 하나하나 확인하면서 공부하고 기록하면서 진행했다. 왜 validation set을 고정으로 하는게 중요한지, 앙상블이 어떤 매커니즘으로 되는지, 딥러닝 학습이 어떤 구조로 돌아가는지, 이해를 기반으로 작업했다. 지난번에는 제대로 못 쓴 git issue, PR도 제대로 사용했다. wandb도 이번에 제대로 사용했고 팀 실험 전체를 함께 관리했다. mmdetection의 docs 페이지에서 직접 검색해가며 라이브러리를 사용했다. 나의 실험에 맞게 custom 하는 방법을 터득했다. Object..
-
[컴퓨터비전] 두 이미지의 유사성을 측정하는 "SSIM"Computer Vision & AI/Computer Vision 2023. 10. 31. 20:27
- 사용 모듈 OpenCV PyQt scikit-image scikit-image의 compare_ssim함수를 이용하여 두 이미지의 유사도를 측정한다. 0에 가까울수록 유사성이 낮고, 1에 가까울수록 두 이미지간의 유사도가 높다. - 결과 AI 생성 이미지(오른쪽)들과 비교해봤다. 비교적 높은 수치가 나온 새와 강아지 이미지는 색상이 전체적으로 비슷한 편이나 고흐의 해바라기의 경우 생성 이미지에 방울토마토(R)과 Y값도 크기가 다르게 보인다. 그래서 수치가 낮게 나온 것 같다. - 전체코드 import sys import cv2 from PyQt5.QtWidgets import QApplication, QWidget, QPushButton, QLabel, QVBoxLayout, QFileDialog f..
-
SAM - Segment Anything ModelComputer Vision & AI/Computer Vision 2023. 10. 17. 21:13
모두연 - 모두팝 세미나에서 했던 SAM 강의를 바탕으로 정리한 글입니다. SAM segment anything model 올해 4월 Meta에서 출시한 segment anything 객체 하나뿐만 아니라 한번에 많은 객체를 segment 함. Motivation LLM은 사실 다음 단어를 예측하는 것인데 마치 대화하는 것처럼 보여진다. Foundation Model downstream task에 대해 높은 zero-shot generalization성능을 보이는 모델 트랜스포머 모델 이후 모델을 깊게 쌓아서 다음 단어를 예측하는 task를 잘 해결했다 segmentation을 잘 하기 위해서는 어떤 task가 정의되어야 할까? → 이미지와 어떤 prompt가 주어졌을 때 유효한 mask를 반환하는 것 ..
-
[TIL] CS231n 3강 - Loss function, OptimizationComputer Vision & AI/Computer Vision 2023. 8. 3. 23:47
Loss function 최적의 weight를 구하여 에러율을 줄이는 것이 머신러닝의 목표 최적화 : 에러율이 최소인 w를 구하는 과정 SVM Support Vector Machine 분류에 사용하는 모델 쉬운 설명 사이트👇 서포트 벡터 머신, 가보자고! ✊🏻 : "디지털"한 일잘러 되는 비법 (ablearn.kr) 경계선 상에 있는 데이터들을 이으면 support vector가 된다. 각 support vector간의 거리를 margin이라고 한다. support vector 사이의 직선을 decision boundary 라고 한다. 목표 : margin을 최대로 만드는 것. Hinge Loss SMV에서 loss를 구하는 방법 S_j 는 잘못된 score S_y_i는 correctly score 1은..
-
[TIL] 생성형 프롬프트 공부, 회의하며 정리한 것들Computer Vision & AI/Computer Vision 2023. 7. 25. 00:28
생성 프롬프트 사용할 때 seed 값 : 무작위성을 제어한다. pro:긍정, 일반적인 프롬프트, 어떤 것을 표현할지 neg: 부정, 이것을 이용해서 이상한 부분을 제거할 수 있다. ex) bad arms kaiber로 뮤직비디오 생성 프롬프트를 고정으로 하니까 계속 고정된 이미지가 나온다(말을 입력하면 죽을때까지 말만 나옴) general하게 입력해주니 풍부한 프레임들이 만들어졌다. evolve값 : kaiber에서 사용하는 파라미터인듯? 숫자가 낮을수록 안정적인 이미지 생성됨 프롬프트 작성에 있어서 이미지나 영상을 생성할 때 어느정도 미술, 비디오 관련 지식이 필요한 것을 느꼈다. 생성 사이트에서 관련된 키워드들을 예시와 함께 보여주면 좋을 듯. 오늘의 교훈 : 생성 이미지 만들 때 사용한 파라미터 값..
-
[TIL] CS231n 2강 - Image Classfication 정리Computer Vision & AI/Computer Vision 2023. 7. 23. 22:32
Image classfication pipeline - 이미지는 숫자로 구성된 3d array이다. - challenges : 조명의 영향, occlusion(폐색) 등... - 이미지 분류 : 이미지가 어떤 class에 속하는지 label을 return - 기존의 방법 : 이미지의 특징점 (edge)을 찾고 다른 이미지가 들어올 때 전반적인 비교를 한다 (일반적인 방법) - Data driven approach data set에 대해 학습시킨 후 , train() predict() - nearest neighbor classfier ex) 유클라디안 거리, 맨하탄 거리, 마할라노비스 거리... - 하이퍼 파라미터는 어떻게 설정하는가? 문제에 따라 다르다. 각각의 파라미터를 실험적으로 테스트하여 성능이 ..
-
[TIL] 230525 - 디자인 패턴 in 영상처리Computer Vision & AI/Computer Vision 2023. 5. 25. 23:44
💥영상처리에서 주로 사용되는 패턴들 Strategy 패턴 여러가지 알고리즘을 테스트 하면서 동적으로 교체하는 전략 인터페이스를 통해 전략을 선택적으로 변경함 옵저버 패턴 영상 처리 과정을 실시간으로 감지 객체 감지나 필터링 등 → 이벤트 전달 데코레이터 패턴 반복자 패턴 프레임을 반복하면서 처리 또는 픽셀 값 처리 등 iterator 로 캡슐화 하고 반복 순회 커맨드 패턴 외부 이벤트 처리 💫내가 주로 사용하는 디자인 패턴 반복자 특징 iterator 로 캡슐화 하고 반복 순회 어떤 문제에서 사용? 프레임을 반복하면서 처리 픽셀 값 처리 등 단점 인덱스로 인한 예외발생 가능성, 메모리 사용량, 옵저버 특징 객체 감지나 필터링 등 → 이벤트 전달 어떤 문제에서 사용? 영상 처리 과정을 실시간으로 감지 디버..