object detection 3

YOLO

YOLO(You Only Look One)는 객체 탐지를 하나의 회귀 문제로 만드는 접근으로 기존 객체 탐지 모델에 비해 획기적인 속도 향상을 만들어 낸 모델로. 이후에도 개선된 버전으로 지속적으로 연구가 이어지며 현재까지도 활발하게 사용되고 있다. 논문링크 : https://arxiv.org/pdf/1506.02640v5 1. 서론객체 탐지의 궁극적인 목표는 사람처럼 이미지를 한번만 훑는 것만으로 어떤 객체가 어디어 어떻게 상호작용하는지 즉시 파악하는 것이다. 기존의 객체 탐지 시스템은 Classifer를 변형시켜 Detection을 수행한다. 예를 들어 DPM의 경우 슬라이딩 윈도우 방식으로 Classifier를 전체 이미지에 걸쳐 반복해서 적용한다. 좀 더 최근 방식인 R-CNN의 경우 먼저 객체..

논문 & 기술 2025.05.01

Faster R-CNN

Faster R-CNN은 객체 탐지 분야에서 획기적인 발전을 이끈 논문으로, 기존의 Region Proposal 방식을 Region Proposal Network(RPN)이라는 CNN 기반 방식으로 대체하여, 탐지 속도를 크게 향상 시키면서도 정확도 역시 유지 / 개선하였다. 본인의 이해를 위해서 작성했기 때문에 기존 논문의 순서와 구성과는 다르다는 점 참고바란다. Faster R-CNN 논문https://arxiv.org/pdf/1506.01497v3 이전 R-CNN글을 읽고오면 이해가 훨씬 쉬울 것이다https://rokart.tistory.com/entry/R-CNN R-CNNobject detection에 CNN을 처음 활용한 R-CNN에 대해서 다루어보려고 한다. 이해에 따라 작성하면서 논문의..

논문 & 기술 2025.04.23

R-CNN

object detection에 CNN을 처음 활용한 R-CNN에 대해서 다루어보려고 한다. 이해에 따라 작성하면서 논문의 구성과 달라지는 부분이 있으니 실제 논문을 참고하길 바란다. 논문 링크 : https://arxiv.org/pdf/1311.2524v5 1. 서론기존에는 어떻게 ? 기존에는 전체 이미지에 이동하는 박스(sliding window 방식)로 이미지를 읽어들여 SIFT / HOG 등으로 feature를 추출한 뒤 SVM을 활용하여 해당 박스가 특정 객체인지 분류하는 방식을 사용하였다. 해당 논문에서 이런 기존의 방식들에서 발전이 더 이상 이루어지지 않고 있다고 말하고 있다.그럼 어떻게 ?해당 논문에서는 SIFT / HOG는 생물학적으로 시각 피질(V1)의 세포 반응과 비슷한 구조를 가..

논문 & 기술 2025.04.17