Computer Vision11 FCOS(Fully Convolutional One-Stage Detector) Abstract 이 논문에서 object detection 문제를 풀기 위해서 segmentation과 같은 per-pixel prediction를 이용하는 fully convolutional one-stage object detector를 제안합니다. Fcos는 anchor box free라는 특징을 가집니다 → complicated computation X, anchor-box X, hyperparameter X Introduction 주로 objetct detection의 mainstream인 one-stage or two-stage architecture들은 anchor-box를 이용하는게 대다수입니다.→ Retinanet, SSD, Faster R-CNN, YOLOv3….. 이러한 anchor-.. 2022. 8. 21. Transformer("Attention is all you need") 1. Introduction 트랜스포머는 구글에서 2017년에 제안한 자연어 모델로서 기존의 seq2seq모델처럼 인코더-디코더 구조를 따르지만, RNN과 CNN을 전혀 사용하지 모델입니다. 기존 seq2seq모델의 한계점은 인코더에서 추출된 고정된 크기의 context vector를 디코더의 입력으로 사용하여 병목현상으로 인한 성능저하 문제가 있었습다. 예를 들어, 긴 문장이 들어왔을 때 인코더의 가장 뒤의 hidden state의 벡터를 사용하기에 문장의 앞부분의 특징을 제대로 표현하지 못한다는 문제점입니다. 여기서, "만약 각 단어(토큰)으로부터 나온 특징 벡터를 모두 다 병렬로 디코더에 입력할 수 없을까?"라는 질문에서 시작하여 트랜스포머가 출현하게 되었습니다. 먼저, 트랜스포머를 설명하기전에 A.. 2021. 5. 6. RCNN(Regions with CNN) RCNN는 2-stage object detection RCNN 계열 (RCNN, Fast RCNN, Faster RCNN)의 시초 모델입니다. 2-Stage 첫번째, Object의 위치를 찾아내는 것.(Region Proposal) 두번째, Object의 클래스를 분류하는 것(Region Classification) 수행 프로세스 1. Region Proposal 알고리즘을 사용하여 약 2000개의 Region 영역을 제안합니다. 2. CNN 네트워크에 입력하기 위해 동일한 사이즈의 입력 이미지가 필요하기에, Image crop(이미지 자르기)과 wrap(이미지 찌그러트림)를 사용하여 입력 이미지 사이즈를 맞춰줍니다. 3. CNN 네트워크로 feature를 추출하여 Region에 대하여 각각 어떤 클래.. 2021. 4. 25. 이전 1 2 3 다음