본문 바로가기

2020/01

(10)
갈아먹는 Pose Estimation [2] Joint training of a convolutional network and a graphical model for human pose estimation 들어가며 이전 리뷰에서 Deep Pose를 알아보았습니다. 이를 기점으로 딥러닝을 활용한 Pose Estimation 연구들이 활발히 진행되었습니다. Deep Pose가 입력 이미지에서 곧바로 관절 좌표를 추론하는 리그레션 문제로 접근했다면 이 논문은 heatmap을 추출하여 관절의 위치를 추론하는 기법을 제안합니다. 이를 통해서 성능과 속도 모두 향상시켰다고 하니 한번 알아볼 필요가 있겠죠? 영향력: 인용 횟수가 900회에 달하며 현재 구글의 시니어 리서쳐로 있는 Jonathon Thomson이 1 저자입니다. 주요 기여: Pose Estimation 분야에서 heatmap을 활용하는 방법을 제시하였으며, 이후에 등장한 논문들에서 많이 사용하였습니다. 핵심 아이디어 제목에서 추측할 수 있듯이 이 논문의..
갈아먹는 Pose Estimation [1] DeepPose: Human Pose Estimation via Deep Neural Networks 들어가며 오늘 리뷰할 논문은 Pose Estimation 분야에 최초로 딥 러닝을 적용한 Deep Pose 논문입니다. 본격적으로 딥 러닝을 이용한 포즈 에스티메이션의 포문을 열었으며, 당시만하더라도 딥 러닝을 클래시피케이션에만 사용하였는데, 리그레션 문제에도 훌륭하게 적용할 수 있다는 것을 보여준 논문입니다. 영향력: 구글에서 나온 페이퍼로 인용 횟수가 1300회에 달합니다. 주요 기여: Pose Estimation 분야에 최초로 딥 러닝을 적용하여 state of the art를 달성하였습니다. Deep Learning Model for Pose Estimation 컴퓨터 비젼 분야에서 CNN이 워낙 뛰어난 성능을 내는 것은 잘 알려져 있지만, Pose Estimation 분야에서 특히 CNN이 적합..
갈아먹는 Object Detection [6] SSD: SIngle Shot Multibox Detector 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 갈아먹는 Object Detection [3] Fast R-CNN 갈아먹는 Object Detection [4] Faster R-CNN 갈아먹는 Object Detection [5] Yolo:You Only Look Once 들어가며 오늘 리뷰할 논문은 yolo의 뒤를 잇는 1 Step object detection 알고리즘, SSD입니다. 먼저 결과부터 보시죠. Yolo는 속도 측면에서 당시 Faster R-CNN이 7FPS이었던 것을 45FPS까지 끌어올리는 비약적인 발전을 이루었습니다. 하지만 정확도 측면에선 다소 한계점이 있었습니..
갈아먹는 Object Detection [5] Yolo: You Only Look Once 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 갈아먹는 Object Detection [3] Fast R-CNN 갈아먹는 Object Detection [4] Faster R-CNN 들어가며 오늘 리뷰할 논문은 real time object detection의 혁명을 몰고 온 yolo입니다. 우선 결과부터 보시죠. Yolo는 2015년에 나온 논문으로 Faster R-CNN에 비하여 부려 6배 가량 빠른 속도를 보입니다. 정확도는 비록 조금 낮다 하더라고 정말 비약적인 발전이라 할 수 있네요! 영향력: Joseph Redmon라는 사람이 1 저자이며 R-CNN의 Ross가 3 저자로..
갈아먹는 Semantic Segmentation [1] Fully Convolutional Network 들어가며 이번에 리뷰해 볼 논문은 Fully Convolutional Network[1]입니다.(이하 FCN) 이전까지 Semantic Segmentation 분야에서는 각 픽셀 별로 일정한 Bouding Box 크기 만큼 Classification을 적용하여 해당 픽셀의 종류를 추론하는 비효율적인 방식의 접근들이 있었습니다. 하지만 이 논문은 Fully Connected Layer 대신 1x1 컨볼루션을 사용하여 연산량을 획기적으로 줄였고, Segmentation의 퀄리티까지 높이는 성과를 내었습니다. 이 기법은 이후 많은 논문들에서 사용되면서 컴퓨터 비젼 분야 전체에 영향을 주었습니다. 그럼 시작해보겠습니다! 영향력: 인용 횟수가 약 14000회에 달하며, 다른 컴퓨터 비젼 분야의 접근들에게도 많은 ..
갈아먹는 Object Detection [4] Faster R-CNN 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 갈아먹는 Object Detection [3] Fast R-CNN 들어가며 Fast-RCNN에 이어서 오늘은 Faster R-CNN[1]을 리뷰해보도록 하겠습니다. 본격적으로 Real Time Object Detection의 포문을 연 논문이라고 할 수 있겠습니다. Mask R-CNN이 남긴 했지만 그동안 열심히 리뷰해오던 R-CNN Object Detection의 마지막 논문이라니 좀 시원 섭섭하네요. 아무튼, 시작해보겠습니다! 영향력: SPPNet의 Kaming He와 R-CNN 창시자인 Ross가 각각 2저자 3저자로 참여했으며, ..
갈아먹는 Face Detection [1] MTCNN 들어가며 이번에는 CNN을 활용하여 얼굴 검출 분야에서 정확도와 성능을 끌어올린 MTCNN[1] 논문을 리뷰해보도록 하겠습니다. 얼굴 검출 분야에서 높은 성능과 빠른 속도를 보여주어 아직도 많은 논문들과 프로젝트들에서 사용됩니다. 페이퍼 자체는 5쪽 밖에 되어 처음에는 좋아했으나 ㅎㅎ 생략되어 있는 부분이 많아서 오히려 더 고생한 기억이 납니다. 빠진 부분은 소스 코드 구현체[2]를 참고하거나 블로그 포스팅 등을 참고했으며, 약간의 상상력을 보탰습니다. 그럼 시작하겠습니다! 영향력: CNN을 이용해서 얼굴 검출 정확도를 95% 수준까지 끌어올렸으며 약 1300회 인용되었습니다. 주요 기여: face detection, bounding box regression, face alignment 세 가지 테스크..
갈아먹는 Object Detection [3] Fast R-CNN 지난 글 갈아먹는 Object Detection [1] R-CNN 갈아먹는 Object Detection [2] Spatial Pyramid Pooling Network 들어가며 지난 시간 SPPNet에 이어서 오늘은 Fast R-CNN[1]을 리뷰해보도록 하겠습니다. 저 역시 그랬고, 많은 분들이 R-CNN 다음으로 Fast R-CNN 논문을 보시는데요, 해당 논문을 보다 보면 SPPNet에서 많은 부분들을 참고한 것을 확인할 수 있습니다. 특히나 핵심인 Spatial Pyramid Pooling은 중요한 개념이므로 리뷰하고 넘어가도록 하겠습니다. 영향력: R-CNN 저자인 Ross가 1 저자로 인용 횟수만 8000회에 달합니다. 주요 기여: CNN fine tuning, boundnig box reg..