컴퓨터 비전 관련된 논문 리뷰 및 코드 구현
- 최신 논문 위주로, 많은 인기를 끌고 있는 다양한 딥러닝 논문을 소개합니다.
- Histograms of Oriented Gradients for Human Detection(HOG)
- Original Paper Link / Contents / Code Practice
- GradientBased Learning Applied to Document Recognition(LeNet)
- Original Paper Link / Contents /Code Practice
- ImageNet Classification with Deep Convolutional Neural Networks(AlexNet)
- Very Deep Convolution Networks for Large-scale image recognition(VGG)
- Going deeper with convolutions(GoogLeNet)
- Deep Residual Learning for Image Recognition(ResNet)
- Squeeze-and-Excitation Networks(SENet)
- EfficientNet, Rethinking Model Scaling for Convolutional Neural Networks(EfficientNet)
- Original Paper Link / contents / Code Practice
- R-CNN / Fast R-CNN / Faster R-CNN
- YOLO
- Generative Adversarial Networks(GAN)
- Original Paper Link / [contents] / Code Practice
- Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets(InfoGAN)
- Original Paper Link / [contents] / [Code Practice]
- Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks(CycleGAN)
- Original Paper Link / [contents] / [Code Practice]
- PROGRESSIVE GROWING OF GANS FOR IMPROVED QUALITY, STABILITY, AND VARIATION(Progressive Growing of GANS(PGGAN))
- Original Paper Link / [contents] / [Code Practice]
- VAE
- MobileNet-v1.v2.v3
- 이미지와 질문이 주어졌을 때 답을 맞추는 Visual QnA
- Original Paper Link / contents / Code Practice
- 이미지를 설명하는 문장을 만들어내는 Image Captioning
- Original Paper Link / contents / Code Practice
- Neural Image Caption Generation with visual Attention
- Original Paper Link / contents / Code Practice
- Image Captioning with Semantic Attention
- Original Paper Link / contents / Code Practice
ImageNet(large-scale), MNIST, CIFAR dataset MNIST나 CIFAR는 idea에 대한 검증 목적으로 사용
- MNIST: 0부터 9까지의 '28 x 28 손글씨 사진'을 모은 데이터셋 (학습용: 60,000개 / 테스트용: 10,000)
- CIFAR-10: 10개의 클래스로 구분된 '32 x 32 사물 사진'을 모은 데이터셋 (학습용: 50,000개 / 테스트용: 10,000개)
- ImageNet : (Amazon Mechanical Turk) 서비스를 이용하여 일일이 사람이 분류한 데이터셋
overfitting을 극복하는 방법으로는 data augmentation, batch normalization, drop out이 있다. 이를 통해서 얼마나 고쳐지는지 확인한다. code
https://tutorials.pytorch.kr/beginner/basics/optimization_tutorial.html
pytorch에서 제공한 tutorials에서 제공하는 설정을 이용해서 신경망 설계 및 최적화 코드를 반복하여 수행하는 train와 테스트 데이터로 모델의 성능을 측정하는 evaluate를 정의! GPU 설정을 '펭귄브로의 3분 딥러닝, 파이토치맛' 책의 내용을 학습해서 진행하였다.