Skip to content

edoob9/CV

Repository files navigation

Computer Vision

컴퓨터 비전 관련된 논문 리뷰 및 코드 구현

  • 최신 논문 위주로, 많은 인기를 끌고 있는 다양한 딥러닝 논문을 소개합니다.

CV 분야 논문

object detection

  • YOLO

GAN에서 발전한 논문

  • Generative Adversarial Networks(GAN)
  • Interpretable Representation Learning by Information Maximizing Generative Adversarial Nets(InfoGAN)
  • Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks(CycleGAN)
  • PROGRESSIVE GROWING OF GANS FOR IMPROVED QUALITY, STABILITY, AND VARIATION(Progressive Growing of GANS(PGGAN))
  • VAE
  • MobileNet-v1.v2.v3

Image Recognition (이미지 인식)

  • 이미지와 질문이 주어졌을 때 답을 맞추는 Visual QnA
    • Original Paper Link / contents / Code Practice
  • 이미지를 설명하는 문장을 만들어내는 Image Captioning
  • Neural Image Caption Generation with visual Attention
    • Original Paper Link / contents / Code Practice
  • Image Captioning with Semantic Attention

ImageNet(large-scale), MNIST, CIFAR dataset MNIST나 CIFAR는 idea에 대한 검증 목적으로 사용

  • MNIST: 0부터 9까지의 '28 x 28 손글씨 사진'을 모은 데이터셋 (학습용: 60,000개 / 테스트용: 10,000)
  • CIFAR-10: 10개의 클래스로 구분된 '32 x 32 사물 사진'을 모은 데이터셋 (학습용: 50,000개 / 테스트용: 10,000개)
  • ImageNet : (Amazon Mechanical Turk) 서비스를 이용하여 일일이 사람이 분류한 데이터셋

파일 설명

> overfitting을 극복하는 방법

overfitting을 극복하는 방법으로는 data augmentation, batch normalization, drop out이 있다. 이를 통해서 얼마나 고쳐지는지 확인한다. code

> CNN_cifar10.ipynb

https://tutorials.pytorch.kr/beginner/basics/optimization_tutorial.html

pytorch에서 제공한 tutorials에서 제공하는 설정을 이용해서 신경망 설계 및 최적화 코드를 반복하여 수행하는 train와 테스트 데이터로 모델의 성능을 측정하는 evaluate를 정의! GPU 설정을 '펭귄브로의 3분 딥러닝, 파이토치맛' 책의 내용을 학습해서 진행하였다.

About

비전 분야에 대한 학습 및 아이디어를 위한 공간

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published