CS/CS231N (2017)

CS/CS231N (2017)

[cs231n] lec14 - Reinforcement Learning

이전 강의 Supervised Learning (Classification) Unsupervised Learning (GAN ...) Reinforcement Learning: agent의 보상을 최대화할 수 있는 행동이 무엇인지 학습 Agent: 환경(enviroment)에서 행위(action)를 하는 주체, 행위에 따라 보상(rewards)을 받는다. Overview Reinforcement Learning? Markov Decision Precesses Q-Learning Policy Gradients Reinforcement Learning Reinforcement에는 agent, environment 존재 environment가 agent에게 state을 제공 agent가 action을 취함 해..

CS/CS231N (2017)

[cs231n] Lec12 - Visualizing and Understanding

Overview CNN을 이해하기 위한 다양한 레벨에서의 시각화 방법을 살펴본다. Activation map: Nearest neighbors, Dimensionality resuction, maximal patches, occlusion Gradient: Saliency maps, class visualization, fooling images, feature inversion Fun application: DeepDream, Style transfer Visualize Filters/kernels CNN은 입력에 대해 어떻게 동작할까? First Layer: Visualize Filters First layer는 입력과 바로 닿아있기 때문에, fist layer의 filter를 시각화하면 이 필터가 ..

CS/CS231N (2017)

[cs231n] Lec13 - Generative models

Overview Unsupervised Learning Generative models: PixelRNN and CNN, VAE, GAN Unsupervised Learning (비지도 학습) label 없이 학습 데이터만으로 데이터에 숨어있는 구조를 학습하는 방법 ex) Clustering, dimensionality reduction, feature learning(Autoencoders), density estimation Supervised learning Unsupervised learning Data x: data, y: label just data Goal x->y로 맵핑하는 함수를 학습 데이터에 숨겨진 구조를 학습 Example classification, regression, object..

yooja_tea
'CS/CS231N (2017)' 카테고리의 글 목록