SMATORE
강화학습 첫걸음:텐서플로로 살펴보는 Q 러닝 MDP DQN A3C 강화학습 알고리즘, 한빛미디어 | 스마토어