TIL
by luis lee
모두의 코드
예외 처리부분을 다 들었고 포스팅 작업중이다. 또한 Rvalue에 대해서도 심도있게 봤다. rvalue자체는 c++11 부터 나온개념이라고 하는데 아직 완벽한 이해가 되지 않은 상태이기 때문에 조금더 검색이 필요할듯 하다. rvalue에 대한 포스팅도 진행하면 좋을 듯 하다. 예외처리를 빠르게 내일 처리하도록해야겟다.
딥러닝
김성 교수님의 exercise 공부를 했다. mnist 예제에서 퍼셉트론 하나로 처리하던 것을 deep nn 으로 구현하는 과제였는데
레이어를 늘려서 수행한 결과 15 epoch , batch size 100 의 예제에서 정확도가 80% 에서 95%까지 향상되는 것을 볼 수 있었다.
그런데 구현도중 tensorflow의 cross entropy api 를 사용하지 않고 cost를 구한 결과 nan 으로 결과가 나오는 것을 확인했다.
activation function으로 relu를 사용했을때 그렇게 나왔다. 디버깅 결과 당연하게도 weight에 의해서 log를 취하는 부분이 0 이하의 값이 되어버려서
Log에서 문제가 발생한 듯 하다.
그런데 tensorflow의 cross entropy api 를 사용했을때는 아무 문제가 없었다. 이 부분에 대해서는 조금더 검색이 필요할 듯 하다.
그리고 또다른 exercise로 tensorboard 를 사용하는 법을 익혔는데 이는 tensorflow tutorial 영상에서 봐뒀던 부분이라 문제없이 확인할 수 있었다.
이번에는 cost값을 위주로 plot해보았고 예제를 처리해가며 namespace설정과 다른 부분도 plot해보려고 해야겠다.
결국 이번 exercise를 통해서 느낀게 layer를 늘리는 것은 아무 문제가 안된다고 생각했다. 대신에 어떤 activation function을 선택하느냐,
어느정도의 batchsize, learning rate 로 설정하느냐에 따라 결과가 매우 유동적으로 바뀐다는 것을 알았다. 이에대한
감각을 늘리는 것도 중요할 것 같다.
논문 실험
논문에 쓰일 project file 정리를 마쳣다. self collision많은 것과 hanging , 일반적인 예제 2개 해서 총 4개의 project를 선택했으며, SSOR, incomplete Cholesky 에 대한 구현도 생각해봐야겠다.
deep learning for graph 논문
지금 현재 읽고있는 상태이며 이번주 내로 다 읽고 정리하는 글을 작성해야겠다.
theme 이사
Jekyll theme 가 맘에 안들어서 (특히 syntax 하이라이트가) 이사했다
딥러닝 예제를 풀어보며 흥미를 느꼇고 이를 계속 끌고가도록 해야겠다. 추가로 virtual env 를 사용해서 진행하는 법을 익혔다.
Subscribe via RSS