Data Analysis for Investment & Control

ReLU(Rectified Linear Unit) 본문

MachineLearning/Classification

ReLU(Rectified Linear Unit)

아슈람 2018. 9. 14. 01:11
반응형



CNN의 발전 과정에 있으면서 Deep Neural Network의 Weight Update의 Vanishing/Exploding 이슈를 해결할 목적으로 도입된 Activation Function의 한 종류이다. 


Sigmoid나 Hyperbolic Tangent와 달리 |x| 가 큰 값일 경우에 미분 값이 0으로 수렴하는 단점이 없고 수식 구현이 간단하기 때문에 많이 사용된다.


수식은 다음과 같으며,



위의 함수를 그래프로 표시하면 아래와 같다.





Geoffrey E. Hinton 교수에 의해 제안되었다고 알려져 있으며 다음은 그 내용이 수록된 논문이다. 


Rectified linear units improve restricted boltzmann machines.pdf


반응형
Comments