관리 메뉴

Data Analysis for Investment & Control

ReLU(Rectified Linear Unit) 본문

MachineLearning/Classification

ReLU(Rectified Linear Unit)

Jeongseob.Kim 2018. 9. 14. 01:11



CNN의 발전 과정에 있으면서 Deep Neural Network의 Weight Update의 Vanishing/Exploding 이슈를 해결할 목적으로 도입된 Activation Function의 한 종류이다. 


Sigmoid나 Hyperbolic Tangent와 달리 |x| 가 큰 값일 경우에 미분 값이 0으로 수렴하는 단점이 없고 수식 구현이 간단하기 때문에 많이 사용된다.


수식은 다음과 같으며,



위의 함수를 그래프로 표시하면 아래와 같다.





Geoffrey E. Hinton 교수에 의해 제안되었다고 알려져 있으며 다음은 그 내용이 수록된 논문이다. 


Rectified linear units improve restricted boltzmann machines.pdf


'MachineLearning > Classification' 카테고리의 다른 글

ReLU(Rectified Linear Unit)  (0) 2018.09.14
RNN, Recurrent Neural Network과 LSTM  (0) 2018.08.28
CNN, Convolution Neural Network (가이드)  (0) 2018.08.28
      
Tag
,
0 Comments
댓글쓰기 폼