LSTM이 나오게 된 배경은 RNN이 Long Term Memory를 가지지 못하기 때문에 등장하게 되었다.

LSTM은 Hidden Layer를 계산하기 위한 한 가지 다른 방식에 불과하다. 또한 LSTM도 RNN의 일종이며, Gate 개념을 추가하여 Vanishing Gradient Problem 문제 또한 해결하였다.

image.png

RNN구조와 LSTM 구조

Long Short-Term Memory (LSTM)

image.png

LSTM은 다음 3가지의 구성 요소를 가지고 있다.

Forget Gate

image.png

Output Gate

image.png

Variants of LSTM (GRU): Gated Recurrent Unit

image.png