Bi-directional RNN (양방향 RNN)

image.png

Deep Bi-directional RNN

image.png

하지만 이런 Bi-directional RNN이 Language Model 수행을 잘 할 수있을까요?

→ NO

Train할 때는 과거의 데이터와 미래의 데이터가 주어진 채로 추론하는 것을 학습하지만,

Test할 때는 과거의 데이터만을 갖고 다음 단어가 어떤 것이 나올 것인가 추론을 해야하기 때문에,

성능이 좋지 않게 나온다.

따라서, Train과 Test 학습 구조는 비슷해야한다.

RNN은 문제가 없을까?

이에 대한 해결책으로 Truncated BPTT (잘라진 Backpropagation Through Time)