Application of NN and RNN

image.png

RNN의 응용

One to One: 단어 하나가 들어가면 다음 단어는 어떻게 예측하지? or 이미지 한 장 들어가면 해당 이미지는 어떤 클래스인가?

One to Many: 이미지가 하나 들어가면, 이미지에 대한 설명이 들어간 문장을 출력한다.

Many to One: 문장 분류 (문장 (단어 여러개)를 보고 어떤 문장인지 분류하는 것)

Many to Many: 번역 Translation : 영어 문장이 입력돼서 한국 문장으로 나오는 Task

Many to Many version 2: 비디오 프레임마다 예측 , 어떤 클래스를 가지고 있는지

Many to Many and Decoding

image.png

어떤 단어를 내뱉을지 Softmax함수를 통해서 Voca를 내뱉게 된다.

그렇다면 처음에 내뱉은 단어를 통해서 다음 값은 어떻게 내뱉어내야하는가???

이에 대한 방법들은

  1. Ancestral sampling
  2. Greedy Search
  3. Exhaustive Search
  4. Beam Search

등이 있다.