WEEK7 : RNN

2020. 12. 25. 01:44

RNN

shared parameter 이용
이전 time step의 정보를 활용할 수 있다.
- 앞의 time step을 이용하기 위해서는 bidirectional RNN을 사용해야 한다.

$$ a^{<t>} = g(W_{hh}a^{<t-1>} + W_{hx}x^{<t>}+b_h) $$

$$ = g(W_h[a^{<t-1>}, x^{<t>}]+b_h) $$

$$ o^{<t>} = g(W_{oh}a^{<t>}+b_o) $$

$$ L(\hat y, y) = \sum_{t=1}^{T_y} L(\hat y^{<t>}, y^{<t>}) $$

(보충 필요)

one to one
one to many
- image captioning
many to one
- sentiment classification
many to many
- input sequence의 길이 == output sequence의 길이
  - sequence labeling (개체명인식, 띄어쓰기, 품사 부착, 형태소 분리)
- input sequence의 길이 != output sequence의 길이
  - 기계 번역