donghwa-kim.github.io/BLEU.html
Blue๋ ๋ฒ์ญ๋ ๋ฌธ์ฅ์ ํ๊ฐํ๊ธฐ ์ํ ์งํ๋ก,
์ค์ ๋ฒ์ญ ๋ฌธ์ฅ๊ณผ ๊ธฐ๊ณ๊ฐ ๋ฒ์ญํ ๋ฌธ์ฅ๊ณผ์ ์ ์ฌ์ฑ์ ๊ธฐ๋ฐ์ผ๋ก score๋ฅผ ์ฐ์ถํ๋ค.
1. n-gram ๊ธฐ์ค ์ผ๋ง๋ ๊ฒน์น๋ ์ง
- 1-gram, 2-gram, 3-gram, 4-gram ์ด์ฉํ์ฌ ์ค์ ๋ฒ์ญ ๋ฌธ์ฅ๊ณผ ๊ธฐ๊ณ ๋ฒ์ญ ๋ฌธ์ฅ๊ณผ์ ์ ์ฌ์ฑ ๋น๊ต
2. ๊ฐ์ ๋จ์ด๊ฐ ์ฐ์์ ์ผ๋ก ๋์ ์ฑ๋ฅ์ด ๊ณผ๋์ธก์ ๋๋ ๊ฒ์ ๋ง๊ธฐ ์ํ ๋ชฉ์
- ์ค์ ๋ฒ์ญ ๋ฌธ์ฅ : there is a cat on the mat
- ๊ธฐ๊ณ ๋ฒ์ญ ๋ฌธ์ฅ : there there there there is
- 1-gram ๊ธฐ์ค ์ ์ฌ์ฑ์ด 4(=์ผ์นํ๋ ๋จ์ด์ ์)/5(=๊ธฐ๊ณ๋ฒ์ญ ๋ฌธ์ฅ์ ๊ธธ์ด)๋ก ํ๊ฐ๋๋ ๊ฒ์ ๋ง๊ธฐ ์ํจ
3. ์ค์ ๋ฒ์ญ ๋ฌธ์ฅ๊ณผ ๊ธฐ๊ณ ๋ฒ์ญ ๋ฌธ์ฅ๊ณผ์ ๋ฌธ์ฅ ๊ธธ์ด ๋น๊ต
- ์ค์ ๋ฒ์ญ ๋ฌธ์ฅ ๋๋น ๊ธฐ๊ณ ๋ฒ์ญ ๋ฌธ์ฅ์ ๊ธธ์ด๊ฐ ์งง๋ค๋ฉด penalty ๋ถ์ฌ
- ์ค์ ๋ฒ์ญ ๋ฌธ์ฅ ๋๋น ๊ธฐ๊ณ ๋ฒ์ญ ๋ฌธ์ฅ์ ๊ธธ์ด๊ฐ ๊ธธ๋ค๋ฉด ์ด์ ์ ๊ณตํ๋ ๊ฒ X (๊ทธ๋ฅ 1 ๊ณฑํด์ฃผ๊ฒ ๋๋ค)
์ด ์ธ ๊ฐ์ง๋ฅผ ๋ชจ๋ ๊ณ ๋ คํ์ฌ Blue score๊ฐ ์ ์๋๋ค.
์์ธํ ๋ด์ฉ์ ์์ ์ธ๊ธํ ๋ธ๋ก๊ทธ์ ์ ์ ๋ฆฌ๋์ด ์๊ธฐ์ .. !
'๐ > Coursera_DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ฝ์ธ๋ผ Deep Learning ์ ๋ฆฌ (2) | 2020.12.27 |
---|---|
WEEK8 : Attention (0) | 2020.12.27 |
WEEK8 : beam search in language model (0) | 2020.12.27 |
WEEK8 : negative sampling (0) | 2020.12.26 |
WEEK8 : Word Embedding (word2vec) (0) | 2020.12.26 |