<content>
- train / dev / test split
- train / test dataset์ ๋ถํฌ
- bias / variance
- basic recipe for machine learning
1. Train / Dev / Test sets
- ํ์ต์ ์งํํ๋ ๋ฐ ์์ด ์ ์ฒด ๋ฐ์ดํฐ์ ์ train / dev(validation) / test dataset์ผ๋ก ๋ถ๋ฆฌํ๋ค
- train dataset
- ํ์ตํ๋ ๋ฐ ์ฌ์ฉ
- dev dataset
- ํ์ต ๋ชจ๋ธ์ ํ๊ฐํ๋ bias๊ฐ ์กด์ฌํ๋ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ๋ค.
- test dataset
- ํ์ต ๋ชจ๋ธ์ ํ๊ฐํ๋ bias๊ฐ ์กด์ฌํ์ง ์๋ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํด์ค๋ค
- ์ ํต์ ์ผ๋ก train : dev : test = 0.6 : 0.2 : 0.2 ์ ๋์ ๋น์จ์ผ๋ก ๋ถํ ํ์ง๋ง,
- ๋ฐ์ดํฐ์ ์ ํฌ๊ธฐ๊ฐ ํฌ๋ค๋ฉด ์ด๋ฌํ ๋น์จ๋ก ์ค์ ํ ํ์๋ ์๋ค.
- valid / test ๋ชจ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ฏ๋ก ๋ฐ์ดํฐ๊ฐ ๋ง์ ๊ฒฝ์ฐ 0.98 : 0.01 : 0.01์ผ๋ก ๋๋ ๋ ๋๋ค.
2. train / test dataset์ ๋ถํฌ
- train dataset๊ณผ test dataset์ ๋ถํฌ๊ฐ ๋ค๋ฅธ ๊ฒ์ ๊ด์ฐฎ๋ค.
- ํ์ง๋ง validation set๊ณผ test set์ ๋ถํฌ๋ ๋์ผํด์ผ ํ๋ค.
3. bias / variance
- โญ optimal model ํน์ base model๊ณผ์ train cost์ ์ฐจ๊ฐ ํฐ ๊ฒฝ์ฐ bias๊ฐ ํฌ๋ค๊ณ ๋งํ๊ณ (under-fitting),
- โญ train cost์ valid cost์ ์ฐจ๊ฐ ํฐ ๊ฒฝ์ฐ variance๊ฐ ํฌ๋ค๊ณ ๋งํ๋ค (over-fitting).
- ์ฐ๋ฆฌ์ ๋ชฉ์ ์ bias๋ ์ค์ด๊ณ , variance๋ ์ค์ด๋ ๊ฒ์ด๋ค!
- ๊ณผ๊ฑฐ์๋ bias์ variance ์ฌ์ด trade-off ๊ด๊ณ๊ฐ ์กด์ฌํ๋ค๊ณ ํ์์ผ๋,๋ฅ๋ฌ๋์์๋ ์ด๋ฌํ ๊ด๊ณ๊ฐ ๊นจ์ง๊ณ ์๋ค.
๊น์ layer์ ๋ง์ ๋ฐ์ดํฐ๊ฐ ์กด์ฌํ๋ค๋ฉด bias์ variance ๋ชจ๋ ๋ฎ์ถ ์ ์๋ค๊ณ ํ๋ค.
์ด๊ฒ์ด ๋ฅ๋ฌ๋์ด ์ฌ๋๋ฐ๋ ์ด์ ์ค ํ๋๊ฐ ์๋๊น
4. basic recipe for machine learning
- ML ํ์ต์ ์งํํ๋ ๋ฐ ์์ด ๊ธฐ๋ณธ์ ์ธ ํ์ด ์๋ค.
- 1. bias๊ฐ ๋์๊ฐ?(=underfitting)
- bias๋ฅผ ์ค์ด๋ ๋ฐ ์ง์คํ๋ค.
- ์๋ก์ด ์ํคํ ์ณ / layer ์ฆ๊ฐ / ๋ ๋ง์ iteration ์ ์๋ํด๋ณด๋ผ.
- 2. bias๋ ์์ง๋ง, variance๊ฐ ํฐ ๊ฐ?(=overfitting)
- ์ด์ ๋ variance๋ฅผ ์ค์ด๋ ๋ฐ ์ง์คํ๋ค.
- ์๋ก์ด ์ํคํ ์ณ / ๋ฐ์ดํฐ ์ถ๊ฐ / ์ ๊ทํ๋ฅผ ์๋ํด๋ณด๋ผ.
'๐ > Coursera_DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
WEEK3 : weight initialization (๊ฐ์ค์น ์ด๊ธฐํ) (0) | 2020.12.19 |
---|---|
WEEK3 : normalizing input (์ ๋ ฅ ์ ๊ทํ) (0) | 2020.12.19 |
WEEK3 : regularization (์ ๊ทํ) (0) | 2020.12.19 |
WEEK2 : activation function (ํ์ฑํํจ์) (0) | 2020.12.18 |
WEEK1 : introduction to Neural Network (0) | 2020.10.20 |