1. training set๊ณผ test set์ด ๋ค๋ฅธ ๊ฒฝ์ฐ
- ๋ ๊ฐ์ง์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ค.
- ์นํ์ด์ง์ ๋ฐ์ดํฐ 200,000์ฅ (๊ณ ํ์ง, ํ๋กํ์ ๋ํ ์ฌ์ง)
- ๋ชจ๋ฐ์ผ์ฑ์ ๋ฐ์ดํฐ 10,000์ฅ (์ ํ์ง, ์๋ง์ถ์ด์ ์ฌ์ง)
- ์ค์ ์๋น์ค๋ฅผ ์ ๊ณตํ๊ณ ์ ํ๋ ๋์์ ๋ชจ๋ฐ์ผ ์ฑ์ ์๋ง์ถ์ด ์ฌ์ง๊ฐ๋ถ๋ค์ด๋ค.
- ์ด๋ฌํ ๊ฒฝ์ฐ train / test set์ ๊ตฌ์ถ?
- ๋ฐฉ๋ฒ1 : randomly shuffle & split
- ์ฅ์ : train / test ๋ชจ๋ ๋์ผํ ๋ถํฌ๋ฅผ ์ง๋๋ค.
- ๋จ์ : dev๊ฐ ๊ด์ฌ์๋ app์์์ ์ด๋ฏธ์ง๋ณด๋ค ์นํ์ด์ง ์ด๋ฏธ์ง์ ๋น์ค์ด ๋๋ค. ๐
- ์ถ์ฒํ์ง ์๋ ๋ฐฉ๋ฒ
- ๋ฐฉ๋ฒ2 : training์ web image + mobile ์ผ๋ถ / test๋ mobile
- ์ฅ์ : ์ค์ ๋์ํ๊ธธ ์ํ๋ ํ๊ฒฝ๊ณผ ์ ์ฌํ๊ฒ test set์ ๊ตฌ์ถ
- ๋จ์ : training set์ ๋ถํฌ์ dev/test set์ ๋ถํฌ์ ๋ค๋ฅด๋ค.
- ์ด๋ ๊ฒ ๊ตฌ์ฑํ๊ธฐ๋ฅผ ์ถ์ฒ ๐
- ๋ฐฉ๋ฒ1 : randomly shuffle & split
2. train / test ๋ฐ์ดํฐ์ ๋ถํฌ๊ฐ ๋ค๋ฅผ ๋ bias/variance
- ์๋ฌ์จ
- bayes optimal error = 0%
- training error = 1%
- dev error = 10%
- training set๊ณผ dev set์ ์ฐจ์ด๋ 1๊ฐ๊ฐ ์๋๋ค! โญ
- 2๊ฐ์ง๊ฐ ๋์์ ๋ฐ๋์๋ค
- 1) training set์ ๋ณด์์ง๋ง, dev set์ ํ์ตํ ๋ ๋ณด์ง ๋ชป ํ๋ค
- 2) training set๊ณผ dev set์ ๋ถํฌ๊ฐ ๋ค๋ฅด๋ค.
- ๋ฌธ์ ์ ์์ธ (training set๊ณผ dev set์ ์ฐจ์ด์ ์ด 1๊ฐ๊ฐ ์๋๊ธฐ ๋๋ฌธ์ ์์ธ์ด 1๊ฐ๊ฐ ์๋๋ค)
- ์์ธ1. training set์ over-fitting (variance)
- ์์ธ2. train์ ๋ถํฌ์ dev์ ๋ถํฌ๊ฐ ๋ค๋ฅด๋ค (data-mistach)
- training error์ dev error ์ฌ์ด์ ํฐ ์ฐจ์ด๊ฐ ๋ํ๋๋ ์์ธ์ ํ์
ํ๊ธฐ ํ๋ค๋ค.
- training-dev set์ ๋ง๋ค์!
- training-dev set
- โญ tranining set๊ณผ ๋์ผํ ๋ถํฌ๋ฅผ ๊ฐ์ง๋ ๋ฐ์ดํฐ์ ์ด์ง๋ง, ํ์ต์๋ ์ฌ์ฉ๋์ง ์๋ ๋ฐ์ดํฐ
์1)
- training error = 1%
- training-dev error = 9%
- dev error = 10%
- -> variance๊ฐ ๋ฌธ์ ์ด๋ค.
์2)
- training error = 1%
- training-dev error = 1.5%
- dev error = 10%
- -> train / dev ์ฌ์ด ๋ค๋ฅธ ๋ถํฌ๊ฐ ๋ฌธ์ ์ด๋ค (=data mismatch)
์3)
- human error = 0%
- training error = 10%
- training-dev error = 11%
- dev error = 12%
- -> avoidable bias๊ฐ ๋ฌธ์ ์ด๋ค
์4)
- human error = 0%
- training error = 10%
- training-dev error = 11%
- dev error = 20%
- -> bias ๋ฌธ์ + train / dev ์ฌ์ด ๋ค๋ฅธ ๋ถํฌ๊ฐ ๋ฌธ์
3. data mismatch ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ๋ฒ
- ์๋ฌ ๋ถ์ ์ํ
- training set๊ณผ dev/test set ์ฐจ์ด์ ์ ๋ํด์ ์ดํดํ๋ค.
- dev/test set๊ณผ ์ ์ฌํ ๋ฐ์ดํฐ์
์ ์์งํ์ฌ training set์ ์ถ๊ฐํ๋ค.
- ์์์ ์ํํ ์๋ฌ ๋ถ์ ๋ด์ฉ ๊ธฐ๋ฐ์ผ๋ก ๋ค๋ฅธ ๋ฐ์ดํฐ์ ์ถ๊ฐํด๋ณด๊ธฐ
- dev/test set๊ณผ ์ ์ฌํ๋๋ก ๋ฐ์ดํฐ ํฉ์ฑ ์ํ
'๐ > Coursera_DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
WEEK5 : Multi-Task Learning (0) | 2020.12.20 |
---|---|
WEEK5 : Transfer Learning (0) | 2020.12.20 |
WEEK5 : error analysis (์๋ฌ ๋ถ์) (0) | 2020.12.20 |
WEEK5 : avoidable bias & variance ๋น๊ต๋ฅผ ํตํ ์ ๋ต ์ธ์ฐ๊ธฐ (0) | 2020.12.20 |
WEEK5 : ML ๋ชจ๋ธ์ ๋ชฉํ ์ค์ ํ๊ณ ๋ฌ์ฑํ๊ธฐ (0) | 2020.12.20 |