<content>
- ์๋ฌ ๋ถ์ -> ์ด๋ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํด์ผ ์ฑ๋ฅํฅ์์ ๊ฐ์ฅ ํฐ ๋์์ด ๋ ์ง๋ฅผ ํ์
- ์๋ชป๋ ๋ฐ์ดํฐ ์์ ํ๊ธฐ
- ๋นจ๋ฆฌ ๋ชจ๋ธ ๊ตฌ์ถํ๊ณ , bias/variace ๋ถ์ & ์๋ฌ ๋ถ์ ์งํํ๊ณ ๊ฐ์ ํ๋ผ.
1. error analysis
- dev set์์ ์ค๋ถ๋ฅ๋ 100๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๋ค.
- 100๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ค.
- โญ ์ด๋ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ด ์ฑ๋ฅํฅ์์ ๊ฐ์ฅ ํฐ ๋์์ด ๋ ์ง๋ฅผ ๋ถ์ํ๋ผ
์) ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฌธ์
- ํ์ฌ ๋ถ๋ฅ ๋ชจ๋ธ์ ์ ํ๋ 95%
- 1) ์ค๋ถ๋ฅ๋ 100๊ฐ ์ด๋ฏธ์ง ์ค ๊ฐ์์ง ์ฌ์ง์ด 5์ฅ
- ๊ฐ์์ง ์ฌ์ง ํ์ตํ์ ๋ ์ฑ๋ฅ์ ์ต๋์น๋ 95% + 5*(5/100)% = 95.25%
- 2) ์ค๋ถ๋ฅ๋ 100๊ฐ ์ด๋ฏธ์ง ์ค ๊ฐ์์ง ์ฌ์ง์ด 50์ฅ
- ๊ฐ์์ง ์ฌ์ง ํ์ตํ์ ๋ ์ฑ๋ฅ์ ์ต๋์น๋ 95% + 5*(50/100)% = 97.5%
์) ์๋ฌ ๋ถ์ ๋ํ ์์ฑํ๊ธฐ
image | dog | great cats | blurry | comment |
1 | โ | ๊ฐ์์ง ์ฌ์ง ์ค๋ถ๋ฅ | ||
2 | โ | ํ๋ฆฟํด์ ์๋ชป ๋ถ๋ฅ | ||
3 | โ | โ | great cats ํ๋ฆฟํด์ ์ค๋ถ๋ฅ | |
... | ... | |||
100 | โ | โ | ๊ฐ์์ง ํ๋ฆฟํด์ ์ค๋ถ๋ฅ | |
% of total | 8% | 43% | 61% |
โญ ์ด๋ฌํ ์ํฉ์์๋ blurryํ ์ด๋ฏธ์ง๋ฅผ ์๋ชป ์๋ณํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ด ์ฑ๋ฅํฅ์์ ํจ์จ์ ์ด๋ค.
2. ์๋ชป๋ ๋ฐ์ดํฐ ์์ ํ๊ธฐ
- training set์์์ ์๋ชป๋ ๋ฐ์ดํฐ
- deep learning ์๊ณ ๋ฆฌ์ฆ์ training set์ ์กด์ฌํ๋ random error์ ๋ํด์๋ ๊ฝค ๋๊ฐํ๋ค.
- ๋ฐ๋ผ์ ๊ตณ์ด ์์ ํ ํ์ ์๋ค. (์์ ํ๋ฉด ๋ ์ข๊ธด ํ์ง๋ง)
- ํ์ง๋ง systematic error์ ๋ํด์๋ ๋ฏผ๊ฐํ๊ธฐ ๋๋ฌธ์ ์ด๋ ๊ฒ ์๋ชป ๋ผ๋ฒจ์ด ๋ถ์ฌ๋ ๊ฒฝ์ฐ์๋ ์์
- test/dev set์์์ ์๋ชป๋ ๋ฐ์ดํฐ
- ๋ผ๋ฒจ์ ์ฌ๋ฐ๋ฅด๊ฒ ์์ ํ ์ง ๋ง ์ง ๊ฒฐ์ ํ๊ธฐ ์ํด์๋ ๋ค์ 3๊ฐ์ง๋ฅผ ํ์ธํด๋ณด์๋ผ
- 1. ์ ์ฒด์ ์ธ dev set error
- 2. ์๋ชป๋ label๋ก ์ธํด ๋ฐ์ํ ์๋ฌ
- 3. ๋ค๋ฅธ ์์ธ์ผ๋ก ๋ฐ์ํ ์๋ฌ
- ๋ง์ฝ, validation dataset์ ์กด์ฌํ๋ ์๋ชป ๋ถ์ฐฉ๋ label์ ์์ ํ๋ ๊ฒฝ์ฐ ๋ค์์ ๊ณ ๋ คํ๋ผ.
- 1) dev set๊ณผ test set ๋ชจ๋์ ๋์ผํ๊ฒ error correcting ์์
์ ์ํํด์ฃผ์ด์ผ ํ๋ค.
- dev set์์ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๋ฉด test set์์๋ ์ผ๋ฐํ๊ฐ ๋์ด์ผ ํ๋๋ฐ,
dev set๊ณผ test set์ ๋ถํฌ๊ฐ ๋ค๋ฅด๋ฉด ์ผ๋ฐํ๋ ์ ์๋ค.
๋ฐ๋ผ์ dev set๊ณผ test set์ ๋ถํฌ๋ ๋์ผํด์ผ ํ๋ค.
- dev set์์ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๋ฉด test set์์๋ ์ผ๋ฐํ๊ฐ ๋์ด์ผ ํ๋๋ฐ,
- 2) ๋ชจ๋ธ์ด ํ๋ฆฐ ๋ฐ์ดํฐ ๋ฟ๋ง ์๋๋ผ, ๋ง์ถ ๋ฐ์ดํฐ ๋ํ ๋ค์ ์ ๊ฒํด๋ณด์๋ผ.
- ๋ผ๋ฒจ์ด ์๋ชป ๋ถ์ฐฉ๋์ด ํ๋ฆฐ ๊ฒฝ์ฐ
- ๋ผ๋ฒจ์ด ์๋ชป ๋ถ์ฐฉ๋์ด ๋ง์ ๊ฒฝ์ฐ ๋ชจ๋ ๋ถ์ํด์ผ ํ๋ค.
- ๊ทธ๋ ์ง ์์ผ๋ฉด bias๊ฐ ๋ฐ์ํ ์ ์๋ค.
- 1) dev set๊ณผ test set ๋ชจ๋์ ๋์ผํ๊ฒ error correcting ์์
์ ์ํํด์ฃผ์ด์ผ ํ๋ค.
- ๋ผ๋ฒจ์ ์ฌ๋ฐ๋ฅด๊ฒ ์์ ํ ์ง ๋ง ์ง ๊ฒฐ์ ํ๊ธฐ ์ํด์๋ ๋ค์ 3๊ฐ์ง๋ฅผ ํ์ธํด๋ณด์๋ผ
์์1)
- 1. ์ ์ฒด์ ์ธ dev set error ex) 10%
- 2. ์๋ชป๋ label๋ก ์ธํด ๋ฐ์ํ ์๋ฌ ex) 100๊ฐ์ ์ด๋ฏธ์ง ์ค 6๊ฐ -> 10*0.06(%)= 0.6%
- 3. ๋ค๋ฅธ ์์ธ์ผ๋ก ๋ฐ์ํ ์๋ฌ ex) 9.4%
- ์ด ๊ฒฝ์ฐ ์๋ชป๋ label๋ก ์ธํด ๋ฐ์ํ ์๋ฌ๋ณด๋ค ๋ค๋ฅธ ์์ธ์ผ๋ก ๋ฐ์ํ ์๋ฌ๊ฐ ๋ ํฌ๊ธฐ ๋๋ฌธ์
label์ ๊ณ ์น๋ ๊ฒ๋ณด๋ค, ๋ค๋ฅธ ์์ธ์ผ๋ก ๋ฐ์ํ ์๋ฌ๋ฅผ ์ค์ด๋ ๋ฐ ์๊ฐ์ ์ฌ์ฉํ๋ ๊ฒ์ด ๋ ํจ์จ์ ์ด๋ค.
์์2)
- 1. ์ ์ฒด์ ์ธ dev set error ex) 2%
- 2. ์๋ชป๋ label๋ก ์ธํด ๋ฐ์ํ ์๋ฌ ex) 0.6%
- 3. ๋ค๋ฅธ ์์ธ์ผ๋ก ๋ฐ์ํ ์๋ฌ ex) 1.4%
- ์ค๋ฅ ์ค ์๋ชป๋ labe๋ก ์ธํด ๋ฐ์ํ ์ค๋ฅ์ ๋น์ค์ด 30%์ด๋ฏ๋ก
์ด์ ๋ dev set์์ ํ๋ฆฐ label์ ์์ ํ๋ ์์ ์ด ๊ฐ์ด์น ์์ ์ ์๋ค.
์์3)
- ๋ชจ๋ธ A์ ์๋ฌ์จ : 2.1%
- ๋ชจ๋ธ B์ ์๋ฌ์จ : 1.9%
- ์๋ชป๋ ๋ผ๋ฒจ๋ก ์ธํด ๋ฐ์ํ ์๋ฌ 0.6%
- ๋ชจ๋ธ B๊ฐ A๋ณด๋ค ๋ ๋ซ๋ค๊ณ ํ์ ํ ์ ์๊ธฐ ๋๋ฌธ์ validation score๊ฐ ๋ชจ๋ธ์ ํ๊ฐํ๋๋ฐ ์ ์ฉํ์ง ์๋ค.
๋ฐ๋ผ์ validation set์ ์กด์ฌํ๋ ์๋ชป๋ label์ ์์ ํด์ผ ํ๋ค.
3. ๋ชจ๋ธ์ ๋นจ๋ฆฌ ๊ตฌ์ถํ๊ณ , ํ์ตํด๋ณด์๋ผ.
- dev/test set๊ณผ ํ๊ฐ์งํ๋ฅผ ์ค์ ํ๋ผ.
- ์ด๊ธฐ ๋ชจ๋ธ์ ๋นจ๋ฆฌ ๊ตฌ์ถํ๋ผ.
- bias/variance ๋ถ์ & error ๋ถ์ํ์ฌ ๊ฐ์ ์ฌํญ์ ํ์ ํ๊ณ , ๊ฐ์ ํ๋ผ.
'๐ > Coursera_DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
WEEK5 : Transfer Learning (0) | 2020.12.20 |
---|---|
WEEK5 : traning set๊ณผ dev/test set์ ๋ถ์ผ์น (0) | 2020.12.20 |
WEEK5 : avoidable bias & variance ๋น๊ต๋ฅผ ํตํ ์ ๋ต ์ธ์ฐ๊ธฐ (0) | 2020.12.20 |
WEEK5 : ML ๋ชจ๋ธ์ ๋ชฉํ ์ค์ ํ๊ณ ๋ฌ์ฑํ๊ธฐ (0) | 2020.12.20 |
WEEK5 : Machine Learning Strategy (0) | 2020.12.20 |