<content>

  • ์—๋Ÿฌ ๋ถ„์„ -> ์–ด๋– ํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ด์•ผ ์„ฑ๋Šฅํ–ฅ์ƒ์— ๊ฐ€์žฅ ํฐ ๋„์›€์ด ๋  ์ง€๋ฅผ ํŒŒ์•…
  • ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ •ํ•˜๊ธฐ
  • ๋นจ๋ฆฌ ๋ชจ๋ธ ๊ตฌ์ถ•ํ•˜๊ณ , bias/variace ๋ถ„์„ & ์—๋Ÿฌ ๋ถ„์„ ์ง„ํ–‰ํ•˜๊ณ  ๊ฐœ์„ ํ•˜๋ผ.

1. error analysis

  • dev set์—์„œ ์˜ค๋ถ„๋ฅ˜๋œ 100๊ฐœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•œ๋‹ค.
  • 100๊ฐœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•œ๋‹ค.
  • โญ ์–ด๋– ํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฒƒ์ด ์„ฑ๋Šฅํ–ฅ์ƒ์— ๊ฐ€์žฅ ํฐ ๋„์›€์ด ๋  ์ง€๋ฅผ ๋ถ„์„ํ•˜๋ผ

 

์˜ˆ) ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ๋ฌธ์ œ

  • ํ˜„์žฌ ๋ถ„๋ฅ˜ ๋ชจ๋ธ์˜ ์ •ํ™•๋„ 95%
  • 1) ์˜ค๋ถ„๋ฅ˜๋œ 100๊ฐœ ์ด๋ฏธ์ง€ ์ค‘ ๊ฐ•์•„์ง€ ์‚ฌ์ง„์ด 5์žฅ
    • ๊ฐ•์•„์ง€ ์‚ฌ์ง„ ํ•™์Šตํ–ˆ์„ ๋•Œ ์„ฑ๋Šฅ์˜ ์ตœ๋Œ€์น˜๋Š” 95% + 5*(5/100)% = 95.25%
  • 2) ์˜ค๋ถ„๋ฅ˜๋œ 100๊ฐœ ์ด๋ฏธ์ง€ ์ค‘ ๊ฐ•์•„์ง€ ์‚ฌ์ง„์ด 50์žฅ
    • ๊ฐ•์•„์ง€ ์‚ฌ์ง„ ํ•™์Šตํ–ˆ์„ ๋•Œ ์„ฑ๋Šฅ์˜ ์ตœ๋Œ€์น˜๋Š” 95% + 5*(50/100)% = 97.5%

 

์˜ˆ) ์—๋Ÿฌ ๋ถ„์„ ๋„ํ‘œ ์ž‘์„ฑํ•˜๊ธฐ

image dog great cats blurry comment
1 โœ”     ๊ฐ•์•„์ง€ ์‚ฌ์ง„ ์˜ค๋ถ„๋ฅ˜
2     โœ” ํ๋ฆฟํ•ด์„œ ์ž˜๋ชป ๋ถ„๋ฅ˜
3   โœ” โœ” great cats ํ๋ฆฟํ•ด์„œ ์˜ค๋ถ„๋ฅ˜
...       ...
100 โœ”   โœ” ๊ฐ•์•„์ง€ ํ๋ฆฟํ•ด์„œ ์˜ค๋ถ„๋ฅ˜
% of total 8% 43% 61%  

โญ ์ด๋Ÿฌํ•œ ์ƒํ™ฉ์—์„œ๋Š” blurryํ•œ ์ด๋ฏธ์ง€๋ฅผ ์ž˜๋ชป ์‹๋ณ„ํ•˜๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฒƒ์ด ์„ฑ๋Šฅํ–ฅ์ƒ์— ํšจ์œจ์ ์ด๋‹ค.

 


2. ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ ์ˆ˜์ •ํ•˜๊ธฐ

 

  • training set์—์„œ์˜ ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ
    • deep learning ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ training set์— ์กด์žฌํ•˜๋Š” random error์— ๋Œ€ํ•ด์„œ๋Š” ๊ฝค ๋‘”๊ฐํ•˜๋‹ค.
    • ๋”ฐ๋ผ์„œ ๊ตณ์ด ์ˆ˜์ •ํ•  ํ•„์š” ์—†๋‹ค. (์ˆ˜์ •ํ•˜๋ฉด ๋” ์ข‹๊ธด ํ•˜์ง€๋งŒ)
    • ํ•˜์ง€๋งŒ systematic error์— ๋Œ€ํ•ด์„œ๋Š” ๋ฏผ๊ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด๋ ‡๊ฒŒ ์ž˜๋ชป ๋ผ๋ฒจ์ด ๋ถ€์—ฌ๋œ ๊ฒฝ์šฐ์—๋Š” ์ˆ˜์ • 
  • test/dev set์—์„œ์˜ ์ž˜๋ชป๋œ ๋ฐ์ดํ„ฐ
    • ๋ผ๋ฒจ์„ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์ˆ˜์ •ํ•  ์ง€ ๋ง ์ง€ ๊ฒฐ์ •ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ๋‹ค์Œ 3๊ฐ€์ง€๋ฅผ ํ™•์ธํ•ด๋ณด์•„๋ผ
      • 1. ์ „์ฒด์ ์ธ dev set error 
      • 2. ์ž˜๋ชป๋œ label๋กœ ์ธํ•ด ๋ฐœ์ƒํ•œ ์—๋Ÿฌ
      • 3. ๋‹ค๋ฅธ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•œ ์—๋Ÿฌ 
    • ๋งŒ์•ฝ, validation dataset์— ์กด์žฌํ•˜๋Š” ์ž˜๋ชป ๋ถ€์ฐฉ๋œ label์„ ์ˆ˜์ •ํ•˜๋Š” ๊ฒฝ์šฐ ๋‹ค์Œ์„ ๊ณ ๋ คํ•˜๋ผ.
      • 1) dev set๊ณผ test set ๋ชจ๋‘์— ๋™์ผํ•˜๊ฒŒ error correcting ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ด์ฃผ์–ด์•ผ ํ•œ๋‹ค.
        • dev set์—์„œ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉด test set์—์„œ๋„ ์ผ๋ฐ˜ํ™”๊ฐ€ ๋˜์–ด์•ผ ํ•˜๋Š”๋ฐ,
          dev set๊ณผ test set์˜ ๋ถ„ํฌ๊ฐ€ ๋‹ค๋ฅด๋ฉด ์ผ๋ฐ˜ํ™”๋  ์ˆ˜ ์—†๋‹ค.
          ๋”ฐ๋ผ์„œ dev set๊ณผ test set์˜ ๋ถ„ํฌ๋Š” ๋™์ผํ•ด์•ผ ํ•œ๋‹ค.
      • 2) ๋ชจ๋ธ์ด ํ‹€๋ฆฐ ๋ฐ์ดํ„ฐ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ๋งž์ถ˜ ๋ฐ์ดํ„ฐ ๋˜ํ•œ ๋‹ค์‹œ ์ ๊ฒ€ํ•ด๋ณด์•„๋ผ.
        • ๋ผ๋ฒจ์ด ์ž˜๋ชป ๋ถ€์ฐฉ๋˜์–ด ํ‹€๋ฆฐ ๊ฒฝ์šฐ
        • ๋ผ๋ฒจ์ด ์ž˜๋ชป ๋ถ€์ฐฉ๋˜์–ด ๋งž์€ ๊ฒฝ์šฐ ๋ชจ๋‘ ๋ถ„์„ํ•ด์•ผ ํ•œ๋‹ค.
        • ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด bias๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค.

์˜ˆ์‹œ1)

  • 1. ์ „์ฒด์ ์ธ dev set error ex) 10%
  • 2. ์ž˜๋ชป๋œ label๋กœ ์ธํ•ด ๋ฐœ์ƒํ•œ ์—๋Ÿฌ ex) 100๊ฐœ์˜ ์ด๋ฏธ์ง€ ์ค‘ 6๊ฐœ -> 10*0.06(%)= 0.6%
  • 3. ๋‹ค๋ฅธ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•œ ์—๋Ÿฌ ex) 9.4%
  • ์ด ๊ฒฝ์šฐ ์ž˜๋ชป๋œ label๋กœ ์ธํ•ด ๋ฐœ์ƒํ•œ ์—๋Ÿฌ๋ณด๋‹ค ๋‹ค๋ฅธ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•œ ์—๋Ÿฌ๊ฐ€ ๋” ํฌ๊ธฐ ๋•Œ๋ฌธ์—
    label์„ ๊ณ ์น˜๋Š” ๊ฒƒ๋ณด๋‹ค, ๋‹ค๋ฅธ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•œ ์—๋Ÿฌ๋ฅผ ์ค„์ด๋Š” ๋ฐ ์‹œ๊ฐ„์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ๋” ํšจ์œจ์ ์ด๋‹ค.

 

์˜ˆ์‹œ2)

  • 1. ์ „์ฒด์ ์ธ dev set error ex) 2%
  • 2. ์ž˜๋ชป๋œ label๋กœ ์ธํ•ด ๋ฐœ์ƒํ•œ ์—๋Ÿฌ ex) 0.6%
  • 3. ๋‹ค๋ฅธ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•œ ์—๋Ÿฌ ex) 1.4%
  • ์˜ค๋ฅ˜ ์ค‘ ์ž˜๋ชป๋œ labe๋กœ ์ธํ•ด ๋ฐœ์ƒํ•œ ์˜ค๋ฅ˜์˜ ๋น„์ค‘์ด 30%์ด๋ฏ€๋กœ
    ์ด์ œ๋Š” dev set์—์„œ ํ‹€๋ฆฐ label์„ ์ˆ˜์ •ํ•˜๋Š” ์ž‘์—…์ด ๊ฐ’์–ด์น˜ ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค.

 

์˜ˆ์‹œ3)

  • ๋ชจ๋ธ A์˜ ์—๋Ÿฌ์œจ : 2.1%
  • ๋ชจ๋ธ B์˜ ์—๋Ÿฌ์œจ : 1.9%
  • ์ž˜๋ชป๋œ ๋ผ๋ฒจ๋กœ ์ธํ•ด ๋ฐœ์ƒํ•œ ์—๋Ÿฌ 0.6%
  • ๋ชจ๋ธ B๊ฐ€ A๋ณด๋‹ค ๋” ๋‚ซ๋‹ค๊ณ  ํ™•์‹ ํ•  ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์— validation score๊ฐ€ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜๋Š”๋ฐ ์œ ์šฉํ•˜์ง€ ์•Š๋‹ค.
    ๋”ฐ๋ผ์„œ validation set์— ์กด์žฌํ•˜๋Š” ์ž˜๋ชป๋œ label์„ ์ˆ˜์ •ํ•ด์•ผ ํ•œ๋‹ค.

3. ๋ชจ๋ธ์„ ๋นจ๋ฆฌ ๊ตฌ์ถ•ํ•˜๊ณ , ํ•™์Šตํ•ด๋ณด์•„๋ผ.

 

  1. dev/test set๊ณผ ํ‰๊ฐ€์ง€ํ‘œ๋ฅผ ์„ค์ •ํ•˜๋ผ.
  2. ์ดˆ๊ธฐ ๋ชจ๋ธ์„ ๋นจ๋ฆฌ ๊ตฌ์ถ•ํ•˜๋ผ.
  3. bias/variance ๋ถ„์„ & error ๋ถ„์„ํ•˜์—ฌ ๊ฐœ์„ ์‚ฌํ•ญ์„ ํŒŒ์•…ํ•˜๊ณ , ๊ฐœ์„ ํ•˜๋ผ.

 

 

+ Recent posts