normalizing inputs

 

  • ์ž…๋ ฅ์„ normalizing ํ•ด์ฃผ๋ฉด ๋น ๋ฅธ ํ•™์Šต์ด ์ด๋ฃจ์–ด์ง„๋‹ค.
  • ๋งŒ์•ฝ ์ž…๋ ฅ๋ณ€์ˆ˜์˜ scaling์ด ๊ฐ๊ธฐ ๋‹ค๋ฅด๋‹ค๋ฉด ๋Œ€์‘๋˜๋Š”  โญweight์˜ scaling ๋˜ํ•œ ์ƒ์ดํ•˜๋‹ค.
    ์ด๋Ÿฌํ•œ ์ƒํƒœ์—์„œ ํ•™์Šต์„ ์ง„ํ–‰ํ•˜๋ฉด โญzig-zag ์‹์˜ ๊ฐ€์ค‘์น˜ ์—…๋ฐ์ดํŠธ๊ฐ€ ๋ฐœ์ƒํ•˜์—ฌ ์ˆ˜๋ ดํ•˜๋Š” ๋ฐ ์‹œ๊ฐ„์ด ๋” ๊ฑธ๋ฆฌ๊ฒŒ ๋œ๋‹ค.
  • ๋”ฐ๋ผ์„œ scaling์„ ํ†ตํ•ด ๋ชจ๋“  ๋ณ€์ˆ˜์˜ ๋ถ„ํฌ๋ฅผ ์œ ์‚ฌํ•˜๊ฒŒ ๋งž์ถฐ์ค€๋‹ค๋ฉด ์ˆ˜๋ ดํ•˜๋Š” ๋ฐ ๊ฑธ๋ฆฌ๋Š” ์‹œ๊ฐ„์„ ์ค„์ผ ์ˆ˜ ์žˆ๋‹ค.

 

์ถœ์ฒ˜ : https://www.jeremyjordan.me/batch-normalization/

 

 

+ Recent posts