4. sliding window detection

 

 

์ž๋™์ฐจ detection์„ ์ˆ˜ํ–‰ํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด,

๋จผ์ € (1) ์ž๋™์ฐจ๊ฐ€ ์กด์žฌํ•˜๋Š” ์ด๋ฏธ์ง€์™€ (2) ์ž๋™์ฐจ๊ฐ€ ์กด์žฌํ•˜์ง€ ์•Š๋Š” ์ด๋ฏธ์ง€๋ฅผ ๊ฐ€์ง€๊ณ  classification์„ ์ˆ˜ํ–‰ํ•˜๋Š” CNN์„ ํ•™์Šตํ•œ๋‹ค.

์ด ๋•Œ ๋‹ค์–‘ํ•œ filter๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๋ชจ๋ธ์„ ํ•™์Šตํ•œ๋‹ค.

 

 

๊ทธ๋ฆฌ๊ณ  ๋‹ค์–‘ํ•œ scale์˜ filter๋ฅผ ์ด์šฉํ•ด ํ•™์Šตํ•œ "๋ชจ๋ธ"์„ ์ด๋ฏธ์ง€์˜ ์™ผ์ชฝ ์œ„๋ถ€ํ„ฐ ์˜ค๋ฅธ์ชฝ ์•„๋ž˜๊นŒ์ง€ slidingํ•˜๋ฉฐ

์ด๋ฏธ์ง€์˜ ๊ฐ ๋ถ€๋ถ„์—์„œ ์ž๋™์ฐจ๊ฐ€ ์กด์žฌํ•˜๋Š”์ง€ ์˜ˆ์ธก๊ฐ’์„ ๊ตฌํ•œ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ด ๊ฒฐ๊ณผ๋ฅผ ์ข…ํ•ฉํ•˜์—ฌ object detection์„ ์ˆ˜ํ–‰ํ•œ๋‹ค.

 

 

ํ•˜์ง€๋งŒ sliding window ๋ฐฉ์‹์œผ๋กœ object detection์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์€ ๊ณ„์‚ฐ๋น„์šฉ์ด ๋งค์šฐ ํฌ๋‹ค.

filter์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์„์ˆ˜๋ก filter์˜ ํฌ๊ธฐ๊ฐ€ ์ž‘์„์ˆ˜๋ก ์ •ํ™•๋„๋Š” ๋†’์•„์ง€์ง€๋งŒ, ๊ณ„์‚ฐ๋น„์šฉ์ด ์ปค์ง€๊ณ 

filter์˜ ๊ฐœ์ˆ˜๊ฐ€ ์ ์„์ˆ˜๋ก filter์˜ ํฌ๊ธฐ๊ฐ€ ์ž‘์„์ˆ˜๋ก ๊ณ„์‚ฐ๋น„์šฉ์€ ๋‚ฎ์•„์ง€์ง€๋งŒ, ์ •ํ™•๋„ ๋˜ํ•œ ๋‚ฎ์•„์ง€๊ฒŒ ๋œ๋‹ค.

 

์ด๋Ÿฌํ•œ ๋ฌธ์ œ์ ์„ ์•„๋ž˜์˜ convolutional neural network๋ฅผ ์ด์šฉํ•ด ํ•ด๊ฒฐํ•˜๊ณ ์ž ํ•œ๋‹ค.

 


5. convolutional implementation of sliding windows

 

object detection์—์„œ๋Š” FC layer๋ฅผ ์‚ฌ์šฉํ•œ ์œ„์˜ ๋ชจ๋ธ ๋Œ€์‹ , conv layer๋ฅผ ์‚ฌ์šฉํ•œ ์•„๋ž˜์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•œ๋‹ค.

FC์™€ ๋‹ฌ๋ฆฌ 5*5, 1*1 conv layer๋ฅผ ํ†ต๊ณผ์‹œ์ผฐ์ง€๋งŒ ์ˆ˜ํ•™์ ์œผ๋กœ๋Š” ๋™์ผํ•œ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•œ๋‹ค.

 

 

๊ทธ๋ ‡๋‹ค๋ฉด ์™œ ๊ตณ์ด FC layer๋ฅผ conv layer๋กœ ๋ฐ”๊พธ์–ด ์‚ฌ์šฉํ•˜๋Š”๊ฐ€?

๋ชจ๋ธ์˜ output shape๋ฅผ ํ™•์ธํ•˜๋ฉด ๊ทธ ๋ชฉ์ ์„ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.

์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋ชจ๋ธ์˜ output์€ 8*8*4์™€ ๊ฐ™์€ ํ˜•ํƒœ์ด๊ธฐ ๋•Œ๋ฌธ์— FC๊ฐ€ ์•„๋‹Œ conv layer๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

8*8*4 output์ด ์–ด๋– ํ•œ ์˜๋ฏธ์ธ์ง€๋Š” ์•„๋ž˜์—์„œ ๋‹ค๋ฃจ๋„๋ก ํ•œ๋‹ค.

 

(์ถ”๊ฐ€์ ์œผ๋กœ ์—ฌ๊ธฐ์—์„œ output node์˜ ์ˆ˜๊ฐ€ 4๊ฐœ์ธ ์ด์œ ๋Š” [๋ณดํ–‰์ž, ์ž๋™์ฐจ, ์˜คํ† ๋ฐ”์ด, ๋ฐฐ๊ฒฝ] object๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.)

 

 

 

 

input image(16*16*3)์˜ ํŒŒ๋ž€์ƒ‰ ๋ถ€๋ถ„์ด ์—ฌ๋Ÿฌ๊ฐœ์˜ conv layer๋ฅผ ์ง€๋‚˜๋ฉด output(2*2*4)์˜ ํŒŒ๋ž€์ƒ‰ ๋„ค๋ชจ ํ•œ ์นธ์— ๋Œ€์‘๋œ๋‹ค.

๋งŒ์•ฝ output์˜ ํŒŒ๋ž€์ƒ‰ ๋ถ€๋ถ„์—์„œ  [๋ณดํ–‰์ž, ์ž๋™์ฐจ, ์˜คํ† ๋ฐ”์ด, ๋ฐฐ๊ฒฝ] = [0.9, 0.05, 0.05, 0] ์ด๋Ÿฐ์‹์˜ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜จ๋‹ค๋ฉด

input image์˜ ํŒŒ๋ž€์ƒ‰ ๋ถ€๋ถ„์— "๋ณดํ–‰์ž" object๊ฐ€ ์กด์žฌํ•œ๋‹ค๊ณ  ํŒ๋‹จํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

 

์ด๋ ‡๊ฒŒ naive sliding window ๋ฐฉ์‹์ด ์•„๋‹Œ conv layer๋ฅผ ํ™œ์šฉํ•œ sliding window๋ฅผ ํ™œ์šฉํ•˜๋ฉด,

์ „์ฒด ์ด๋ฏธ์ง€์˜ ๋…๋ฆฝ์ ์ธ ๋ถ€๋ถ„ ์ด๋ฏธ์ง€๋ฅผ ๋ชจ๋ธ์— ๋„ฃ๊ณ  ์—ฌ๋Ÿฌ๋ฒˆ์˜ forward๋ฅผ ์ง„ํ–‰ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ

์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ ๋ชจ๋ธ์— ๋„ฃ์–ด ํ•œ ๋ฒˆ์˜ forward๋งŒ ์ง„ํ–‰ํ•˜๋ฉด ๋œ๋‹ค. (YOLO์—์„œ ์‚ฌ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•)

 

 

Photo by cristian castillo on Unsplash
์œ„์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ bounding box๋ฅผ ์˜ˆ์ธกํ•˜๊ฒŒ ๋˜๋ฉด

์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋นจ๊ฐ„์ƒ‰์˜ bounding box๊ฐ€ ์•„๋‹ˆ๋ผ, ํŒŒ๋ž€์ƒ‰์˜ bounding box๋ฅผ ์˜ˆ์ธกํ•˜๊ฒŒ ๋œ๋‹ค.

์ฆ‰ ์ด ๋ฐฉ๋ฒ•์€ bounding box ์œ„์น˜๊ฐ€ ์ •ํ™•ํ•˜์ง€ ์•Š๋‹ค๋Š” ๋‹จ์ ์ด ์žˆ๋‹ค.

 

๋ณด๋‹ค ์ •ํ™•ํžˆ bounding box๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ์—†์„๊นŒ? ๊ทธ ๋ฐฉ๋ฒ•์„ ๋ฐ”๋กœ ์•„๋ž˜์—์„œ ๋‹ค๋ค„๋ณด๋„๋ก ํ•œ๋‹ค.

 


6. bounding box prediction

 

๊ทธ ๋ฐฉ๋ฒ•์€ ๋ฐ”๋กœ ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ S*S grid๋กœ ๋‚˜๋ˆ„์–ด labeling ์ˆ˜ํ–‰ํ•˜๋Š” ๊ฒƒ์ด๋‹ค

๊ทธ๋ฆฌ๊ณ  ๋ชจ๋ธ์˜ ๊ฒฐ๊ณผ๋กœ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค์™€ ํด๋ž˜์Šค์˜ ํ™•๋ฅ ์„ ์˜ˆ์ธกํ•˜๋„๋ก ํ•™์Šตํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

  • ์ด ๋•Œ ๊ฐ grid cell์€ y=[p_c, b_x, b_y, b_h, b_w, c1, c2, ..., cn] ๋ฒกํ„ฐ๋ฅผ ๊ฐ–๋Š”๋‹ค.
  • ๋งŒ์•ฝ grid cell์— object์˜ ์ค‘์‹ฌ์ ์ด ์œ„์น˜ํ•˜๋ฉด ๊ทธ cell์— ๊ฐ์ฒด๊ฐ€ ์กด์žฌํ•œ๋‹ค๊ณ  ํŒ๋‹จ (p_c = 1)
    • ์œ ์˜๋ฏธํ•œ b_x, b_y, b_h, b_w ๊ฐ’์„ ์ •๋‹ต์œผ๋กœ ์ฃผ์–ด์•ผ ํ•œ๋‹ค.
    • b_x, b_y๋Š” ๊ฐ cell์˜ ์™ผ์ชฝ ์ƒ๋‹จ์„ (0, 0), ์˜ค๋ฅธ์ชฝ ํ•˜๋‹จ์„ (1, 1)์œผ๋กœ ๋ณด์•˜์„ ๋•Œ ์ƒ๋Œ€์ ์ธ ์œ„์น˜์ด๋‹ค.
    • b_h, b_w๋Š” grid cell์˜ hegith, width ๋Œ€๋น„ ๋ช‡ ๋ฐฐ์ธ์ง€๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์ƒ๋Œ€์ ์ธ ํฌ๊ธฐ๊ฐ€ ๊ธฐ๋ก๋œ๋‹ค.
  • ๋งŒ์•ฝ grid cell์— object์˜ ์ค‘์‹ฌ์ ์ด ์œ„์น˜ํ•˜์ง€ ์•Š์œผ๋ฉด cell์— ๊ฐ์ฒด๊ฐ€ ์กด์žฌํ•˜์ง€ ์•Š๋Š”๋‹ค๊ณ  ํŒ๋‹จ (p_c = 0)
    • ์‹ค์ œ ๊ฐ์ฒด๊ฐ€ ์กด์žฌํ•œ๋‹ค๊ณ  ํ•˜๋”๋ผ๋„ ์ค‘์‹ฌ์ ์ด ๊ทธ cell์— ์žˆ์ง€ ์•Š๋‹ค๋ฉด p_c = 0์ด ๋œ๋‹ค.
    • p_c = 0์ด๋ผ๋ฉด b_x, b_y, b_h, b_w, c1, ..., cn์€ don't care condition์œผ๋กœ ์–ด๋–ค ๊ฐ’์ด๋“  ์ƒ๊ด€์—†๋‹ค.

Photo by cristian castillo on Unsplash

  • ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋…ธ๋ž€์ƒ‰์˜ grid cell๋งŒ p_c = 1์ด ๋˜๊ณ , ๋‚˜๋จธ์ง€ grid cell์€ p_c = 0์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค.

 


7. IOU(intersection over union)

: IOU๋Š” ์˜ˆ์ธก๋œ bounding box์™€ ์ •๋‹ต bounding box์˜ intersection over union์„ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

 

์ฆ‰ ๋‘ bounding box๊ฐ€ ์–ผ๋งˆ๋‚˜ ์œ ์‚ฌํ•œ์ง€๋ฅผ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ๋ผ๊ณ  ๋ณด๋ฉด ๋œ๋‹ค.

 

 

  • IOU์˜ ๋ฒ”์œ„ : 0 ~ 1
    • 0์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๋‘ bounding box๊ฐ€ ์œ ์‚ฌํ•˜์ง€ ์•Š์Œ์„ ์˜๋ฏธ
    • 1์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๋‘ bounding box๊ฐ€ ์œ ์‚ฌํ•จ์„ ์˜๋ฏธ
  • ์ผ๋ฐ˜์ ์œผ๋กœ IOU๊ฐ€ 0.5๋ณด๋‹ค ํฌ๋‹ค๋ฉด ์˜ˆ์ธก๋œ bounding box๊ฐ€ ์˜ฎ๋‹ค๊ณ  ํŒ๋‹จํ•œ๋‹ค.

 

 


8. Non-max suppression

: non-max suppression์€ ํ•˜๋‚˜์˜ object์— ๋Œ€ํ•ด ์—ฌ๋Ÿฌ๊ฐœ์˜ bounding box๊ฐ€ ์˜ˆ์ธก๋˜๋Š” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค.

 

 

non-max suppression์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ณผ์ •์„ ๋ฐ˜๋ณตํ•œ๋‹ค.

(์—ฌ๊ธฐ์„œ ๊ฐ grid cell์˜ output์€ [p_c, b_x, b_y, b_h, b_w]๋ผ๊ณ  ๊ฐ€์ •)

  1. p_c๊ฐ€ 0.6์ดํ•˜์ธ bounding box๋Š” ์ œ๊ฑฐํ•˜๊ธฐ (p_c : ๊ฐ์ฒด๊ฐ€ ์กด์žฌํ•  ํ™•๋ฅ , 0.6์ด๋ผ๋Š” ๊ธฐ์ค€์€ ๋ฐ”๋€” ์ˆ˜ ์žˆ๋‹ค)
  2. ์•„๋ž˜์˜ ์ ˆ์ฐจ๋ฅผ ๊ฐ ํด๋ž˜์Šค๋งˆ๋‹ค ๋ฐ˜๋ณตํ•œ๋‹ค.
    1. ๊ฐ€์žฅ ํฐ p_c๋ฅผ ๊ฐ–๋Š” bounding box๋ฅผ ๊ณ ๋ฅธ๋‹ค.
    2. ์ด bounding box์™€์˜ IOU๊ฐ€ 0.5์ด์ƒ์ธ bounding box๋ฅผ ๋ชจ๋‘ ์ œ๊ฑฐํ•œ๋‹ค. (non-max suppression)

9. anchor boxes

: ํ•˜๋‚˜์˜ grid cell์—์„œ ์—ฌ๋Ÿฌ๊ฐœ์˜ ๊ฐ์ฒด๋ฅผ ํƒ์ง€ํ•˜๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•

 

์—ฌ๋Ÿฌ๊ฐœ์˜ anchor box๋ฅผ ์‚ฌ์šฉํ•˜์ž

  • anchor box๋Š” ์ง์ ‘ ๋””์ž์ธ ๋  ์ˆ˜ ์žˆ๊ณ ,
  • bounding box์—์„œ k-means clustering์„ ์ˆ˜ํ–‰ํ•˜์—ฌ anchor box๋ฅผ ์„ค๊ณ„ํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

 

 

์‚ฌ๋žŒ๊ณผ ์ž๋™์ฐจ์˜ ์ค‘์‹ฌ์ด ์ผ์น˜ํ•˜์—ฌ ๋™์ผํ•œ grid cell์— ๊ฐ์ฒด๊ฐ€ ํ• ๋‹น๋˜์—ˆ๋‹ค.

ํ•˜๋‚˜์˜ grid cell์— ๋‹ค์ˆ˜์˜ ๊ฐ์ฒด๊ฐ€ ํ• ๋‹น๋˜๋Š” ๊ฒฝ์šฐ๋Š” ์–ด๋–ป๊ฒŒ ์ฒ˜๋ฆฌํ•ด์•ผ ํ•˜๋‚˜?

  • ์ด๋Ÿฌํ•œ ๊ฒฝ์šฐ ์—ฌ๋Ÿฌ๊ฐœ์˜ anchor box๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฌธ์ œ๋ฅผ ์–ด๋Š์ •๋„ ํ•ด์†Œํ•  ์ˆ˜ ์žˆ๋‹ค. (๋‹ค ํ•ด๊ฒฐํ•˜๋Š” ๊ฒƒ ์•„๋‹ˆ๋‹ค)
  • ์‚ฌ๋žŒ์˜ ๊ฒฝ์šฐ, anchor box2๋ณด๋‹ค anchor box1๊ณผ ์œ ์‚ฌ๋„๊ฐ€ ๋†’๊ธฐ ๋•Œ๋ฌธ์— anchor box1์— ๋Œ€์‘๋˜๋Š” ์œ„์น˜์— ๋ผ๋ฒจ ๋ถ€์—ฌํ•˜๊ณ 
  • ์ž๋™์ฐจ์˜ ๊ฒฝ์šฐ, anchor box1๋ณด๋‹ค anchor box2์™€ ์œ ์‚ฌ๋„๊ฐ€ ๋†’๊ธฐ ๋•Œ๋ฌธ์— anchor box2์— ๋Œ€์‘๋˜๋Š” ์œ„์น˜์— ๋ผ๋ฒจ์„ ๋ถ€์—ฌํ•œ๋‹ค.
  • (๋” ์ •ํ™•ํžˆ๋Š” ๊ฐ์ฒด์˜ bounding box์™€ ์—ฌ๋Ÿฌ๊ฐœ์˜ anchor box์™€์˜ IOU๋ฅผ ๊ตฌํ•œ ๋’ค, ๊ฐ€์žฅ ๋†’์€ IOU๊ฐ€ ๊ณ„์‚ฐ๋œ anchor box ์œ„์น˜์— ๋ผ๋ฒจ์„ ๋ถ€์—ฌํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค)

์ด๋ ‡๊ฒŒ ์—ฌ๋Ÿฌ๊ฐœ์˜ anchor box๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ ๊ฐ cell์— ๋Œ€์‘๋˜๋Š” label์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

(์œ„์˜ ๊ฒฝ์šฐ๋Š” 2๊ฐœ์˜ anchor box๋ฅผ ์‚ฌ์šฉํ–ˆ์„ ๋•Œ label์ด๋‹ค)

 

 

 

๋งŒ์•ฝ์— anchor box๋Š” 2๊ฐœ์ธ๋ฐ, ํ•˜๋‚˜์˜ cell์—์„œ detect๋œ object๊ฐ€ 3๊ฐœ๋ผ๋ฉด ์–ด๋–ป๊ฒŒ ๋˜๋Š”๊ฐ€?

  • ์ด๋Ÿฌํ•œ ๊ฒฝ์šฐ๊ฐ€ ์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์ž˜ ์ฒ˜๋ฆฌํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋œ๋‹ค.
  • (์œ„์—์„œ anchor box๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฌธ์ œ๋ฅผ "์–ด๋Š์ •๋„" ํ•ด์†Œํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•œ ์ด์œ ์ด๋‹ค)

 

๊ทธ๋ฆฌ๊ณ  ์‚ฌ๋žŒ object์™€ ์ž๋™์ฐจ object๊ฐ€ ๋™์ผํ•œ cell์— ํ• ๋‹น๋˜์—ˆ์„ ๋•Œ,

์‚ฌ๋žŒ์˜ bounding box๋„, ์ž๋™์ฐจ์˜ bounding box๋„ anchor box1๊ณผ ์œ ์‚ฌํ•˜๋‹ค๋ฉด ์–ด๋–ป๊ฒŒ ๋˜๋Š”๊ฐ€?

  • ์ด๋Ÿฌํ•œ ๊ฒฝ์šฐ ์—ญ์‹œ ์ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์ž˜ ์ฒ˜๋ฆฌํ•˜์ง€ ๋ชปํ•˜๋Š” ๊ฒฝ์šฐ์ด๋‹ค.

 


10. YOLO 

 

Training

  • ๋ชจ๋ธ output์˜ ๋ณผ๋ฅจ์€ S*S*(B*(5+C))๊ฐ€ ๋  ๊ฒƒ์ด๋‹ค.
  • S*S : grid์˜ ํฌ๊ธฐ
  • B : bounding box์˜ ๊ฐœ์ˆ˜ (= anchor box์˜ ๊ฐœ์ˆ˜)
  • 5 : 5์ธ ์ด์œ ๋Š” confidence score, b_x, b_y, b_h, b_w
  • C : ํด๋ž˜์Šค์˜ ๊ฐœ์ˆ˜

 

 

 

Prediction

  • ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ model์— ๋„ฃ์–ด ํ•œ ๋ฒˆ๋งŒ forward๋ฅผ ์ง„ํ–‰ํ•˜๋ฉด ์˜ˆ์ธก๊ฐ’์„ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.
  • ์œ„์˜ ์˜ˆ์‹œ์—์„œ output์˜ shape๊ฐ€ 3*3*2*8์ธ ์ด์œ ๋Š”
    • grid : 3*3
    • anchor box์˜ ๊ฐœ์ˆ˜ : 2
    • ํด๋ž˜์Šค์˜ ๊ฐœ์ˆ˜ : 3 (๋”ฐ๋ผ์„œ 5+3=8)

 

 

 

output์— ๋Œ€ํ•ด non-max suppression์„ ์ ์šฉ

 

'๐Ÿ™‚ > Coursera_DL' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

WEEK7 : Neural Style Transfer  (1) 2020.12.25
WEEK7 : face recognition  (0) 2020.12.24
WEEK6 : Object Detection (1)  (0) 2020.12.23
WEEK6 : convNet ์‚ฌ์šฉ์— ๋„์›€์ด ๋  ์ง€์‹  (0) 2020.12.23
WEEK6 : Inception (googLeNet)  (0) 2020.12.23

+ Recent posts