<content>
- learning from multiple task
- transfer learning
- multi-task learning
* transfer learning์ ๋ํ ๋ด์ฉ
hyoeun-log.tistory.com/entry/WEEK5-Transfer-Learning?category=848132
Multi-Task Learning
1) Multi-Task Learning์ด๋?
- ์๋ก ์ฐ๊ด์๋ ๊ณผ์ ๋ฅผ ๋์์ ํ์ตํจ์ผ๋ก์จ ๋ชจ๋ ๊ณผ์ ์ํ์ ์ฑ๋ฅ์ ์ ๋ฐ์ ์ผ๋ก ํฅ์์ํค๋ ํ์ต ๋ฐฉ๋ฒ
- ๊ด๋ จ ์๋ ์์ ๋ค์ ํํ์ ๊ณต์ ํจ์ผ๋ก์จ ๋ชจ๋ธ์ ์ผ๋ฐํ ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ์ ๊ทผ ๋ฐฉ์
2) Transfer Learning ๋ด Multi-task learning
- Transfer Learning
- Same Task (transductive transfer learning)
- domain adaptation
- cross-lingual learning
- Different Task (inductive transfer learning)
- multi-task learning
- sequential transfer learning
- Same Task (transductive transfer learning)
3) Multi-Task learning์ ์ฅ์ ๊ณผ ๋จ์
- ์ฅ์
- knowledge transfer
- ์๋ก ๋ค๋ฅธ task๋ฅผ ํ์ตํ๋ฉด์ ์ป์ ์ ์ฉํ ์ ๋ณด๊ฐ ๊ณต์ ๋์ด ์๋ก์๊ฒ ๋์
- overfitting ๊ฐ์
- ๊ด๋ จ์๋ ์์ ๋ค์ ํํ์ ๊ณต์ ํ์ฌ ์ผ๋ฐํ ๋ฅ๋ ฅ์ด ์ฆ๊ฐ
- computational efficiency
- ์ฌ๋ฌ task๋ฅผ ๋์์ ํ์ตํ์ฌ ๊ณ์ฐ ํจ์จ์
- real-word application
- ํ์ค์์๋ ๋ค์ํ task๊ฐ ํ ๋ฒ์ ์๊ตฌ๋๋ค
- ๋ฐ์ดํฐ ์ฆ๊ฐ์ ํจ๊ณผ
- ์ฌ๋ฌ ๊ฐ์ task * ์ฌ๋ฌ ๊ฐ์ ๋ฐ์ดํฐ์ -> ๋ฐ์ดํฐ ์ฆ๊ฐ์ ํจ๊ณผ
- knowledge transfer
- ๋จ์
- negative transfer
- ๋ถ์ ํฉํ ํํ ์ญ์ ๊ณต์ ๋๋ค.
- task balancing์ ์ด๋ ค์
- task๋ง๋ค ํ์ต ๋์ด๋๊ฐ ํฌ๊ฒ ์ฐจ์ด๋๋ฉด ์๋ ดํ๊ธฐ ์ด๋ ต๋ค
- ๊ฐ task์ ๋ฐ์ดํฐ์ ์ ๊ฐ์๊ฐ ์ ์ฌํ๊ธฐ๋ฅผ ๊ถ์ฅ
- negative transfer
4) parameter sharing
- soft parameter sharing
- ๊ฐ ์์ ์ ๋์๋๋ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ๋ ๊ณ ์ ํ ๋ชจ๋ธ์ด ์กด์ฌ
- ๊ฐ ๋ชจ๋ธ ๋งค๊ฐ๋ณ์ ์ฌ์ด์ ๊ฑฐ๋ฆฌ๋ฅผ ์ ๊ทํํ์ฌ ๊ฐ ๋งค๊ฐ๋ณ์๊ฐ ์ ์ฌํ๋๋ก ์ ๋
- hard parameter sharing
- ์์ ๋ณ ์ถ๋ ฅ ๋ ์ด์ด๋ฅผ ์ ์งํ๋ฉด์ ํ๋ ๋ ์ด์ด๋ฅผ ๊ณต์
- ๋์์ ํ์ตํ๋ ์์ ์ด ๋ง์์๋ก ๊ณผ์ ํฉ ๋ ๊ฐ๋ฅ์ฑ์ด ๋ฎ์์ง
5) mutli-label VS multi-task
- multi-label
- ํ๋์ ๋ฐ์ดํฐ์ ์ ์ฌ๋ฌ๊ฐ์ง ๋ผ๋ฒจ์ด ์กด์ฌํ๋ ๊ฒฝ์ฐ
- multi-task
- ๊ฐ task๊ฐ ์๋ก ๋ค๋ฅธ training set์ผ๋ก ๊ตฌ์ฑ
* ์ฐธ๊ณ
Multi-label learning
1) Multi-label learning์ด๋?
- ๋ฐ์ดํฐ์
์ label์ด multi-label์ธ ๊ฒฝ์ฐ
- multi-class VS multi-label
- multi-class๋ ์ฌ๋ฌ๊ฐ์ง์ ํด๋์ค ์ค ํ๋์๋ง ์ํ๋ ๋ฌธ์ (์ํธ๋ฐฐํ์ )
ex) ์ด๋ฑํ์, ์คํ์, ๊ณ ๋ฑํ์ - multi-label์ ์ฌ๋ฌ๊ฐ์ง์ ํด๋์ค ์ค 1๊ฐ ์ด์์ ์ํ ์ ์๋ ๋ฌธ์
ex) ์ํ ์ฅ๋ฅด (๋ฉ๋ก, ๋๋ผ๋ง, ์ฝ๋ฏธ๋, ๋ฒ์ฃ, ์ค๋ฆด๋ฌ, ํํ์ง, ์ ๋๋ฉ์ด์ ๋ฑ)
- multi-class๋ ์ฌ๋ฌ๊ฐ์ง์ ํด๋์ค ์ค ํ๋์๋ง ์ํ๋ ๋ฌธ์ (์ํธ๋ฐฐํ์ )
- multi-class VS multi-label
- ์) ์์จ์ฃผํ
- ๋ณดํ์ ์๋ณ + ์ฐจ๋ ์๋ณ + ํ์งํ ์๋ณ + ์ ํธ๋ฑ ์๋ณ + ...
- Y = [๋ณดํ์์ ๋ฎค ์๋์ฐจ์ ๋ฌด ํ์งํ์ ๋ฌด ...]
2) ํ์ต ๋ฐฉ๋ฒ
- ํ๋์ ๋คํธ์ํฌ๊ฐ multi label ํ์ต (output node๊ฐ ์ฌ๋ฌ๊ฐ)
- multi-label ๊ฐ๊ฐ์ ๊ฐ๋ณ ์ ๊ฒฝ๋ง ํ์ต
'๐ > Coursera_DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
WEEK5 : CNN (convolutional neural network) (0) | 2020.12.21 |
---|---|
WEEK5 : end to end DL (0) | 2020.12.21 |
WEEK5 : Transfer Learning (0) | 2020.12.20 |
WEEK5 : traning set๊ณผ dev/test set์ ๋ถ์ผ์น (0) | 2020.12.20 |
WEEK5 : error analysis (์๋ฌ ๋ถ์) (0) | 2020.12.20 |