- Today
- Total
๋ชฉ๋ก์ญ์ ํ (1)
DATA101
๐ ๋ชฉ์ฐจ1. ๊ธฐ์ธ๊ธฐ ์์ค์ ์๋ฏธ2. ๊ธฐ์ธ๊ธฐ ์์ค์ ์์ธ3. ๊ธฐ์ธ๊ธฐ ์์ค์ ํด๊ฒฐ๋ฐฉ๋ฒ1. ๊ธฐ์ธ๊ธฐ ์์ค์ ์๋ฏธ๋ฅ๋ฌ๋ ๋ถ์ผ์์ Layer๋ฅผ ๋ง์ด ์์์๋ก ๋ฐ์ดํฐ ํํ๋ ฅ์ด ์ฆ๊ฐํ๊ธฐ ๋๋ฌธ์ ํ์ต์ด ์ ๋ ๊ฒ ๊ฐ์ง๋ง, ์ค์ ๋ก๋ Layer๊ฐ ๋ง์์ง์๋ก ํ์ต์ด ์ ๋์ง ์์ต๋๋ค. ๋ฐ๋ก ๊ธฐ์ธ๊ธฐ ์์ค(Vanishing Gradient) ํ์๋๋ฌธ์ ๋๋ค. ๊ธฐ์ธ๊ธฐ ์์ค์ด๋ ์ญ์ ํ(Backpropagation) ๊ณผ์ ์์ ์ถ๋ ฅ์ธต์์ ๋ฉ์ด์ง์๋ก Gradient ๊ฐ์ด ๋งค์ฐ ์์์ง๋ ํ์์ ๋งํฉ๋๋ค(๊ทธ๋ฆผ 1 ์ฐธ๊ณ ). ๊ทธ๋ ๋ค๋ฉด ์ ์ด๋ฐ ๊ธฐ์ธ๊ธฐ ์์ค ๋ฌธ์ ๊ฐ ๋ฐ์ํ ๊น์? ์ด์ด์ง๋ ์น์ ์์ ์์ธํ ์์๋ด ๋๋ค. 2. ๊ธฐ์ธ๊ธฐ ์์ค์ ์์ธ๊ธฐ์ธ๊ธฐ ์์ค์ ๋ฐ์ ์์ธ์ ํ์ฑํ ํจ์(Activation Function)์ ๊ธฐ์ธ๊ธฐ์ ๊ด๋ จ์ด ๊น์ต๋๋ค..