- Today
- Total
๋ชฉ๋ก๋ฅ๋ฌ๋ (17)
DATA101
๐ ๋ชฉ์ฐจ 1. ๊ฐ๋ 2. ์ฅ์ 3. ๋จ์ 1. ๊ฐ๋ AdaGrad๋ ๋ฅ๋ฌ๋ ์ต์ ํ ๊ธฐ๋ฒ ์ค ํ๋๋ก์จ Adaptive Gradient์ ์ฝ์์ด๊ณ , ์ ์์ ๊ธฐ์ธ๊ธฐ๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. Feature๋ง๋ค ์ค์๋, ํฌ๊ธฐ ๋ฑ์ด ์ ๊ฐ๊ฐ์ด๊ธฐ ๋๋ฌธ์ ๋ชจ๋ Feature๋ง๋ค ๋์ผํ ํ์ต๋ฅ ์ ์ ์ฉํ๋ ๊ฒ์ ๋นํจ์จ์ ์ ๋๋ค. ์ด๋ฌํ ๊ด์ ์์ AdaGrad ๊ธฐ๋ฒ์ด ์ ์๋์์ต๋๋ค. AdaGrad๋ Feature๋ณ๋ก ํ์ต๋ฅ (Learning rate)์ Adaptiveํ๊ฒ, ์ฆ ๋ค๋ฅด๊ฒ ์กฐ์ ํ๋ ๊ฒ์ด ํน์ง์ ๋๋ค. AdaGrad๋ฅผ ์์์ผ๋ก ๋ํ๋ด๋ฉด ์๋์ ๊ฐ์ต๋๋ค. $$ g_{t} = g_{t-1} + (\nabla f(x_{t-1}))^{2} $$ $$ x_{t} = x_{t-1} - \frac{\eta}{\sqrt{g_{t} + \epsi..
๋ณธ ํฌ์คํ ์์๋ ๋ฅ๋ฌ๋ ์ต์ ํ(optimizer) ๊ธฐ๋ฒ ์ค ํ๋์ธ Momentum์ ๊ฐ๋ ์ ๋ํด ์์๋ด ๋๋ค. ๋จผ์ , Momentum ๊ธฐ๋ฒ์ด ์ ์๋ ๋ฐฐ๊ฒฝ์ธ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(Gradient Descent)์ ํ๊ณ์ ์ ๋ํด ๋ค๋ฃจ๊ณ ์์๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค.๐ ๋ชฉ์ฐจ1. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํ๊ณ 1.1. Local Minimum ๋ฌธ์ 1.2. Saddle Point ๋ฌธ์ 2. Momentum 2.1. ๊ฐ๋ 2.2. ์์1. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํ๊ณ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(Gradient Descent)์ ํฌ๊ฒ 2๊ฐ์ง ํ๊ณ์ ์ด ์์ต๋๋ค. ์ฒซ์งธ, Local Minimum์ ๋น ์ง๊ธฐ ์ฝ๋ค๋ ์ . ๋์งธ, ์์ฅ์ (Saddle point)๋ฅผ ๋ฒ์ด๋์ง ๋ชปํ๋ค๋ ์ . ๊ฐ๊ฐ์ ๋ํด ์์๋ด ๋๋ค.1.1. Local Minimum..
๐ ๋ชฉ์ฐจ1. ์ต์ ํ ๊ฐ๋ 2. ๊ธฐ์ธ๊ธฐ ๊ฐ๋ 3. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ ๊ฐ๋ 4. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํ๊ณ1. ์ต์ ํ ๊ฐ๋ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ์ต์ ํ(Optimization)๋ ์์ค ํจ์(Loss Function) ๊ฐ์ ์ต์ํํ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ตฌํ๋ ๊ณผ์ ์ ๋๋ค(์๋ ๊ทธ๋ฆผ 1 ์ฐธ๊ณ ). ๋ฅ๋ฌ๋์์๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ์ฌ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ๊ฑฐ์ณ ์์ธก๊ฐ(\(\hat{y}\))์ ์ป์ต๋๋ค. ์ด ์์ธก๊ฐ๊ณผ ์ค์ ์ ๋ต(\(y\))๊ณผ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ๋ ํจ์๊ฐ ์์ค ํจ์์ ๋๋ค. ์ฆ, ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ฏ๊ฐ์ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ๋คํธ์ํฌ ๊ตฌ์กฐ์ ํ๋ผ๋ฏธํฐ(a.k.a., Feature)๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด ์ต์ ํ์ ๋๋ค. ์ต์ ํ ๊ธฐ๋ฒ์๋ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์์ผ๋ฉฐ, ๋ณธ ํฌ์คํ ์์๋ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(Gradient Descent)์ ๋ํด ์์๋ด ๋๋ค.2. ๊ธฐ์ธ๊ธฐ ๊ฐ๋ ..
๐ก ๋ชฉํ ํ๊ท ์ ๋์ค์ฐจ(MAE)์ ๊ฐ๋ ๋ฐ ํน์ง์ ๋ํด ์์๋ด ๋๋ค. 1. MAE ๊ฐ๋ ํ๊ท ์ ๋์ค์ฐจ(Mean Absolute Error, MAE)๋ ๋ชจ๋ ์ ๋ ์ค์ฐจ(Error)์ ํ๊ท ์ ๋๋ค. ์ฌ๊ธฐ์ ์ค์ฐจ๋ ์๊ณ ๋ฆฌ์ฆ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต๊ณผ์ ์ฐจ์ด๋ฅผ ์๋ฏธํฉ๋๋ค. ์ฆ, ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋ต์ ์ ๋งํ์๋ก MSE ๊ฐ์ ์์ต๋๋ค. ๋ฐ๋ผ์, MAE๊ฐ ์์์๋ก ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ด ์ข๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. MAE์ ์์์ ์ดํด๋ณด๊ฒ ์ต๋๋ค. $$ E = \sum_{i}|y_{i} -\tilde{y_{i}}| $$ \(E\): ์์ค ํจ์ \(y_i\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ์ ์ ๋ต \(\tilde{y_i}\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ๋ก ์์ธกํ ๊ฐ 2. MAE ํน์ง 2.1. ์ค์ฐจ์ ๋น๋กํ๋ ์์ค ํจ์ MAE๋ ์์ค ํจ์๊ฐ ..
๐ก ๋ชฉํํ๊ท ์ ๊ณฑ์ค์ฐจ(MSE)์ ๊ฐ๋ ๊ณผ ํน์ง์ ๋ํด ์์๋ด ๋๋ค.1. MSE ๊ฐ๋ ํ๊ท ์ ๊ณฑ์ค์ฐจ(Mean Squared Error, MSE)๋ ์ด๋ฆ์์ ์ ์ ์๋ฏ์ด ์ค์ฐจ(error)๋ฅผ ์ ๊ณฑํ ๊ฐ์ ํ๊ท ์ ๋๋ค. ์ค์ฐจ๋ ์๊ณ ๋ฆฌ์ฆ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต๊ณผ์ ์ฐจ์ด๋ฅผ ์๋ฏธํฉ๋๋ค. ์ฆ, ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋ต์ ์ ๋ง์ถ์๋ก MSE ๊ฐ์ ์๊ฒ ์ฃ . ์ฆ, MSE ๊ฐ์ ์์์๋ก ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ด ์ข๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. ์์์ ์ดํด๋ณด๊ฒ ์ต๋๋ค.$$ E = \frac{1}{n}\sum_{i=1}^{n}(y_{i} - \tilde{y_i})^2 $$\(y_i\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ์ ์ ๋ต\(\tilde{y_i}\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ๋ก ์์ธกํ ๊ฐ2. ํน์ง2.1. ์ค์ฐจ ๋๋น ํฐ ์์ค ํจ์์ ์ฆ๊ฐํญMSE๋ ์ค์ฐจ๊ฐ ์ปค์ง์๋ก..
๐ก ๋ชฉํ ์์ค ํจ์์ ๊ฐ๋ ๊ณผ ์๊ณ ๋ฆฌ์ฆ ํ์ต์ ์ํ์ ์๋ฏธ์ ๋ํด ์์๋ด ๋๋ค. 1. ์์ค ํจ์์ ๊ฐ๋ ์์ค ํจ์(Loss Function)๋ ์ง๋ํ์ต(Supervised Learning) ์ ์๊ณ ๋ฆฌ์ฆ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต์ ์ฐจ์ด๋ฅผ ๋น๊ตํ๊ธฐ ์ํ ํจ์์ ๋๋ค. ์ฆ, 'ํ์ต ์ค์ ์๊ณ ๋ฆฌ์ฆ์ด ์ผ๋ง๋ ์๋ชป ์์ธกํ๋ ์ ๋'๋ฅผ ํ์ธํ๊ธฐ ์ํ ํจ์๋ก์จ ์ต์ ํ(Optimization)๋ฅผ ์ํด ์ต์ํํ๋ ๊ฒ์ด ๋ชฉ์ ์ธ ํจ์์ ๋๋ค. ๊ทธ๋์ ์์ค ํจ์๋ฅผ ๋ชฉ์ ํจ์(Objective Function)๋ผ๊ณ ๋ ๋ถ๋ฆ ๋๋ค. ์ด์ธ์๋ ์์ค ํจ์๋ ๋ถ์ผ์ ๋ฐ๋ผ ๋น์ฉ ํจ์(Cost Function), ์๋์ง ํจ์(Energy Function) ๋ฑ์ผ๋ก ๋ค์ํ๊ฒ ๋ถ๋ฅด๊ธฐ๋ ํฉ๋๋ค. ์์ค ํจ์๋ฅผ ํตํด ๋ชจ๋ธ ํ์ต ์ค์ ์์ค(loss)์ด ์ปค์ง์๋ก ํ..
๐ ๋ชฉ์ฐจ 1. ํ์ฑํ ํจ์์ ๊ฐ๋ 2. ํ์ฑํ ํจ์์ ์ข ๋ฅ 2.1. Sign ํจ์ 2.2. Sigmoid ํจ์ 2.3. Tanh ํจ์ 2.4. Softmax ํจ์ 2.5. ReLU ํจ์ 2.6. Leaky ReLU ํจ์ 1. ํ์ฑํ ํจ์์ ๊ฐ๋ ํ์ฑํ ํจ์(Activation Function)๋ ํผ์ ํธ๋ก (Perceptron)์ ์ถ๋ ฅ๊ฐ์ ๊ฒฐ์ ํ๋ ๋น์ ํ(non-linear) ํจ์์ ๋๋ค. ์ฆ, ํ์ฑํ ํจ์๋ ํผ์ ํธ๋ก ์์ ์ ๋ ฅ๊ฐ์ ์ดํฉ์ ์ถ๋ ฅํ ์ง ๋ง์ง ๊ฒฐ์ ํ๊ณ , ์ถ๋ ฅํ๋ค๋ฉด ์ด๋ค ๊ฐ์ผ๋ก ๋ณํํ์ฌ ์ถ๋ ฅํ ์ง ๊ฒฐ์ ํ๋ ํจ์์ ๋๋ค. ํผ์ ํธ๋ก ์ ๋ํ ์์ธํ ๋ด์ฉ์ ์ด๊ณณ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์. ์๋ ๊ทธ๋ฆผ 1์ ๋ ธ๋์์ผ๋ก ์์น ํ ๋ถ๋ถ์ด ํผ์ ํธ๋ก ์ ํ์ฑํ ํจ์ ๋ถ๋ถ์ ๋๋ค. 2. ํ์ฑํ ํจ์์ ์ข ๋ฅ 2.1. Sign ํจ์ ์์ ํผ์ ..
๋ณธ ํฌ์คํ ์์๋ ํผ์ ํธ๋ก (Perceptron) ํ์ต(train)์ ์๋ฏธ์ ์ ์ฐจ์ ๋ํด ์์๋ด ๋๋ค. ๐ ๋ชฉ์ฐจ 1. ํผ์ ํธ๋ก ์ ๊ฐ๋ 2. ํผ์ ํธ๋ก ํ์ต์ ์๋ฏธ 3. ํผ์ ํธ๋ก ํ์ต ๋ฐฉ๋ฒ 4. ํผ์ ํธ๋ก ํ์ต ์ ์ฐจ 1. ํผ์ ํธ๋ก ์ ๊ฐ๋ ํผ์ ํธ๋ก ์ ํ์ต ์ ์ฐจ๋ฅผ ์์๋ณด๊ธฐ ์ ์ ํผ์ ํธ๋ก ๊ฐ๋ ์ ๋ํด ์์๋ด ๋๋ค. ํผ์ ํธ๋ก ์ ์ด์ง ๋ถ๋ฅ(Binary Classification) ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํ ์ง๋ํ์ต(Supervised Learning) ๊ธฐ๋ฐ์ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ์ด์ง๋ถ๋ฅ๋ ์๋ฅผ ๋ค์ด ์ธ๊ณต์ง๋ฅ(AI)์๊ฒ ๋ฌด์์๋ก ๋๋ฌผ ์ฌ์ง์ ๋ณด์ฌ์ฃผ์์ ๋ ๊ณ ์์ด ์ฌ์ง์ธ์ง, ๊ฐ์์ง ์ฌ์ง์ธ์ง ๋ถ๋ฅํ๋ ๋ฌธ์ ์ ๋๋ค. ์ฌ๊ธฐ์ ๊ณ ์์ด, ๊ฐ์์ง์ ๊ฐ์ ์ ํ์ง๋ฅผ ํด๋์ค(Class)๋ผ๊ณ ๋ถ๋ฅด๊ณ ์ ํ์ง๊ฐ 2๊ฐ์ธ ๊ฒฝ์ฐ๋ฅผ ์ด์ง ๋ถ๋ฅ๋ผ๊ณ ํฉ๋๋ค. ์ํ์ ์ธ ์ธก..
