- Today
- Total
๋ชฉ๋ก๋จธ์ ๋ฌ๋ (7)
DATA101
๐ ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฅ๋ฌ๋ Generalization ๊ธฐ๋ฒ ์ค ํ๋์ธ ๋ฐฐ์น ์ ๊ทํ(Batch Normalization)์ ๋ํด ์์๋ด ๋๋ค. ๋จผ์ , ๋ฐ์ดํฐ ์ ๊ทํ์ ํ์์ฑ์ ๋ํด ์์๋ณด๊ณ , Batch Normalization์ ๋ฑ์ฅ ๋ฐฐ๊ฒฝ์ธInternal Covariate Shift ํ์์ ๋ํด ์๊ฐํฉ๋๋ค. ์ดํ Batch Normalization์ ๊ฐ๋ ๊ณผ ํน์ง์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค. ๐ ๋ชฉ์ฐจ 1. ๋ฐ์ดํฐ ์ ๊ทํ 1.1. ๊ฐ๋ 1.2. ํ์์ฑ 2. Internal Covariate Shift ํ์ 2.1. ๊ฐ๋ 2.2. ๋ฌธ์ ์ 3. Batch Normalization 3.1. ๊ฐ๋ 3.2. ์ฅ์ 3.3. ๋จ๊ณ๋ณ Batch Normalization 1. ๋ฐ์ดํฐ ์ ๊ทํ 1.1. ๊ฐ๋ ๋ฐ์ดํฐ ์ ๊ทํ(No..
๐ ๋ชฉ์ฐจ 1. Batch Size 2. Iteration 3. Epoch 1. Batch Size Batch ํฌ๊ธฐ๋ ๋ชจ๋ธ ํ์ต ์ค parameter๋ฅผ ์ ๋ฐ์ดํธํ ๋ ์ฌ์ฉํ ๋ฐ์ดํฐ ๊ฐ์๋ฅผ ์๋ฏธํฉ๋๋ค. ์ฌ๋์ด ๋ฌธ์ ํ์ด๋ฅผ ํตํด ํ์ตํด ๋๊ฐ๋ ๊ณผ์ ์ ์๋ก ๋ค์ด๋ณด๊ฒ ์ต๋๋ค. Batch ํฌ๊ธฐ๋ ๋ช ๊ฐ์ ๋ฌธ์ ๋ฅผ ํ ๋ฒ์ ์ญ ํ๊ณ ์ฑ์ ํ ์ง๋ฅผ ๊ฒฐ์ ํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ด 100๊ฐ์ ๋ฌธ์ ๊ฐ ์์ ๋, 20๊ฐ์ฉ ํ๊ณ ์ฑ์ ํ๋ค๋ฉด Batch ํฌ๊ธฐ๋ 20์ ๋๋ค. ์ฌ๋์ ๋ฌธ์ ๋ฅผ ํ๊ณ ์ฑ์ ์ ํ๋ฉด์ ๋ฌธ์ ๋ฅผ ํ๋ฆฐ ์ด์ ๋ ๋ง์ถ ์๋ฆฌ๋ฅผ ํ์ตํ์ฃ . ๋ฅ๋ฌ๋ ๋ชจ๋ธ ์ญ์ ๋ง์ฐฌ๊ฐ์ง์ ๋๋ค. Batch ํฌ๊ธฐ๋งํผ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต ๊ฐ์ ์ค์ฐจ(conf. ์์คํจ์)๋ฅผ ๊ณ์ฐํ์ฌ Optimizer๊ฐ parameter๋ฅผ..
๐ ๋ชฉ์ฐจ1. ์ต์ ํ ๊ฐ๋ 2. ๊ธฐ์ธ๊ธฐ ๊ฐ๋ 3. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ ๊ฐ๋ 4. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํ๊ณ1. ์ต์ ํ ๊ฐ๋ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ์ต์ ํ(Optimization)๋ ์์ค ํจ์(Loss Function) ๊ฐ์ ์ต์ํํ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ตฌํ๋ ๊ณผ์ ์ ๋๋ค(์๋ ๊ทธ๋ฆผ 1 ์ฐธ๊ณ ). ๋ฅ๋ฌ๋์์๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ์ฌ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ๊ฑฐ์ณ ์์ธก๊ฐ(\(\hat{y}\))์ ์ป์ต๋๋ค. ์ด ์์ธก๊ฐ๊ณผ ์ค์ ์ ๋ต(\(y\))๊ณผ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ๋ ํจ์๊ฐ ์์ค ํจ์์ ๋๋ค. ์ฆ, ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ฏ๊ฐ์ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ๋คํธ์ํฌ ๊ตฌ์กฐ์ ํ๋ผ๋ฏธํฐ(a.k.a., Feature)๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด ์ต์ ํ์ ๋๋ค. ์ต์ ํ ๊ธฐ๋ฒ์๋ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์์ผ๋ฉฐ, ๋ณธ ํฌ์คํ ์์๋ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(Gradient Descent)์ ๋ํด ์์๋ด ๋๋ค.2. ๊ธฐ์ธ๊ธฐ ๊ฐ๋ ..
๐ก ๋ชฉํ ํ๊ท ์ ๋์ค์ฐจ(MAE)์ ๊ฐ๋ ๋ฐ ํน์ง์ ๋ํด ์์๋ด ๋๋ค. 1. MAE ๊ฐ๋ ํ๊ท ์ ๋์ค์ฐจ(Mean Absolute Error, MAE)๋ ๋ชจ๋ ์ ๋ ์ค์ฐจ(Error)์ ํ๊ท ์ ๋๋ค. ์ฌ๊ธฐ์ ์ค์ฐจ๋ ์๊ณ ๋ฆฌ์ฆ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต๊ณผ์ ์ฐจ์ด๋ฅผ ์๋ฏธํฉ๋๋ค. ์ฆ, ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋ต์ ์ ๋งํ์๋ก MSE ๊ฐ์ ์์ต๋๋ค. ๋ฐ๋ผ์, MAE๊ฐ ์์์๋ก ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ด ์ข๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. MAE์ ์์์ ์ดํด๋ณด๊ฒ ์ต๋๋ค. $$ E = \sum_{i}|y_{i} -\tilde{y_{i}}| $$ \(E\): ์์ค ํจ์ \(y_i\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ์ ์ ๋ต \(\tilde{y_i}\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ๋ก ์์ธกํ ๊ฐ 2. MAE ํน์ง 2.1. ์ค์ฐจ์ ๋น๋กํ๋ ์์ค ํจ์ MAE๋ ์์ค ํจ์๊ฐ ..
๐ ๋ชฉ์ฐจ 1. ํ์ฑํ ํจ์์ ๊ฐ๋ 2. ํ์ฑํ ํจ์์ ์ข ๋ฅ 2.1. Sign ํจ์ 2.2. Sigmoid ํจ์ 2.3. Tanh ํจ์ 2.4. Softmax ํจ์ 2.5. ReLU ํจ์ 2.6. Leaky ReLU ํจ์ 1. ํ์ฑํ ํจ์์ ๊ฐ๋ ํ์ฑํ ํจ์(Activation Function)๋ ํผ์ ํธ๋ก (Perceptron)์ ์ถ๋ ฅ๊ฐ์ ๊ฒฐ์ ํ๋ ๋น์ ํ(non-linear) ํจ์์ ๋๋ค. ์ฆ, ํ์ฑํ ํจ์๋ ํผ์ ํธ๋ก ์์ ์ ๋ ฅ๊ฐ์ ์ดํฉ์ ์ถ๋ ฅํ ์ง ๋ง์ง ๊ฒฐ์ ํ๊ณ , ์ถ๋ ฅํ๋ค๋ฉด ์ด๋ค ๊ฐ์ผ๋ก ๋ณํํ์ฌ ์ถ๋ ฅํ ์ง ๊ฒฐ์ ํ๋ ํจ์์ ๋๋ค. ํผ์ ํธ๋ก ์ ๋ํ ์์ธํ ๋ด์ฉ์ ์ด๊ณณ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์. ์๋ ๊ทธ๋ฆผ 1์ ๋ ธ๋์์ผ๋ก ์์น ํ ๋ถ๋ถ์ด ํผ์ ํธ๋ก ์ ํ์ฑํ ํจ์ ๋ถ๋ถ์ ๋๋ค. 2. ํ์ฑํ ํจ์์ ์ข ๋ฅ 2.1. Sign ํจ์ ์์ ํผ์ ..
๋ณธ ํฌ์คํ ์์๋ ํผ์ ํธ๋ก (Perceptron) ํ์ต(train)์ ์๋ฏธ์ ์ ์ฐจ์ ๋ํด ์์๋ด ๋๋ค. ๐ ๋ชฉ์ฐจ 1. ํผ์ ํธ๋ก ์ ๊ฐ๋ 2. ํผ์ ํธ๋ก ํ์ต์ ์๋ฏธ 3. ํผ์ ํธ๋ก ํ์ต ๋ฐฉ๋ฒ 4. ํผ์ ํธ๋ก ํ์ต ์ ์ฐจ 1. ํผ์ ํธ๋ก ์ ๊ฐ๋ ํผ์ ํธ๋ก ์ ํ์ต ์ ์ฐจ๋ฅผ ์์๋ณด๊ธฐ ์ ์ ํผ์ ํธ๋ก ๊ฐ๋ ์ ๋ํด ์์๋ด ๋๋ค. ํผ์ ํธ๋ก ์ ์ด์ง ๋ถ๋ฅ(Binary Classification) ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํ ์ง๋ํ์ต(Supervised Learning) ๊ธฐ๋ฐ์ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ์ด์ง๋ถ๋ฅ๋ ์๋ฅผ ๋ค์ด ์ธ๊ณต์ง๋ฅ(AI)์๊ฒ ๋ฌด์์๋ก ๋๋ฌผ ์ฌ์ง์ ๋ณด์ฌ์ฃผ์์ ๋ ๊ณ ์์ด ์ฌ์ง์ธ์ง, ๊ฐ์์ง ์ฌ์ง์ธ์ง ๋ถ๋ฅํ๋ ๋ฌธ์ ์ ๋๋ค. ์ฌ๊ธฐ์ ๊ณ ์์ด, ๊ฐ์์ง์ ๊ฐ์ ์ ํ์ง๋ฅผ ํด๋์ค(Class)๋ผ๊ณ ๋ถ๋ฅด๊ณ ์ ํ์ง๊ฐ 2๊ฐ์ธ ๊ฒฝ์ฐ๋ฅผ ์ด์ง ๋ถ๋ฅ๋ผ๊ณ ํฉ๋๋ค. ์ํ์ ์ธ ์ธก..
๋ณธ ํฌ์คํ ์์๋ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ด๊ธฐ ํํ์ด์ ๊ตฌ์ฑ ์์์ธ ํผ์ ํธ๋ก (Perceptron)์ ๊ฐ๋ ์ ๋ํด ์์๋ด ๋๋ค.๐ ๋ชฉ์ฐจ1. ํผ์ ํธ๋ก ๊ฐ์ 2. ์๋ฌผํ ๋ด๋ฐ์ ์ญํ ๊ณผ ๋์๊ณผ์ 3. ํผ์ ํธ๋ก ์ ์ญํ ๊ณผ ๋์๊ณผ์ 4. ํผ์ ํธ๋ก ์ ์ข ๋ฅ 4.1. ๋จ์ธต ํผ์ ํธ๋ก 4.2. ๋ค์ธต ํผ์ ํธ๋ก 1. ํผ์ ํธ๋ก (Perceptron) ๊ฐ์ํผ์ ํธ๋ก (Perceptron)์ ์ธ๊ณต ์ ๊ฒฝ๋ง(Aritificial Neural Network, ANN)์ ๊ตฌ์ฑ ์์(unit)๋ก์ ๋ค์์ ๊ฐ์ ์ ๋ ฅ๋ฐ์ ํ๋์ ๊ฐ์ผ๋ก ์ถ๋ ฅํ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. Perceptron์ perception๊ณผ neuron์ ํฉ์ฑ์ด์ด๋ฉฐ ์ธ๊ณต ๋ด๋ฐ์ด๋ผ๊ณ ๋ ๋ถ๋ฆ ๋๋ค. ์ฆ, ํผ์ ํธ๋ก ์ ์๋ฌผํ์ ์ธ ์ ๊ฒฝ๊ณ(Neual Network)์ ๊ธฐ๋ณธ ๋จ์์ธ ์ ๊ฒฝ์ธํฌ(=๋ด๋ฐ)์ ๋์..