- Today
- Total
๋ชฉ๋กAI (21)
DATA101
๐ ๋ชฉ์ฐจ1. ์ต์ ํ ๊ฐ๋ 2. ๊ธฐ์ธ๊ธฐ ๊ฐ๋ 3. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ ๊ฐ๋ 4. ๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ ํ๊ณ1. ์ต์ ํ ๊ฐ๋ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ์ต์ ํ(Optimization)๋ ์์ค ํจ์(Loss Function) ๊ฐ์ ์ต์ํํ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ตฌํ๋ ๊ณผ์ ์ ๋๋ค(์๋ ๊ทธ๋ฆผ 1 ์ฐธ๊ณ ). ๋ฅ๋ฌ๋์์๋ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅํ์ฌ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ๊ฑฐ์ณ ์์ธก๊ฐ(\(\hat{y}\))์ ์ป์ต๋๋ค. ์ด ์์ธก๊ฐ๊ณผ ์ค์ ์ ๋ต(\(y\))๊ณผ์ ์ฐจ์ด๋ฅผ ๋น๊ตํ๋ ํจ์๊ฐ ์์ค ํจ์์ ๋๋ค. ์ฆ, ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ฏ๊ฐ์ ์ฐจ์ด๋ฅผ ์ต์ํํ๋ ๋คํธ์ํฌ ๊ตฌ์กฐ์ ํ๋ผ๋ฏธํฐ(a.k.a., Feature)๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด ์ต์ ํ์ ๋๋ค. ์ต์ ํ ๊ธฐ๋ฒ์๋ ์ฌ๋ฌ ๊ฐ์ง๊ฐ ์์ผ๋ฉฐ, ๋ณธ ํฌ์คํ ์์๋ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(Gradient Descent)์ ๋ํด ์์๋ด ๋๋ค.2. ๊ธฐ์ธ๊ธฐ ๊ฐ๋ ..
๐ก ๋ชฉํ ํ๊ท ์ ๋์ค์ฐจ(MAE)์ ๊ฐ๋ ๋ฐ ํน์ง์ ๋ํด ์์๋ด ๋๋ค. 1. MAE ๊ฐ๋ ํ๊ท ์ ๋์ค์ฐจ(Mean Absolute Error, MAE)๋ ๋ชจ๋ ์ ๋ ์ค์ฐจ(Error)์ ํ๊ท ์ ๋๋ค. ์ฌ๊ธฐ์ ์ค์ฐจ๋ ์๊ณ ๋ฆฌ์ฆ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต๊ณผ์ ์ฐจ์ด๋ฅผ ์๋ฏธํฉ๋๋ค. ์ฆ, ์๊ณ ๋ฆฌ์ฆ์ด ์ ๋ต์ ์ ๋งํ์๋ก MSE ๊ฐ์ ์์ต๋๋ค. ๋ฐ๋ผ์, MAE๊ฐ ์์์๋ก ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ด ์ข๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค. MAE์ ์์์ ์ดํด๋ณด๊ฒ ์ต๋๋ค. $$ E = \sum_{i}|y_{i} -\tilde{y_{i}}| $$ \(E\): ์์ค ํจ์ \(y_i\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ์ ์ ๋ต \(\tilde{y_i}\): \(i\)๋ฒ์งธ ํ์ต ๋ฐ์ดํฐ๋ก ์์ธกํ ๊ฐ 2. MAE ํน์ง 2.1. ์ค์ฐจ์ ๋น๋กํ๋ ์์ค ํจ์ MAE๋ ์์ค ํจ์๊ฐ ..
๐๋ชฉ์ฐจ1. ํ์ต ๋ฐ์ดํฐ์ ์์ฑ 2. ์ธ๊ณต์ ๊ฒฝ๋ง ๋ชจํ 3. ํ์ต ๊ณผ์ 4. CBOW vs Skip-gram5. ํ๊ณ์ ๋ค์ด๊ฐ๋ฉฐWord2Vec๋ ํ์ต๋ฐฉ์์ ๋ฐ๋ผ ํฌ๊ฒ \(2\)๊ฐ์ง๋ก ๋๋ ์ ์์ต๋๋ค: Continuous Bag of Words(CBOW)์ Skip-gram. CBOW๋ ์ฃผ๋ณ ๋จ์ด(Context Word)๋ก ์ค๊ฐ์ ์๋ ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์ฌ๊ธฐ์ ์ค๊ฐ์ ์๋ ๋จ์ด๋ฅผ ์ค์ฌ ๋จ์ด(Center Word) ๋๋ ํ๊ฒ ๋จ์ด(Target Word)๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. ๋ฐ๋๋ก, Skip-gram์ ์ค์ฌ ๋จ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ฃผ๋ณ ๋จ์ด๋ค์ ์์ธกํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ์ ํ์ฐ๊ตฌ๋ค์ ๋ฐ๋ฅด๋ฉด, ๋์ฒด๋ก Skip-gram์ด CBOW๋ณด๋ค ์ฑ๋ฅ์ด ์ฐ์ํ๋ค๊ณ ์๋ ค์ ธ ์๋๋ฐ, ์ด์ ๋ํ ์์ธํ ๋ด์ฉ์ ๋ณธ ํฌ์คํ ์ 'Chapter 4..
๋ณธ ํฌ์คํ ์์๋ ํต๊ณํ์ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ ๋ฐ ํน์ง์ ๋ํด ์์๋ด ๋๋ค.๐ ๋ชฉ์ฐจ1. ๊ฐ๋ 2. ํ๋ฅ ์ ํํ 3. ์ ์ฉ๋ถ์ผ1. ๊ฐ๋ 1.1. ๊ฐ์์ธ์ด ๋ชจ๋ธ(Language Model)์ ๋ฌธ์ฅ์ด ์ผ๋ง๋ ์์ฐ์ค๋ฌ์ด์ง ํ๋ฅ ์ ์ผ๋ก ๊ณ์ฐํจ์ผ๋ก์จ ๋ฌธ์ฅ ๋ด ํน์ ์์น์ ์ถํํ๊ธฐ ์ ํฉํ ๋จ์ด๋ฅผ ํ๋ฅ ์ ์ผ๋ก ์์ธกํ๋ ๋ชจ๋ธ์ ๋๋ค. ๋์ฑ ์ฝ๊ฒ ์ค๋ช ํ์๋ฉด, ์ธ์ด ๋ชจ๋ธ์ ๋ฌธ์ฅ ๋ด ์์ ๋ฑ์ฅํ ๋จ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ ์ด๋ค ๋จ์ด๊ฐ ๋ฑ์ฅํด์ผ ๋ฌธ์ฅ์ด ์์ฐ์ค๋ฌ์ด์ง ํ๋จํ๋ ๋๊ตฌ์ ๋๋ค.์ธ์ด ๋ชจ๋ธ์ ํฌ๊ฒ ํต๊ณํ์ ์ธ์ด ๋ชจ๋ธ๊ณผ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ด ์์ต๋๋ค. ์ต๊ทผ์๋ BERT, GPT-3์ ๊ฐ์ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ๋ฐ์ด๋ ๋๋ถ๋ถ์ ์์ฐ์ด์ฒ๋ฆฌ ๋ฌธ์ ์์๋ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค. ๋ณธ ํฌ์คํ ์์๋ ํต๊ณํ ..
๋ณธ ํฌ์คํ ์์๋ ํผ์ ํธ๋ก (Perceptron) ํ์ต(train)์ ์๋ฏธ์ ์ ์ฐจ์ ๋ํด ์์๋ด ๋๋ค. ๐ ๋ชฉ์ฐจ 1. ํผ์ ํธ๋ก ์ ๊ฐ๋ 2. ํผ์ ํธ๋ก ํ์ต์ ์๋ฏธ 3. ํผ์ ํธ๋ก ํ์ต ๋ฐฉ๋ฒ 4. ํผ์ ํธ๋ก ํ์ต ์ ์ฐจ 1. ํผ์ ํธ๋ก ์ ๊ฐ๋ ํผ์ ํธ๋ก ์ ํ์ต ์ ์ฐจ๋ฅผ ์์๋ณด๊ธฐ ์ ์ ํผ์ ํธ๋ก ๊ฐ๋ ์ ๋ํด ์์๋ด ๋๋ค. ํผ์ ํธ๋ก ์ ์ด์ง ๋ถ๋ฅ(Binary Classification) ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํ ์ง๋ํ์ต(Supervised Learning) ๊ธฐ๋ฐ์ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ์ด์ง๋ถ๋ฅ๋ ์๋ฅผ ๋ค์ด ์ธ๊ณต์ง๋ฅ(AI)์๊ฒ ๋ฌด์์๋ก ๋๋ฌผ ์ฌ์ง์ ๋ณด์ฌ์ฃผ์์ ๋ ๊ณ ์์ด ์ฌ์ง์ธ์ง, ๊ฐ์์ง ์ฌ์ง์ธ์ง ๋ถ๋ฅํ๋ ๋ฌธ์ ์ ๋๋ค. ์ฌ๊ธฐ์ ๊ณ ์์ด, ๊ฐ์์ง์ ๊ฐ์ ์ ํ์ง๋ฅผ ํด๋์ค(Class)๋ผ๊ณ ๋ถ๋ฅด๊ณ ์ ํ์ง๊ฐ 2๊ฐ์ธ ๊ฒฝ์ฐ๋ฅผ ์ด์ง ๋ถ๋ฅ๋ผ๊ณ ํฉ๋๋ค. ์ํ์ ์ธ ์ธก..
