- Today
- Total
๋ชฉ๋ก์ธ์ด๋ชจ๋ธ (3)
DATA101
๐ ๋ชฉ์ฐจ1. Perplexity ๊ฐ๋ 2. Perplexity ๊ฐ์ ์๋ฏธ3. Perplexity ๊ณ์ฐ๋ฐฉ๋ฒ1. Perplexity ๊ฐ๋ 1.1. ๊ฐ์Perplexity(PPL)๋ ํ ์คํธ ์์ฑ(Text Generation) ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ ํ๊ฐ์งํ ์ค ํ๋์ ๋๋ค. Perplexity๋ 'ํํ๋ ์ํฐ'๋ผ๊ณ ์ฝ์ผ๋ฉฐ, '(๋ฌด์ธ๊ฐ๋ฅผ ์ดํดํ ์ ์์ด) ๋นํน์ค๋ฌ์ด ์ ๋' ๋๋ 'ํท๊ฐ๋ฆฌ๋ ์ ๋'๋ก ์ดํดํ์๋ฉด ๋ฉ๋๋ค(cf., ๋ค์ด๋ฒ ์์ด์ฌ์ ). ์ผ๋ฐ์ ์ผ๋ก ํ ์คํธ ๋ฐ์ดํฐ์ ์ด ์ถฉ๋ถํ ์ ๋ขฐํ ๋งํ ๋ Perplexity ๊ฐ์ด ๋ฎ์์๋ก ์ธ์ด ๋ชจ๋ธ์ด ์ฐ์ํ๋ค๊ณ ํ๊ฐํฉ๋๋ค. ์ด์ ๋ํ ๋ด์ฉ์ ์ด์ด์ง๋ '2. Perplexity ๊ฐ์ ์๋ฏธ' ์น์ ์์ ๋์ฑ ์์ธํ ๋ค๋ฃน๋๋ค.1.2. ๋ถ๊ธฐ๊ณ์Perplexity๋ ๊ณง ์ธ์ด ๋ชจ๋ธ์ ..
๐ ๋ชฉ์ฐจ1. N-gram ๊ฐ๋ 2. N-gram ๋ฑ์ฅ ๋ฐฐ๊ฒฝ3. N-gram ์ข ๋ฅ 4. N-gram ๊ธฐ๋ฐ ๋จ์ด ์์ธก 5. N-gram์ ํ๊ณ์ 1. N-gram ๊ฐ๋ ์ธ์ด ๋ชจ๋ธ(Language Model)์ ๋ฌธ์ฅ ๋ด ์์ ๋ฑ์ฅํ ๋จ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด์ด์ ๋ฑ์ฅํ ์ ์ ํ ๋จ์ด๋ฅผ ์์ธกํ๋ ๋ชจ๋ธ์ ๋๋ค. ์ธ์ด ๋ชจ๋ธ์ ํฌ๊ฒ ํต๊ณํ ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ(Statistical Language Model, SLM)๊ณผ ์ธ๊ณต์ ๊ฒฝ๋ง(Artificial Neural Network, ANN) ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ด ์์ต๋๋ค. N-gram์ ํต๊ณํ ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ ์ค ํ๋์ ๋๋ค. N-gram ์ธ์ด ๋ชจ๋ธ์ ์ด์ฒ๋ผ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ ๋ ๋ฌธ์ฅ ๋ด ๋ชจ๋ ๋จ์ด๋ฅผ ๊ณ ๋ คํ์ง ์๊ณ ํน์ ๋จ์ด์ ๊ฐ์(\(N\))๋ง ๊ณ ๋ คํฉ๋๋ค. ์ฆ, N-gram์ \(N\)..
๋ณธ ํฌ์คํ ์์๋ ํต๊ณํ์ ์ธ์ด ๋ชจ๋ธ์ ๊ฐ๋ ๋ฐ ํน์ง์ ๋ํด ์์๋ด ๋๋ค.๐ ๋ชฉ์ฐจ1. ๊ฐ๋ 2. ํ๋ฅ ์ ํํ 3. ์ ์ฉ๋ถ์ผ1. ๊ฐ๋ 1.1. ๊ฐ์์ธ์ด ๋ชจ๋ธ(Language Model)์ ๋ฌธ์ฅ์ด ์ผ๋ง๋ ์์ฐ์ค๋ฌ์ด์ง ํ๋ฅ ์ ์ผ๋ก ๊ณ์ฐํจ์ผ๋ก์จ ๋ฌธ์ฅ ๋ด ํน์ ์์น์ ์ถํํ๊ธฐ ์ ํฉํ ๋จ์ด๋ฅผ ํ๋ฅ ์ ์ผ๋ก ์์ธกํ๋ ๋ชจ๋ธ์ ๋๋ค. ๋์ฑ ์ฝ๊ฒ ์ค๋ช ํ์๋ฉด, ์ธ์ด ๋ชจ๋ธ์ ๋ฌธ์ฅ ๋ด ์์ ๋ฑ์ฅํ ๋จ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ ์ด๋ค ๋จ์ด๊ฐ ๋ฑ์ฅํด์ผ ๋ฌธ์ฅ์ด ์์ฐ์ค๋ฌ์ด์ง ํ๋จํ๋ ๋๊ตฌ์ ๋๋ค.์ธ์ด ๋ชจ๋ธ์ ํฌ๊ฒ ํต๊ณํ์ ์ธ์ด ๋ชจ๋ธ๊ณผ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ด ์์ต๋๋ค. ์ต๊ทผ์๋ BERT, GPT-3์ ๊ฐ์ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ๋ฐ์ด๋ ๋๋ถ๋ถ์ ์์ฐ์ด์ฒ๋ฆฌ ๋ฌธ์ ์์๋ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ธฐ๋ฐ์ ์ธ์ด ๋ชจ๋ธ์ ์ฌ์ฉํฉ๋๋ค. ๋ณธ ํฌ์คํ ์์๋ ํต๊ณํ ..