- Today
- Total
๋ชฉ๋กํ์ด์ฌ ๋๋คํฌ๋ ์คํธ (1)
DATA101
๐๋ชฉ์ฐจ 1. ๋๋คํฌ๋ ์คํธ ์ ์ 2. ๋๋คํฌ๋ ์คํธ ์ฅ๋จ์ 3. ์ค์ต์ฝ๋ ๋ฐ ๋ฐ์ดํฐ์ 4. ์ฝ๋ ์ค๋ช 1. Random Forest ์ ์ Random Forest๋ ์์ฌ๊ฒฐ์ ๋๋ฌด ๋ชจ๋ธ ์ฌ๋ฌ ๊ฐ๋ฅผ ํ๋ จ์์ผ์ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ข ํฉํด ์์ธกํ๋ ์์๋ธ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ๊ฐ ์์ฌ๊ฒฐ์ ๋๋ฌด ๋ชจ๋ธ์ ํ๋ จ์ํฌ ๋ ๋ฐฐ๊น (Bagging) ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค. ๋ฐฐ๊น ์ ์ ์ฒด Train dataset์์ ์ค๋ณต์ ํ์ฉํด ์ํ๋งํ Dataset์ผ๋ก ๊ฐ๋ณ ์์ฌ๊ฒฐ์ ๋๋ฌด ๋ชจ๋ธ์ ํ๋ จํ๋ ๋ฐฉ์์ ๋๋ค. ์ด๋ ๊ฒ ์ฌ๋ฌ ๋ชจ๋ธ์ ํตํด ์์ธกํ ๊ฐ์ ํ๊ท ์ ์ทจํ์ฌ ์ต์ข ์ ์ธ ์์ธก๊ฐ์ ์ฐ์ถํฉ๋๋ค. ์ด ๋ฐฐ๊น ๋ฐฉ์์ ์์ธก ๋ชจ๋ธ์ ์ผ๋ฐํ(generalization, a.k.a., ์์ ์ฑ) ์ฑ๋ฅ์ ํฅ์ํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. 2. ๋๋คํฌ๋ ์คํธ ์ฅ๋จ์ ์ฅ์ ๋จ์ ์ผ๋ฐํ ๋ฐ ์ฑ๋ฅ..