- Today
- Total
๋ชฉ๋ก๊ฒฐ์ธก์น์ ๊ฑฐ (1)
DATA101
์ค๋์ ํ์ด์ฌ์ ํตํด ๋ฐ์ดํฐํ๋ ์ ๋ด ๊ฒฐ์ธก์น(Na, NaN, Null)๋ฅผ ์ ๊ฑฐ/์นํํ๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํด ๋๋ฆฝ๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! ๋ผ์ด๋ธ๋ฌ๋ฆฌ import import numpy as np import pandas as pd ๊ฒฐ์ธก์น ์กด์ฌ์ ๋ฌด ํ์ธ # ๋ฐ์ดํฐํ๋ ์ ๋ด null ๋ฐ์ดํฐ ๊ฐ์ ์นด์ดํ . np.sum(pd.isnull(๋ฐ์ดํฐํ๋ ์)) ์ ๋ช ๋ น์ด๋ฅผ ํตํด ์ด๋ค ์นผ๋ผ์, ๋ช ๊ฐ์ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋์ง ๋ฆฌ์คํธ์ ํํ๋ก ํ์ค ์ ์์ต๋๋ค(์๋ ์คํฌ๋ฆฐ์ท ์ฐธ๊ณ ). ์ฐธ๊ณ ๋ก isnull ๋ฉ์๋๋ ๋ฐ์ดํฐํ๋ ์์์ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ฉด True๋ฅผ, ๊ฒฐ์ธก์น๊ฐ ์๋ ๋ฐ์ดํฐ ์์น์์๋ False๋ฅผ ๋ฐํํฉ๋๋ค. ๊ฒฐ์ธก์น ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ # ๋ฐ์ดํฐํ๋ ์ ๋ด ๊ฒฐ์ธก์น๊ฐ ํฌํจํ ๋ชจ๋ ํ์ ์ ๊ฑฐ dataset_drop = dataset_orig..