- Today
- Total
๋ชฉ๋กํ์ด์ฌ ํ๋ค์ค (2)
DATA101
๐ฅ ๋ชฉํ ์ค๋์ ํ์ด์ฌ map ํจ์์ lambda ํจ์๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ํธ๋ค๋งํ๋ ๋ฐฉ๋ฒ๊ณผ ์ด์ ์ ๋ํด ์์๋ด ๋๋ค. ๐จ๐ป ๋ฌธ์ ์ํฉ ์์ ๋ฐ์ดํฐํ๋ ์ ๋ด ํน์ ์นผ๋ผ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ์ด๋ ํ ์ฐ์ฐ์ ๊ฑฐ์ณ ์๋ก์ด ๊ฐ๋ค๋ก ์ด๋ฃจ์ด์ง ์นผ๋ผ์ ์๋กญ๊ฒ ์์ฑํ๊ณ ์ถ๋ค๋ฉด ์ด๋ป๊ฒ ํด์ผ ํ ๊น์? ๊ตฌ์ฒด์ ์ธ ์์์ ํจ๊ป ์์๋ณด๊ฒ ์ต๋๋ค. ์๋์ ๊ฐ์ด dataset์ด๋ผ๋ ๋ฐ์ดํฐํ๋ ์์ yyyymmdd ํ์์ date ์ ๋ณด๊ฐ ๋ด๊ธด date_full ์นผ๋ผ์ด ์๋ค๊ณ ๊ฐ์ ํด ๋ณด๊ฒ ์ต๋๋ค. ๋ง์ฝ, ์๋์ ๊ฐ์ด ์ฐ๋ ์ ๋ณด๋ง ์ถ์ถํ์ฌ date_year๋ผ๋ ์นผ๋ผ์ ์๋กญ๊ฒ ์ ์ฅํ๊ณ ์ถ๋ค๋ฉด ์ด๋ป๊ฒ ์ฝ๋๋ฅผ ์์ฑํด์ผ ํ ๊น์? ๐ก ํด๊ฒฐ๋ฐฉ๋ฒ 1: ๋ฐ๋ณต๋ฌธ ํ์ฉ(Bad Case โ) ๋ฐ๋ณต๋ฌธ์ ํ์ฉํ์ฌ date_full ์นผ๋ผ ๋ด ๋ฐ์ดํฐ๋ฅผ ํ ๊ฐ์ฉ ์ ๊ทผํ์ฌ ..
Step 1. pandas ํจํค์ง import import pandas as pd pandas๋ฅผ import ํด์ค๋๋ค. ์ค์น๊ฐ ์ ๋์ด ์๋ ๋ถ์ ํฐ๋ฏธ๋(์ปค๋งจ๋๋ผ์ธ)์ ์๋ ๋ช ๋ น์ด๋ฅผ ์ ๋ ฅํ์ ์ pandas๋ฅผ ์ค์นํด ์ฃผ์ธ์. $ pip install pandas Step 2. ๋ฐ์ดํฐํ๋ ์ ์ธํ dt = pd.DataFrame({'์ด๋ฆ': ['์ฑ๊ธฐํ', '์กฐ์์ฐ', '์ฅ๋์', '์ค์ผ๋จ', 'ํ๋ฏธ๋ '], '์ฃผ์': ['์์ธ์ ๋๋ด๊ตฌ ์๋ฌธ๋', '์์ธ์ ์ข ๋ก๊ตฌ ํํ๋', '์์ธ์ ๊ฐ๋จ๊ตฌ ์ผ์ฑ๋', '์์ธ์ ๊ฐ๋จ๊ตฌ ๋ ผํ๋', '์์ธ์ ๊ฐ๋จ๊ตฌ ๋ ผํ๋']}) ์์ ๋ฅผ ์ํ ๋ฐ์ดํฐํ๋ ์์ ์ธํ ํ์ต๋๋ค. dt.head() ๋ฐ์ดํฐํ๋ ์์ ์กฐํํ๋ฉด ์๋์ ๊ฐ์ต๋๋ค. Step 3. Series.str.contains('์ฐพ์ ..