- Today
- Total
๋ชฉ๋ก๋ฐ์ดํฐ๋ถ์ (13)
DATA101
“์์ฒญ์๋ค์ ์ด ์ฐจ๋ฅผ ์ด๋ป๊ฒ ๋๊ผ์๊น?” DATA101์ ์์ด์ค๋6 ํ์ด์ค๋ฆฌํํธ ๊ด๋ จ ์ ํ๋ธ ์์น·๋ฆฌ๋ทฐ ์์ ๋๊ธ์ ์์งํดAI ๊ธฐ๋ฐ ํ ์คํธ ๋ถ์์ผ๋ก ์ ์ฌ ๊ณ ๊ฐ ๋ฐ์์ ์ ๋ํํ๋ ๋์๋ณด๋๋ฅผ ์ง์ ๊ตฌ์ถํ์ต๋๋ค. ์ด๋ฒ ํ๋ก์ ํธ๋ ๋จ์ ๋๊ธ ์ง๊ณ๊ฐ ์๋, โ ๋๊ธ ์ ํ ์๋ ๋ถ๋ฅโ ๊ธ·๋ถ์ ๊ฐ์ ๋ถ์โ ํต์ฌ ํค์๋ ์ถ์ถโ ์ฃผ์ ์๊ฒฌ ๊ตฌ์กฐํ ๋ฅผ ํตํด ‘๋ณด์ด์ง ์๋ ๊ณ ๊ฐ ์ธ์’์ ๋ฐ์ดํฐ๋ก ๋๋ฌ๋ด๋ ๊ฒ์ด ๋ชฉํ์์ต๋๋ค.๐ ๋ถ์ ํฌ์ธํธ๐ Youtube ์์ ์กฐํ์ ์์ ๋ด ๋๊ธ ์๋ ์์ง๐ LLM ๊ธฐ๋ฐ ๋๊ธ ์ ํ ๋ถ๋ฅ (๋์์ธ / ์น์ฐจ๊ฐ / ๊ฐ๊ฒฉ / ๊ฒฝ์์ฐจ ๋น๊ต ๋ฑ)๐ ๊ธ์ ·๋ถ์ ·์ค๋ฆฝ ๋ฐ์ ์๋ ํ๊น ๐ ๋๊ธ ์ ํ × ๊ฐ์ ๋ฐ์ ๊ต์ฐจ ๋ถ์๐ ํต์ฌ ํค์๋ Top100 + ์ฃผ์ ๋๊ธ ์๋ ์ ๋ฆฌ ์ด๋ฅผ Tableau ..
“๋ฐ๋ ค๊ฒฌ์ ๊ฑด๊ฐ, ๊ฐ์ด ์๋๋ผ ๋ฐ์ดํฐ๋ก ๊ด๋ฆฌํ ์ ์์๊น?” DATA101์ AI Hub ๋ฐ๋ ค๋๋ฌผ ๊ฑด๊ฐ ๋ฐ์ดํฐ 6,000๊ฑด ์ด์์ ํ์ฉํด๋ฐ๋ ค๊ฒฌ ํ์ข ·์ํ์ต๊ด·์ํ ์งํ๋ฅผ ํตํฉ ๋ถ์ํ๋ End-to-End ๋ฐ์ดํฐ ๋ถ์ ํ๋ก์ ํธ๋ฅผ ์ํํ์ต๋๋ค. ์ด๋ฒ ํ๋ก์ ํธ์ ๋ชฉํ๋ ๋จ์ ํต๊ณ๊ฐ ์๋๋ผ, ๐ ํ์ข ๋ณ ๊ฑด๊ฐ ์ฐจ์ด๋ฅผ ์ ๋ํํ๊ณ ๐ ์คํธ๋ ์ค·์ผ์ฆ·๋น๋ง ์ํ ์์ธ์ ๊ตฌ์กฐํํ์ฌ๐ ์ค์ ํฌ์ค์ผ์ด ์๋น์ค·์ ํ ๊ธฐํ์ ํ์ฉ ๊ฐ๋ฅํ ์ธ์ฌ์ดํธ๋ฅผ ๋์ถํ๋ ๊ฒ. ์ด ๋ถ์์ ๋จ์ ๋ฆฌํฌํธ๊ฐ ์๋๋ผ, โ ํ์ข ๋ณ ๋ง์ถค ํฌ์ค์ผ์ด ์ ๋ตโ ์ฌ๋ฃ·์์์ ํ๊น ์ค๊ณโ ํซ ํฌ์ค ์๋น์ค ๊ธฐํโ ์ํ๊ตฐ ์ธ๊ทธ๋จผํธ ์ ์ ๋ฑ ์ค์ ๋น์ฆ๋์ค ์์ฌ๊ฒฐ์ ์ผ๋ก ๋ฐ๋ก ์ฐ๊ฒฐ ๊ฐ๋ฅํ ๊ตฌ์กฐ๋ก ์ค๊ณ๋์์ต๋๋ค. ๐จ๐ป DATA101์ ๋ฐ์ดํฐ ์์ง๋ถํฐ AI ์๋น์ค ๊ฐ๋ฐ๊น..
์๋ ํ์ธ์, AI/๋น ๋ฐ์ดํฐ๋ถ์ ์ฐ๊ตฌ๊ฐ๋ฐ ์ ๋ฌธ๋ฒ์ธ DATA101 ํ์ ๋๋ค๐ ๐ ๋ํ๋ฏผ๊ตญ ๋ํ ์๋์ฐจ ์ ํ๋ธ ์ฑ๋ ๊นํ์ฉ์mocar์ 2024๋ ์ ๋ก๋ ์์๋ค์ AI์ ๋น ๋ฐ์ดํฐ ๊ธฐ์ ์ ํ์ฉํด ์์ฒญ์๋ค์ ๋ฐ์์ ๋ถ์ํด ๋ดค์ต๋๋ค! ๐ ์ปจํ ์ธ ์ฃผ์ ๋ณ ๋๊ธ์ ํ ์คํธ๋ง์ด๋ํ๊ณ ์กฐํ์/์ข์์์/๋๊ธ ๋ฑ์ ์ข ํฉ ๊ณ ๋ คํ์ฌ, ์์ฒญ์๋ค์ด ์ปจํ ์ธ ๋ง๋ค ์ด๋ค ๋ฐ์์ ๋ณด์๋์ง ํ์ธํด ๋ณด์ธ์. ์ด๋ฒ ๋ถ์ ์ฃผ์ ๋ ๋ค์๊ณผ ๊ฐ์์! #1. ์์ฒญ์๋ค์ด ๊ฐ์ฅ ๊ด์ฌ์ด ๋์ ์ ์ฐจ, ์์น๊ธฐ์ ๋ํ ๋ฐ์ ๋ถ์#2. ๋๊ธ ํธ๋ ๋๋ก ์ดํด๋ณธ ์ ๊ธฐ์ฐจํฌ๋น์ ์ธ์ ๋ณํ ๋ถ์#3. ์์์ฑ๊ณต์งํ ๊ธฐ๋ฐ, 24๋ HOT ํ๋ ์์๊ณผ ์ธ๋ํ ๊ด์ฌ์ ๋ฐ์ ์์ ์๊ฐ ๐จ๐ป ์ ํฌ DATA101 ํ์ ์ด์ฒ๋ผ ์ ํ๋ธ Data๋ฅผ ์ค์ฌ์ผ๋ก ์ ๋ฌธ์ ์ด๊ณ ๋ง์ถคํ๋ ์ปจํ ์ธ ๋ถ์..
์๋ ํ์ธ์, AI/๋น ๋ฐ์ดํฐ๋ถ์ ์ฐ๊ตฌ๊ฐ๋ฐ ์ ๋ฌธ๋ฒ์ธ DATA101 ํ์ ๋๋ค๐ ๐ DATA101 ํ์์ ์์ธ ์งํ์ฒ ๋ฌด์์น์ฐจ Data๋ฅผ ํตํด ์๋ฏผ์ฐธ์ฌ, ์ด๋, ์ํ ํจํด์ ๋ถ์ํ ์ธ์ฌ์ดํธ๋ฅผ ํ์ธํด ๋ณด์ธ์! ๐ ์๋ฏผ์ฐธ์ฌ – ์งํ์ ๋ชจ์์ด ์ด๋ฆฌ๋ ๋ , ์งํ์ฒ Data๋ ๋ชฉ์๋ฆฌ๊ฐ ๋ชจ์ด๋ ํ์ ๋ณด์ฌ์ค๋๋ค.๐ถ ์ด๋ – ๋ ธ๋ ์ธต์ ์ผ์์ ๋ฐ๊ฑธ์์ ์์ฅ๊ณผ ๊ณจ๋ชฉ์ ์๊ณ , ๋์์ ๋ฐ๋ปํ ์ํ์์ ๊ธฐ๋กํฉ๋๋ค.๐ค ์ํ ํจํด – ์ซ์ ์์๋ ๋จ์ํ ์ด๋์ด ์๋๋ผ ์ถ์ ํ์ ๊ณผ ์ฐ๊ฒฐ์ด ๋ด๊ฒจ ์์ต๋๋ค. Data๋ ๋์์ ๋ฏผ๋ฏ์ ๋น์ถ๋ ๊ฑฐ์ธ์ด์, ๋ฏธ๋๋ฅผ ์ฝ๋ ์ธ์ฌ์ดํธ๊ฐ ๋ฉ๋๋ค.๋ค์์ ๋ ์ด๋ค ์์ง์์ ๋ด์๋ผ๊น์? ํ์ Data ๋ถ์์ ํตํด ์ฌ๋ฌ๋ถ์ด ์์๋ณด๊ณ ์ถ์๋ ์ด์๊ฐ ์๋ค๋ฉด ๋๊ธ๋ก ๋จ๊ฒจ์ฃผ์ธ์๐DATA101 ํ์ด ํฅ๋ฏธ๋ก์ด ์ฃผ..
๐ ์ง๋ 2์, ๋ฐ์ดํฐ์๋์ ํ์ AI/๋น ๋ฐ์ดํฐ๋ถ์ ์๋ฃจ์ ์ด No.1 ํ๋ฆฌ๋์ ๋ง์ผ ํฌ๋ชฝ์์ ์์ ํ ์์ 2% ์ ๋ฌธ๊ฐ ์๋น์ค์ธ prime์ ์ ์ ๋์์ต๋๋ค. ๐ prime์ 100๋ง ๊ฑด ์ด์์ ํฌ๋ชฝ ๊ฑฐ๋ Data๋ฅผ ๋ถ์ํ๊ณ ์๋น์ค ๋ง์กฑ๋ 99% ์ด์์ธ ์ ๋ฌธ๊ฐ ์ธํฐ๋ทฐ ๋ฐ ๋ ํผ๋ฐ์ค ์ฒดํฌ๋ฅผ ํตํด ์์ ๋ 300์ฌ ๋ช ์ ์์ ์ ๋ฌธ๊ฐ์๊ฒ๋ง ์ฃผ์ด์ง๋ ์๋น์ค์ ๋๋ค. ๐ค ์ฃผ๋ก Prime ์ ๋ฌธ๊ฐ๋ ๋๊ธฐ์ ๋ถํฐ ์คํํธ์ , ์ ๋ถ๊ธฐ๊ด๊น์ง B2B ๊ณ ๊ฐ์ ์ฃผ ํ๊ฒ์ผ๋ก ๊ฑฐ๋ํ๋ ํ์ง๋ณด์ฅ ์ ์ฒด๋ค๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค. ๐จ๐ป ํ์ฌ ์ ํฌ ๋ฐ์ดํฐ์๋์ ํ์ AI๋ฅผ ํ์ฉํ ๋น ๋ฐ์ดํฐ๋ถ์ ์๋ฃจ์ ๊ตฌ์ถ๋ถํฐ ๋ค์ํ ์ฐ์ ๊ตฐ์ ๋น ๋ฐ์ดํฐ ๋ถ์ ๊ณผ์ ์ํ์ ์ง์ํด ๋๋ฆฌ๊ณ ์์ต๋๋ค. ๐ AI ๊ธฐ์ ์ ํ์ฉํ SW ์ธํ๋ผ ๊ตฌ์ถ์ด๋ ๋น ๋ฐ์ดํฐ ๋ถ์..
๐ ๋ค์ด๊ฐ๋ฉฐ๋ณธ ํฌ์คํ ์์๋ ํ์ด์ฌ pandas ์ฌ์ฉ ์ ๋ฐ์ดํฐํ๋ ์ ์ ์ฒด ํ๊ณผ ์ด ์กฐํ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค.๐ก์ํฉํ๋ค์ค ํตํด ์์ ํ์ผ ์กฐํ ์ ๊ธฐ๋ณธ๊ฐ์ผ๋ก๋ ์ผ๋ถ ํ๊ณผ ์ด์ด ์จ๊น์ฒ๋ฆฌ ๋๋ ํ์์ด ๋ฐ์ํฉ๋๋ค(๊ทธ๋ฆผ 1).# ๋ฏธ์ค์น ์ pip install pandasimport pandas as pddf = pd.read_excel(filepath+filename, sheet_name = 'Sheet2')df.head()โ ํด๊ฒฐ๋ฐฉ๋ฒํด๊ฒฐ๋ฐฉ๋ฒ์ ๊ฐ๋จํฉ๋๋ค. ์๋์ ๊ฐ์ด ํ๋ค์ค ์ต์ ์ ๋ณ๊ฒฝํด ์ฃผ๋ฉด ๋ฉ๋๋ค.1) ๋ชจ๋ ์ด ์ถ๋ ฅ์๋์ ๋ช ๋ น์ด๋ง ์คํํด ์ฃผ๋ฉด ๋ชจ๋ ์ด์ ์กฐํํ ์ ์์ต๋๋ค(๊ทธ๋ฆผ 2).pd.set_option('display.max_columns', None)2) ๋ชจ๋ ํ ์ถ๋ ฅ์ ์ฌํ๊ฒ ๋ชจ๋ ํ ์ถ๋ ฅํ๋ ๋ช ..
๐ก ๋ค์ด๊ฐ๋ฉฐ Numpy ํจํค์ง์ where ํจ์๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐํ๋ ์์์ ํน์ ์กฐ๊ฑด์ ๋ง๋ ์ธ๋ฑ์ค๋ฅผ ์ฐพ๊ฑฐ๋, ํด๋น ์ธ๋ฑ์ค์ ๊ฐ์ ์ฝ๊ฒ ๋ฐ๊ฟ ์ ์์ต๋๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก numpy ํจํค์ง ์ค์น ๋ฐ import๋ ํ์์ ๋๋ค. !pip install numpy import numpy as np 1. ์กฐ๊ฑด์ ๋ง๋ ์ธ๋ฑ์ค ๋ฐํ ์๋์ ๊ฐ์ด ์กฐ๊ฑด๋ฌธ์ ์ ๋ ฅํ๋ฉด, ์กฐ๊ฑด์ ํด๋น๋๋ ์ธ๋ฑ์ค๋ฅผ ๋ฐํํฉ๋๋ค. np.where(์กฐ๊ฑด๋ฌธ) ์๋์ ๊ฐ์ ๋ฐ์ดํฐ์ ์ด ์์ ๋, THK ์นผ๋ผ ๋ด ๊ฐ์ด 30๋ณด๋ค ํฐ ๊ฐ์ ์ธ๋ฑ์ค๋ฅผ ์กฐํํด ๋ณด๋ฉด ์๋์ ๊ฐ์ต๋๋ค. np.where(30 < DATASET_RAW['THK']) 2. ์กฐ๊ฑด์ ๋ฐ๋ผ ๋ฐ์ดํฐ ์ธ์ฝ๋ฉ ์๋์ ๊ฐ์ด, ์กฐ๊ฑด๋ฌธ๊ณผ ํจ๊ป ์กฐ๊ฑด๋ฌธ์ด ์ฐธ ํน์ ๊ฑฐ์ง์ผ ๊ฒฝ์ฐ ๊ฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ๋ณํํ ๊ฐ์ ์ ๋ ฅํด ..
๐ก ๋ค์ด๊ฐ๋ฉฐ๋ฐ์ดํฐํ๋ ์ ๋ด ๋ฌธ์์ด ํ ๊ธ์๊น์ง ์๋ฒฝํ๊ฒ ์ผ์นํ๋ ์์๋ฅผ ์ฐพ๋์ง ํน์ ์ผ๋ถ ๊ธ์๋ผ๋ ์ผ์นํ๋ ์์๋ฅผ ์ฐพ์์ง์ ๋ฐ๋ผ ์ฌ์ฉํด์ผ ํ ํจ์๊ฐ ๋๋ฉ๋๋ค(์๋ ํ ์ฐธ๊ณ ).No.ํจ์ํ์ฉ๋ฐฉ์1replace()์๋ฒฝํ๊ฒ ์ผ์นํ๋ ๋จ์ด๋ฅผ ์ฐพ์ ๋ฐ๊พธ๋ ๊ฒฝ์ฐ2str.replace()์ผ๋ถ ๋จ์ด๋ผ๋ ์ผ์นํ๋ ๋จ์ด๋ฅผ ์ฐพ์ ๋ฐ๊พธ๋ ๊ฒฝ์ฐํจ์๋ณ๋ก ๊ฐ๊ฐ ์์ธํ ์์๋ด ๋๋ค.๐ ๋ชฉ์ฐจ1. replace ํจ์ 1) ๊ธฐ๋ณธ ์ฌ์ฉ๋ฐฉ๋ฒ 2) ์ฌ๋ฌ ๋ฌธ์์ด ๋์ ๋ณ๊ฒฝ 3) ํน์ ์นผ๋ผ ๋ฐ์ดํฐ ๋ณ๊ฒฝ 4) ์๋ณธ ๋ฐ์ดํฐ ๋ณ๊ฒฝ์ต์ (inplace)2. str.replace ํจ์1) ๊ธฐ๋ณธ ์ฌ์ฉ๋ฐฉ๋ฒ๋ด์ฅ ํจ์ replace๋ ๋ฐ์ดํฐํ๋ ์ ๋ด ํน์ ๋ฌธ์์ด๊ณผ ์๋ฒฝํ๊ฒ ์ผ์นํ๋ ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ์ฐพ์ ๋ณ๊ฒฝํฉ๋๋ค.df.replace('ํ์ฌ ..
