- Today
- Total
๋ชฉ๋ก์ ์ฒด ๊ธ (355)
DATA101
์๋ ํ์ธ์, ์ค๋์ WHERE ๊ตฌ๋ฌธ์ ํ์ฉํ์ฌ ์กฐ๊ฑด๋ฌธ์ ๋ง๋๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํด ๋๋ฆฝ๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! WHERE: ํน์ ์กฐ๊ฑด์ ๊ฐ์ง ๋ฐ์ดํฐ ์ ๋ณ ์ด๋ฒ ์๊ฐ์ ์ฌ์ฉํ ํ ์ด๋ธ(Salaries)์ ๋ฏธ๊ตญ ์ผ๊ตฌ ๋ฉ์ด์ ๋ฆฌ๊ทธ(MLB)์ ์ฐ๋๋ณ ๋ค์ํ ์ ์ ์ ๋ณด๋ฅผ ๋ด๊ณ ์๋ ๋ฐ์ดํฐ์ ๋ด์์ ์ฐ๋ด์ ๋ณด ํ ์ด๋ธ์ ๋๋ค. ํด๋น ๋ฐ์ดํฐ์ ๋ค์ด๋ก๋๋ ์๋ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์. heytech.tistory.com/11 [SQL] SQLite ๋ฐ ์ฐ์ต์ฉ ๋ฐ์ดํฐ์ ์ค์นํ๊ธฐ! ์ค๋๋ถํฐ SQLite ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ํ์ฉํ์ฌ SQL์ ๊ธฐ๋ณธ์ ์ธ ๋ฌธ๋ฒ์ ๋น ๋ฅด๊ณ ์ฝ๊ฒ ์ ๋ฌํด ๋๋ฆฝ๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! ๋ชฉ์ฐจ 1. SQLite๋? 2. SQLite ์ค์น 3. SQLite Studio ์ค์น 4. ์ฐ์ต์ฉ DB ์ค์น: Baseball Databank...
์๋ ํ์ธ์, ์ง๋ ์๊ฐ์๋ SELECT ๊ตฌ๋ฌธ์ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ถ๋ ฅํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ค๋ฃจ์ด ๋ณด์์ต๋๋ค. heytech.tistory.com/12 [SQL] SELECT: ๋ฐ์ดํฐ ์ถ๋ ฅํ๊ธฐ! (Feat. LIMIT) ์๋ ํ์ธ์, ์ค๋๋ถํฐ SQLite Studio ํ๊ฒฝ์์ SQL ๊ตฌ๋ฌธ์ ์ฐ์ตํด ๋ณด๋ ์๊ฐ์ ๊ฐ๋๋ก ํ๊ฒ ์ต๋๋ค. SQLite Studio ๋ฐ ์ฐ์ต์ฉ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ฅผ ์์ง ์ค์นํ์ง ์์ผ์ ๋ถ๋ค์ ์๋ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์ : heytech.tistory.com ์ค๋์ SQLite Studio ํ๊ฒฝ์์ ๋ฐ์ดํฐ ์ ๋ ฌ์ ๋์์ฃผ๋ ORDER BY ๊ตฌ๋ฌธ ํ์ฉ๋ฐฉ๋ฒ์ ๋ํด ๊ณต์ ํด ๋๋ฆฝ๋๋ค. SQLite/SQLite Studio ๋ฐ ์ฐ์ต์ฉ ๋ฐ์ดํฐ์ ์ค์น๋ ์๋ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์! heytech.tistory.c..
์ค๋์ ํ์ด์ฌ์ ํตํด ๋ฐ์ดํฐํ๋ ์ ๋ด ๊ฒฐ์ธก์น(Na, NaN, Null)๋ฅผ ์ ๊ฑฐ/์นํํ๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํด ๋๋ฆฝ๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! ๋ผ์ด๋ธ๋ฌ๋ฆฌ import import numpy as np import pandas as pd ๊ฒฐ์ธก์น ์กด์ฌ์ ๋ฌด ํ์ธ # ๋ฐ์ดํฐํ๋ ์ ๋ด null ๋ฐ์ดํฐ ๊ฐ์ ์นด์ดํ . np.sum(pd.isnull(๋ฐ์ดํฐํ๋ ์)) ์ ๋ช ๋ น์ด๋ฅผ ํตํด ์ด๋ค ์นผ๋ผ์, ๋ช ๊ฐ์ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋์ง ๋ฆฌ์คํธ์ ํํ๋ก ํ์ค ์ ์์ต๋๋ค(์๋ ์คํฌ๋ฆฐ์ท ์ฐธ๊ณ ). ์ฐธ๊ณ ๋ก isnull ๋ฉ์๋๋ ๋ฐ์ดํฐํ๋ ์์์ ๊ฒฐ์ธก์น๊ฐ ์กด์ฌํ๋ฉด True๋ฅผ, ๊ฒฐ์ธก์น๊ฐ ์๋ ๋ฐ์ดํฐ ์์น์์๋ False๋ฅผ ๋ฐํํฉ๋๋ค. ๊ฒฐ์ธก์น ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ # ๋ฐ์ดํฐํ๋ ์ ๋ด ๊ฒฐ์ธก์น๊ฐ ํฌํจํ ๋ชจ๋ ํ์ ์ ๊ฑฐ dataset_drop = dataset_orig..
์ค๋์ ํ์ด์ฌ์ ํตํด ์ด๋ชจํฐ์ฝ์ ํ ์คํธ๋ก, ํ ์คํธ๋ฅผ ์ด๋ชจํฐ์ฝ์ผ๋ก ๋ณํํ๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํด ๋๋ฆฝ๋๋ค.๋ฐ๋ก ์์ํ์ฃ !๋ชฉ์ฐจ1. emoji ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์น2. emoji ๋ผ์ด๋ธ๋ฌ๋ฆฌ import3. emoji-text ๋ณํ3.1. emoji to text3.2. text to emojiReferences1. emoji ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ค์นpip install emoji2. emoji ๋ผ์ด๋ธ๋ฌ๋ฆฌ importimport emoji3. emoji-text ๋ณํ3.1. emoji to textprint(emoji.demojize('๐'))print(emoji.demojize('๐ถ'))print(emoji.demojize('โค๏ธ')) emoji ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ด demojize ๋ฉ์๋๋ฅผ ์ด์ฉํ์ฌ ํ ์คํธ๋ก ๋ณํํ ์ด๋ชจ..
์๋ ํ์ธ์, ์ค๋์ ํ์ด์ฌ ๋๋ค(lambda) ํจ์์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! 1. Lambda ํจ์๋ ์ธ์ ์ฌ์ฉํ๋ฉด ์ข์๊น? ํ์ด์ฌ์์ ํน์ ๊ธฐ๋ฅ์ ๊ตฌํํ๊ณ ๋ฐ๋ณต์ ์ผ๋ก ์ง๊ด์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ํด ํจ์๋ฅผ ๋ง์ด ์ฌ์ฉํ๊ณ ๊ณ์ค ๊ฒ๋๋ค. ์์๋ก ์ด๋ค ๊ฐ์ ํจ์์ ์ ๋ ฅํ๋ฉด ์ ๊ณฑํ์ฌ ๋ฐํํด์ฃผ๋ ํจ์๋ฅผ ๋ง๋ค์ด ๋ดค์ต๋๋ค. def squareOut(input_data): return input_data**2 squared_value = squareOut(7) print(squared_value) # 49 ์ถ๋ ฅ ์ผํ์ฑ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ํด ์ด๋ฌํ ํจ์๋ฅผ ๋ง๋๋ ๊ฒ์ ๋งค์ฐ ๊ท์ฐฎ๊ธฐ๋ ํ์ง๋ง ๋ฉ๋ชจ๋ฆฌ์ ๋ญ๋น๋ฅผ ์ ๋ฐํ์ฃ . ๋ฐ๋ฉด, lambda ํจ์์ ์ฌ์ฉ์ ๋ฉ๋ชจ๋ฆฌ ์ ๋ฐ์ ๋ฐฉ์งํ ๋ฟ๋ง ์๋๋ผ ํจ์ ํํ์ ๊ธฐ๋ฅ์ ๋ง๋ค ์ ์๋..
1. ํ ๋ง ๋ค์ด๋ก๋ pip install jupyterthemes 2. ๋ณ๊ฒฝ๊ฐ๋ฅํ ํ ๋ง ๋ฆฌ์คํธ ํ์ธ jt -l # ๋ณ๊ฒฝ๊ฐ๋ฅํ ํ ๋ง ๋ฆฌ์คํธ๋ฅผ ๋ณด์ฌ์ค๋๋ค. ์ด 9๊ฐ์ ํ ๋ง๋ฅผ ์ง์ํฉ๋๋ค. - chesterish - grade3 - gruvboxd - gruvboxl - monokai - oceans16 - onedork - solarizedd - solarizedl 3. ํ ๋ง ๋ณ๊ฒฝํ๊ธฐ jt -t [๋ณ๊ฒฝํ๊ณ ์ถ์ ํ ๋ง ์ด๋ฆ ์ ๋ ฅ] ๋ณ๊ฒฝํ๊ณ ์ถ์ผ์ ํ ๋ง ์ด๋ฆ์ ๊ดํธ ์์ ๋ฃ์ด์ ๋ช ๋ น์ด๋ฅผ ์ ๋ ฅํด ์ฃผ์ธ์. ์ฃผํผํฐ ๋ ธํธ๋ถ ์ฐฝ์ ์๋ก๊ณ ์นจ ํ์๋ฉด ํ ๋ง๊ฐ ๋ณ๊ฒฝ๋ ๊ฒ์ ํ์ธํ์ค ์ ์์ต๋๋ค :) # ์์ jt -t chesterish # ์ฝ๋ ์ ๋ ฅ ํ ์ฃผํผํฐ ๋ ธํธ๋ถ ์๋ก๊ณ ์นจ! 4. (Optional) ํ ๋ง ๊ด๋ จ ๋ช ๋ น์ด ๋ชจ์ ..
๋ณธ ํฌ์คํ ์์๋ KoNLPy ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ด Mecab ํํ์ ๋ถ์๊ธฐ์ ๊ณ ์ ๋ช ์ฌ ์ถ๊ฐ ๋ฐฉ๋ฒ์ ์์๋ด ๋๋ค.๋ชฉ์ฐจ1. Mecab ๊ณ ์ ๋ช ์ฌ ์ฌ์ ์ ๊ทผ2. ๊ณ ์ ๋ช ์ฌ ์ฌ์ ๋ฑ๋กํ๊ธฐ3. ๊ณ ์ ๋ช ์ฌ ์ฌ์ ์ ๋ฐ์ดํธ4. (Optional) ๊ณ ์ ๋ช ์ฌ ์ฌ์ ๋ฑ๋ก์ฌ๋ถ ํ์ธ1. Mecab ๊ณ ์ ๋ช ์ฌ ์ฌ์ ์ ๊ทผMecab ํด๋ ์ ๊ทผcd /Users/[USER_NAME]/mecab-ko-dic-2.1.1-20180720๋จผ์ , ํฐ๋ฏธ๋/์ปค๋งจ๋๋ผ์ธ์ ํตํด mecab ์ค์น ์์น์ ์ ๊ทผํด ์ค๋๋ค. mecab ์ค์น ์์ ํ์ผ ๊ฒฝ๋ก๋ฅผ ๋ฐ๊พธ์์ง ์์๋ค๋ฉด ์์ ๊ฐ์ด PC ์ฌ์ฉ์ ID ํด๋์ ์์นํด ์์ต๋๋ค. ์ ์ mecab ๋ฒ์ ์ด ๋ฌ๋ผ ํด๋ ์ด๋ฆ์ด ๋ค๋ฅผ ์ ์์ผ๋ ์ฐธ๊ณ ๋ง ํ์๊ธธ ๋ฐ๋๋๋ค.๊ณ ์ ๋ช ์ฌ ์ฌ์ ์ ๊ทผcd user-dicvi nnp.csvํฐ๋ฏธ..
์ค๋์ ํ์ด์ฌ pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํตํด ์์ ์์ ํน์ ์ด(column)์ด๋ ํ(row)์ ๋ถ๋ฌ์ค๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํด ๋๋ฆฝ๋๋ค. ๋ฐ๋ก ์์ํ์ฃ ! 1. pandas ๋ผ์ด๋ธ๋ฌ๋ฆฌ import import pandas as pd pandas ์ค์น๊ฐ ์๋ ๊ฒฝ์ฐ: ์๋ ์ฝ๋๋ฅผ ์ปค๋งจ๋๋ผ์ธ/ํฐ๋ฏธ๋/์ฃผํผํฐ๋ ธํธ๋ถ ํ๊ฒฝ ์ค์์ ์ค์น๋ถํฐ ์งํํด ์ฃผ์ธ์. pip install pandas 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ # ํ์ผ์ด xlsx ํ์์ธ ๊ฒฝ์ฐ, dataset = pd.read_excel([ํ์ผ๊ฒฝ๋ก], sheet_name = [๋ถ๋ฌ์ฌ ์ํธ ์ด๋ฆ]) # ํ์ผ์ด csv ํ์์ธ ๊ฒฝ์ฐ, dataset = pd.read_csv([ํ์ผ๊ฒฝ๋ก], sheet_name = [๋ถ๋ฌ์ฌ ์ํธ ์ด๋ฆ]) ํ์ผ ๊ฒฝ๋ก๋ฅผ ๋๊ดํธ([]) ์์ ๋ฐ์ดํ('')์์ ..