๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก์ „์ฒด ๊ธ€ (355)

DATA101

[SQLite] WHERE: ํŠน์ • ์กฐ๊ฑด์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’๋งŒ ์ถœ๋ ฅํ•˜๊ธฐ!

์•ˆ๋…•ํ•˜์„ธ์š”, ์˜ค๋Š˜์€ WHERE ๊ตฌ๋ฌธ์„ ํ™œ์šฉํ•˜์—ฌ ์กฐ๊ฑด๋ฌธ์„ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ๊ณต์œ ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! WHERE: ํŠน์ • ์กฐ๊ฑด์„ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ ์„ ๋ณ„ ์ด๋ฒˆ ์‹œ๊ฐ„์— ์‚ฌ์šฉํ•  ํ…Œ์ด๋ธ”(Salaries)์€ ๋ฏธ๊ตญ ์•ผ๊ตฌ ๋ฉ”์ด์ €๋ฆฌ๊ทธ(MLB)์˜ ์—ฐ๋„๋ณ„ ๋‹ค์–‘ํ•œ ์„ ์ˆ˜ ์ •๋ณด๋ฅผ ๋‹ด๊ณ  ์žˆ๋Š” ๋ฐ์ดํ„ฐ์…‹ ๋‚ด์—์„œ ์—ฐ๋ด‰์ •๋ณด ํ…Œ์ด๋ธ”์ž…๋‹ˆ๋‹ค. ํ•ด๋‹น ๋ฐ์ดํ„ฐ์…‹ ๋‹ค์šด๋กœ๋“œ๋Š” ์•„๋ž˜ ํฌ์ŠคํŒ…์„ ์ฐธ๊ณ ํ•ด ์ฃผ์„ธ์š”. heytech.tistory.com/11 [SQL] SQLite ๋ฐ ์—ฐ์Šต์šฉ ๋ฐ์ดํ„ฐ์…‹ ์„ค์น˜ํ•˜๊ธฐ! ์˜ค๋Š˜๋ถ€ํ„ฐ SQLite ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ํ™œ์šฉํ•˜์—ฌ SQL์˜ ๊ธฐ๋ณธ์ ์ธ ๋ฌธ๋ฒ•์„ ๋น ๋ฅด๊ณ  ์‰ฝ๊ฒŒ ์ „๋‹ฌํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! ๋ชฉ์ฐจ 1. SQLite๋ž€? 2. SQLite ์„ค์น˜ 3. SQLite Studio ์„ค์น˜ 4. ์—ฐ์Šต์šฉ DB ์„ค์น˜: Baseball Databank...

[SQLite] ORDER BY: ๋ฐ์ดํ„ฐ ์ •๋ ฌํ•˜๊ธฐ(๋‚ด๋ฆผ์ฐจ์ˆœ/์˜ค๋ฆ„์ฐจ์ˆœ)

์•ˆ๋…•ํ•˜์„ธ์š”, ์ง€๋‚œ ์‹œ๊ฐ„์—๋Š” SELECT ๊ตฌ๋ฌธ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์ถœ๋ ฅํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๋‹ค๋ฃจ์–ด ๋ณด์•˜์Šต๋‹ˆ๋‹ค. heytech.tistory.com/12 [SQL] SELECT: ๋ฐ์ดํ„ฐ ์ถœ๋ ฅํ•˜๊ธฐ! (Feat. LIMIT) ์•ˆ๋…•ํ•˜์„ธ์š”, ์˜ค๋Š˜๋ถ€ํ„ฐ SQLite Studio ํ™˜๊ฒฝ์—์„œ SQL ๊ตฌ๋ฌธ์„ ์—ฐ์Šตํ•ด ๋ณด๋Š” ์‹œ๊ฐ„์„ ๊ฐ–๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. SQLite Studio ๋ฐ ์—ฐ์Šต์šฉ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ์•„์ง ์„ค์น˜ํ•˜์ง€ ์•Š์œผ์‹  ๋ถ„๋“ค์€ ์•„๋ž˜ ํฌ์ŠคํŒ…์„ ์ฐธ๊ณ ํ•ด ์ฃผ์„ธ์š” : heytech.tistory.com ์˜ค๋Š˜์€ SQLite Studio ํ™˜๊ฒฝ์—์„œ ๋ฐ์ดํ„ฐ ์ •๋ ฌ์„ ๋„์™€์ฃผ๋Š” ORDER BY ๊ตฌ๋ฌธ ํ™œ์šฉ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๊ณต์œ ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. SQLite/SQLite Studio ๋ฐ ์—ฐ์Šต์šฉ ๋ฐ์ดํ„ฐ์…‹ ์„ค์น˜๋Š” ์•„๋ž˜ ํฌ์ŠคํŒ…์„ ์ฐธ๊ณ ํ•ด ์ฃผ์„ธ์š”! heytech.tistory.c..

[ํŒŒ์ด์ฌ] ๊ฒฐ์ธก์น˜(Na, NaN, Null) ์ œ๊ฑฐ/๋ณ€ํ™˜ํ•˜๊ธฐ!

์˜ค๋Š˜์€ ํŒŒ์ด์ฌ์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด ๊ฒฐ์ธก์น˜(Na, NaN, Null)๋ฅผ ์ œ๊ฑฐ/์น˜ํ™˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๊ณต์œ ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ import import numpy as np import pandas as pd ๊ฒฐ์ธก์น˜ ์กด์žฌ์œ ๋ฌด ํ™•์ธ # ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด null ๋ฐ์ดํ„ฐ ๊ฐœ์ˆ˜ ์นด์šดํŒ…. np.sum(pd.isnull(๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„)) ์œ„ ๋ช…๋ น์–ด๋ฅผ ํ†ตํ•ด ์–ด๋–ค ์นผ๋Ÿผ์—, ๋ช‡ ๊ฐœ์˜ ๊ฒฐ์ธก์น˜๊ฐ€ ์กด์žฌํ•˜๋Š”์ง€ ๋ฆฌ์ŠคํŠธ์˜ ํ˜•ํƒœ๋กœ ํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค(์•„๋ž˜ ์Šคํฌ๋ฆฐ์ƒท ์ฐธ๊ณ ). ์ฐธ๊ณ ๋กœ isnull ๋ฉ”์†Œ๋“œ๋Š” ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์—์„œ ๊ฒฐ์ธก์น˜๊ฐ€ ์กด์žฌํ•˜๋ฉด True๋ฅผ, ๊ฒฐ์ธก์น˜๊ฐ€ ์•„๋‹Œ ๋ฐ์ดํ„ฐ ์œ„์น˜์—์„œ๋Š” False๋ฅผ ๋ฐ˜ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ์ธก์น˜ ์ œ๊ฑฐํ•˜๋Š” ๋ฐฉ๋ฒ• # ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด ๊ฒฐ์ธก์น˜๊ฐ€ ํฌํ•จํ•œ ๋ชจ๋“  ํ–‰์„ ์ œ๊ฑฐ dataset_drop = dataset_orig..

SW ๊ฐœ๋ฐœ/Python 2021. 2. 2. 09:53
[ํŒŒ์ด์ฌ] lambda ํ•จ์ˆ˜๋Š” ์–ธ์ œ, ์–ด๋–ป๊ฒŒ ์“ธ๊นŒ?

์•ˆ๋…•ํ•˜์„ธ์š”, ์˜ค๋Š˜์€ ํŒŒ์ด์ฌ ๋žŒ๋‹ค(lambda) ํ•จ์ˆ˜์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! 1. Lambda ํ•จ์ˆ˜๋Š” ์–ธ์ œ ์‚ฌ์šฉํ•˜๋ฉด ์ข‹์„๊นŒ? ํŒŒ์ด์ฌ์—์„œ ํŠน์ • ๊ธฐ๋Šฅ์„ ๊ตฌํ˜„ํ•˜๊ณ  ๋ฐ˜๋ณต์ ์œผ๋กœ ์ง๊ด€์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด ํ•จ์ˆ˜๋ฅผ ๋งŽ์ด ์‚ฌ์šฉํ•˜๊ณ  ๊ณ„์‹ค ๊ฒ๋‹ˆ๋‹ค. ์˜ˆ์‹œ๋กœ ์–ด๋–ค ๊ฐ’์„ ํ•จ์ˆ˜์— ์ž…๋ ฅํ•˜๋ฉด ์ œ๊ณฑํ•˜์—ฌ ๋ฐ˜ํ™˜ํ•ด์ฃผ๋Š” ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค์–ด ๋ดค์Šต๋‹ˆ๋‹ค. def squareOut(input_data): return input_data**2 squared_value = squareOut(7) print(squared_value) # 49 ์ถœ๋ ฅ ์ผํšŒ์„ฑ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด ์ด๋Ÿฌํ•œ ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“œ๋Š” ๊ฒƒ์€ ๋งค์šฐ ๊ท€์ฐฎ๊ธฐ๋„ ํ•˜์ง€๋งŒ ๋ฉ”๋ชจ๋ฆฌ์˜ ๋‚ญ๋น„๋ฅผ ์œ ๋ฐœํ•˜์ฃ . ๋ฐ˜๋ฉด, lambda ํ•จ์ˆ˜์˜ ์‚ฌ์šฉ์€ ๋ฉ”๋ชจ๋ฆฌ ์œ ๋ฐœ์„ ๋ฐฉ์ง€ํ•  ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ํ•จ์ˆ˜ ํ˜•ํƒœ์˜ ๊ธฐ๋Šฅ์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š”..

SW ๊ฐœ๋ฐœ/Python 2021. 1. 26. 16:02
์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ ํ…Œ๋งˆ ๋ณ€๊ฒฝํ•˜๋Š” ๋ฐฉ๋ฒ•(๋‹คํฌ๋ชจ๋“œ ๋“ฑ)

1. ํ…Œ๋งˆ ๋‹ค์šด๋กœ๋“œ pip install jupyterthemes 2. ๋ณ€๊ฒฝ๊ฐ€๋Šฅํ•œ ํ…Œ๋งˆ ๋ฆฌ์ŠคํŠธ ํ™•์ธ jt -l # ๋ณ€๊ฒฝ๊ฐ€๋Šฅํ•œ ํ…Œ๋งˆ ๋ฆฌ์ŠคํŠธ๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ์ด 9๊ฐœ์˜ ํ…Œ๋งˆ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. - chesterish - grade3 - gruvboxd - gruvboxl - monokai - oceans16 - onedork - solarizedd - solarizedl 3. ํ…Œ๋งˆ ๋ณ€๊ฒฝํ•˜๊ธฐ jt -t [๋ณ€๊ฒฝํ•˜๊ณ  ์‹ถ์€ ํ…Œ๋งˆ ์ด๋ฆ„ ์ž…๋ ฅ] ๋ณ€๊ฒฝํ•˜๊ณ  ์‹ถ์œผ์‹  ํ…Œ๋งˆ ์ด๋ฆ„์„ ๊ด„ํ˜ธ ์•ˆ์— ๋„ฃ์–ด์„œ ๋ช…๋ น์–ด๋ฅผ ์ž…๋ ฅํ•ด ์ฃผ์„ธ์š”. ์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ ์ฐฝ์„ ์ƒˆ๋กœ๊ณ ์นจ ํ•˜์‹œ๋ฉด ํ…Œ๋งˆ๊ฐ€ ๋ณ€๊ฒฝ๋œ ๊ฒƒ์„ ํ™•์ธํ•˜์‹ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค :) # ์˜ˆ์‹œ jt -t chesterish # ์ฝ”๋“œ ์ž…๋ ฅ ํ›„ ์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ ์ƒˆ๋กœ๊ณ ์นจ! 4. (Optional) ํ…Œ๋งˆ ๊ด€๋ จ ๋ช…๋ น์–ด ๋ชจ์Œ ..

SW ๊ฐœ๋ฐœ/Python 2021. 1. 25. 16:46
[NLP] KoNLPy Mecab ๊ณ ์œ ๋ช…์‚ฌ ๋“ฑ๋ก ๋ฐฉ๋ฒ•

๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” KoNLPy ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๋‚ด Mecab ํ˜•ํƒœ์†Œ ๋ถ„์„๊ธฐ์˜ ๊ณ ์œ ๋ช…์‚ฌ ์ถ”๊ฐ€ ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ด…๋‹ˆ๋‹ค.๋ชฉ์ฐจ1. Mecab ๊ณ ์œ ๋ช…์‚ฌ ์‚ฌ์ „ ์ ‘๊ทผ2. ๊ณ ์œ ๋ช…์‚ฌ ์‚ฌ์ „ ๋“ฑ๋กํ•˜๊ธฐ3. ๊ณ ์œ ๋ช…์‚ฌ ์‚ฌ์ „ ์—…๋ฐ์ดํŠธ4. (Optional) ๊ณ ์œ ๋ช…์‚ฌ ์‚ฌ์ „ ๋“ฑ๋ก์—ฌ๋ถ€ ํ™•์ธ1. Mecab ๊ณ ์œ ๋ช…์‚ฌ ์‚ฌ์ „ ์ ‘๊ทผMecab ํด๋” ์ ‘๊ทผcd /Users/[USER_NAME]/mecab-ko-dic-2.1.1-20180720๋จผ์ €, ํ„ฐ๋ฏธ๋„/์ปค๋งจ๋“œ๋ผ์ธ์„ ํ†ตํ•ด mecab ์„ค์น˜ ์œ„์น˜์— ์ ‘๊ทผํ•ด ์ค๋‹ˆ๋‹ค. mecab ์„ค์น˜ ์‹œ์— ํŒŒ์ผ ๊ฒฝ๋กœ๋ฅผ ๋ฐ”๊พธ์‹œ์ง€ ์•Š์•˜๋‹ค๋ฉด ์œ„์™€ ๊ฐ™์ด PC ์‚ฌ์šฉ์ž ID ํด๋”์— ์œ„์น˜ํ•ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ €์™€ mecab ๋ฒ„์ „์ด ๋‹ฌ๋ผ ํด๋” ์ด๋ฆ„์ด ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์œผ๋‹ˆ ์ฐธ๊ณ ๋งŒ ํ•˜์‹œ๊ธธ ๋ฐ”๋ž๋‹ˆ๋‹ค.๊ณ ์œ ๋ช…์‚ฌ ์‚ฌ์ „ ์ ‘๊ทผcd user-dicvi nnp.csvํ„ฐ๋ฏธ..

[ํŒŒ์ด์ฌ] pandas๋ฅผ ํ™œ์šฉํ•œ ์—ด, ํ–‰ ์„ ํƒํ•˜๊ธฐ

์˜ค๋Š˜์€ ํŒŒ์ด์ฌ pandas ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ํ†ตํ•ด ์—‘์…€์—์„œ ํŠน์ • ์—ด(column)์ด๋‚˜ ํ–‰(row)์„ ๋ถˆ๋Ÿฌ์˜ค๋Š” ๋ฐฉ๋ฒ•์„ ๊ณต์œ ํ•ด ๋“œ๋ฆฝ๋‹ˆ๋‹ค. ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! 1. pandas ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ import import pandas as pd pandas ์„ค์น˜๊ฐ€ ์•ˆ๋œ ๊ฒฝ์šฐ: ์•„๋ž˜ ์ฝ”๋“œ๋ฅผ ์ปค๋งจ๋“œ๋ผ์ธ/ํ„ฐ๋ฏธ๋„/์ฃผํ”ผํ„ฐ๋…ธํŠธ๋ถ ํ™˜๊ฒฝ ์ค‘์—์„œ ์„ค์น˜๋ถ€ํ„ฐ ์ง„ํ–‰ํ•ด ์ฃผ์„ธ์š”. pip install pandas 2. ๋ฐ์ดํ„ฐ์…‹ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ # ํŒŒ์ผ์ด xlsx ํ˜•์‹์ธ ๊ฒฝ์šฐ, dataset = pd.read_excel([ํŒŒ์ผ๊ฒฝ๋กœ], sheet_name = [๋ถˆ๋Ÿฌ์˜ฌ ์‹œํŠธ ์ด๋ฆ„]) # ํŒŒ์ผ์ด csv ํ˜•์‹์ธ ๊ฒฝ์šฐ, dataset = pd.read_csv([ํŒŒ์ผ๊ฒฝ๋กœ], sheet_name = [๋ถˆ๋Ÿฌ์˜ฌ ์‹œํŠธ ์ด๋ฆ„]) ํŒŒ์ผ ๊ฒฝ๋กœ๋ฅผ ๋Œ€๊ด„ํ˜ธ([]) ์•ˆ์— ๋”ฐ์˜ดํ‘œ('')์•ˆ์— ..