- Today
- Total
๋ชฉ๋ก๋ฐ์ดํฐ ๋ถ์ (8)
DATA101

๐จ๐ป 1. ๊ฐ์๋ณธ ํฌ์คํ ์์๋ ํ์ด์ฌ matplotlib.pyplot ํจํค์ง๋ฅผ ํ์ฉํ ์๊ฐํ ์๋ฃ ์ ์ฅ ์ ์๋ฃ ๋ด ๋ถํ์ํ ์ฌ๋ฐฑ์ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ค๋ฃน๋๋ค.๐ค 2. ๋ฌธ์ ์ ์๋ (๊ทธ๋ฆผ 1)๊ณผ ๊ฐ์ด, matplotlib ์ต์ ์ค์ ์์ด ์๊ฐํ ์๋ฃ๋ฅผ ์ ์ฅํ๊ฒ ๋๋ฉด ๊ทธ๋ํ ์ฃผ๋ณ ์ฌ๋ฐฉ์ผ๋ก ๋ถํ์ํ ์ฌ๋ฐฑ์ด ๋ง์ ๊ฒ์ ํ์ธํ ์ ์์ต๋๋ค. ์ด๋ ๋ณด๊ณ ์๋ ๋์๋ณด๋ ๋ฑ์ ํ์ฉ ์ ๋ค๋ฅธ ์ฐจํธ๋ค๊ณผ์ ์ฌ๋ฏธ์ฑ ์๋ ์กฐํ๋ฅผ ๋ฐฉํดํ๋ ์์๊ฐ ๋๊ธฐ๋ ํฉ๋๋ค. [์์ ์ฝ๋ - savefig ๋ฉ์๋ ์ต์ ๋ฏธ์ค์ ]# ํจํค์ง ์ค์น ํ์ : pip install matplotlibimport matplotlib.pyplot as plt# ๊ทธ๋ํ ์์ฑplt.plot([1, 2, 3, 4])plt.ylabel('some nu..

๐ ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋ฃนํํ๊ณ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ์ฐ์ต์ฉ ๋ฐ์ดํฐ ๋ค์ด๋ก๋ ๋ฐ ์๊ฐํ ๋ณธ ํฌ์คํ ์์๋ ์ฝ๋ก๋19 ์ ๋ณ ์ง๋ฃ์ ํํฉ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํฉ๋๋ค. ๋ฐ์ดํฐ ๋ค์ด๋ก๋ ๋ฐ ๊ฐ๋จํ ๋ง๋์ฐจํธ ์๊ฐํ ๋ฐฉ๋ฒ์ ์๋์ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์. https://heytech.tistory.com/460?category=585487 [Tableau] ๋ง๋ ์ฐจํธ ์๊ฐํ ๋ฐฉ๋ฒ ๐ ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ์ฝ๋ก๋19 ์ ๋ณ ์ง๋ฃ์ ํํฉ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ํ๋ธ๋ก์์ ๊ฐ๋จํ ๋ง๋์ฐจํธ๋ฅผ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ์ฐ์ต์ฉ ๋ฐ์ดํฐ ๋ค์ด๋ก๋ ์ฝ๋ก๋19 ์ ๋ณ ์ง๋ฃ์ ํ heytech.tistory.com 2. ๋ฐ์ดํฐ ๊ทธ๋ฃนํ '์๋'๋ฅผ ์์์ ๋ ํฐ ๋จ์๋ก ๊ทธ๋ฃนํํด ๋ณด๊ฒ ์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์์ธ, ..

๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ์๋์ ๊ทธ๋ฆผ์ฒ๋ผ, ํ์ด์ฌ subplot์ ํ์ฉํ์ฌ 2๊ฐ ์ด์์ ๊ทธ๋ํ๋ฅผ ํ๋์ figure์ ์ถ๋ ฅํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. Step 1. ํจํค์ง import ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ ์ํ matplotlib ํจํค์ง๋ฅผ ์ค์นํ๊ณ import ํฉ๋๋ค. import matplotlib.pyplot as plt ๐ฏ ํจํค์ง ์ค์น๋ฐฉ๋ฒ ๋๋ณด๊ธฐ pip install matplotlib Step 2. ๋ฐ์ดํฐ์ ์ค๋น ์ ๋ ์๋ณ ๋ฐ์ดํฐ ๊ฑด์๋ฅผ ์ ์ฅํ series ํ์ ์ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ ๊ณํ์ ๋๋ค. 1) ์ฒซ ๋ฒ์งธ ๋ฐ์ดํฐ์ 2) ๋ ๋ฒ์งธ ๋ฐ์ดํฐ์ Step 3. x์ถ, y์ถ ๋ฐ์ดํฐ ๋ถ๋ฆฌ x์ถ๊ณผ y์ถ์ ๊ฐ๊ฐ ์๊ฐํํ ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ฐ ๋๋๋๋ค. x1 = dataset_pos_m.index y1 = dataset_p..

๐ก ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ์ฃผ ๋จ์๋ก ์นด์ดํ ํ๊ณ ์ด๋ฅผ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ํจํค์ง import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ ํฌ์คํ ์์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๊ณต์ ๊ฐ ๋ถ๊ฐํ์ค๋ ํ์ต ๋ชฉ์ ์ผ๋ก๋ง ๋ด์ฃผ์๊ธธ ๋ฐ๋๋๋ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํฐ ํ์ ํ์ธ DATASET.dtypes ์๋์ ๊ฐ์ด, ๋ ์ง ์ ๋ณด(date)๋ ํ์ฌ ์ ์ํ(int)์ ๋๋ค. ํธ๋ฆฌํ๊ฒ ๋ ์งํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํ์ฌ ์ด๋ฅผ datetime ํ์ ์ผ๋ก ๋ฐ๊ฟ์ค ํ์๊ฐ ์์ต๋๋ค. 4. ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ "์ฐ-..

๐ก ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ์ ๋จ์๋ก ์นด์ดํ ํ๊ณ ์ด๋ฅผ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ํจํค์ง import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ ํฌ์คํ ์์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๊ณต์ ๊ฐ ๋ถ๊ฐํ์ค๋ ํ์ต ๋ชฉ์ ์ผ๋ก๋ง ๋ด์ฃผ์๊ธธ ๋ฐ๋๋๋ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํฐ ํ์ ํ์ธ DATASET.dtypes ์๋์ ๊ฐ์ด, ๋ ์ง ์ ๋ณด(date)๋ ํ์ฌ ์ ์ํ(int)์ ๋๋ค. ํธ๋ฆฌํ๊ฒ ๋ ์งํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํ์ฌ ์ด๋ฅผ datetime ํ์ ์ผ๋ก ๋ฐ๊ฟ์ค ํ์๊ฐ ์์ต๋๋ค. 4. ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ "์ฐ-..

๐ ๋ชฉ์ฐจ 1. ์ฌ์ ์ค๋น 2. ์ ๋ฐ์ดํฐ ์ถ์ถ 3. ์์ผ ๋ฐ์ดํฐ ์ถ์ถ 4. ํน์ ๊ธฐ๊ฐ ๋ฐ์ดํฐ ์ถ์ถ ๐ 1. ์ฌ์ ์ค๋น ์๋์ ๊ทธ๋ฆผ 1๊ณผ ๊ฐ์ด, ๋ฐ์ดํฐ์ ์ ๋ ์ง ๋ฐ์ดํฐ๋ datetime ํ์ ์ ๊ฐ์ง๋๋ก ์ฌ์ ์ ์ค๋นํด ์ฃผ์ ์ผ ํฉ๋๋ค. ๋ง์ผ, ๋ ์ง ๋ฐ์ดํฐ๊ฐ '20220101'๊ณผ ๊ฐ์ด ๋ฌธ์์ด์ด๋ ์ ์ํ์ด๋ผ๋ฉด ์๋์ ํฌ์คํ ์ ์ฐธ๊ณ ํ์ ์ ๋ฐ์ดํฐ ํ์ ์ datetime์ผ๋ก ๋ณ๊ฒฝํ์๊ธธ ๋ฐ๋๋๋ค. https://heytech.tistory.com/443?category=453614#recentComments [Python] ์ซ์ํ/๋ฌธ์์ด ๋ฐ์ดํฐ๋ฅผ ๋ ์งํ์ผ๋ก ๋ฐ๊พธ๊ธฐ(pd.to_datetime) ๐ ๋ชฉํ ์ซ์ํ ๋ฐ์ดํฐ๋ฅผ ๋ ์ง ํํ๋ก(i.e., datetime) ๋ณํํ๊ธฐ ์์: 20220816 (int) ๐ 2022-08-1..

๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ๋ณธ ํฌ์คํ ์์๋ LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ๊ฐ๋ , ๊ฐ์ , ์๊ณ ๋ฆฌ์ฆ ํ๋ก์ธ์ค์ ๋ํด ์์๋ด ๋๋ค. ํนํ, ์ํ์ ์ธ ์์ ์์ด LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ๋ฉ์ปค๋์ฆ์ ์ฌ์ด ์์์ ํจ๊ป ๋น ๋ฅด๊ฒ ์ดํดํ๋ ๋ฐ ์ด์ ์ ๋ก๋๋ค. LDA ํ ํฝ ๋ชจ๋ธ๋ง ๊ด๋ จ ์ค์ต์ ์๋ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์๊ธธ ๋ฐ๋๋๋ค.https://heytech.tistory.com/401 [NLP] LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ํ์ฉํ ์ฑ ๋ฆฌ๋ทฐ ๋ถ์ ํ๋ก์ ํธ๐ ๋ชฉ์ฐจ 1. ๊ฐ์ 2. ๋ฐ์ดํฐ์ 3. LDA ํ ํฝ ๋ชจ๋ธ๋ง ๊ฐ๋ 4. LDA ํ ํฝ ๋ชจ๋ธ๋ง ์๊ฐํ 5. ์ ์ฒด ์ฝ๋ 6. ์ฝ๋ ์ค๋ช 7. ๊ฒฐ๊ณผ ํด์๋ฐฉ๋ฒ 8. ์ธ์ฌ์ดํธ ๋์ถ 1. ๊ฐ์ ๋ณธ ํ๋ก์ ํธ๋ ๊ฑด๊ฐ๊ด๋ฆฌ ์ฑ ๋ฆฌ๋ทฐ ํ ์คํธ๋ง์ด๋heytech.tistory.com๐ ๋ชฉ์ฐจ 1. LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ๊ฐ๋ 2...

๐ ๋ชฉ์ฐจ Update Log 1. ์ฃผ์ ๊ธฐ๋ฅ 2. ํฌ๋กฌ ์ค์น 3. ์ ์ฒด ์ฝ๋ 4. ํจํค์ง ์ค์น 5. ์ฝ๋ ์ค๋ช ๐ Update Log ๐ Version 1.0.1 @ 2022-10-11 (1) ์ฝํ ์ธ ์กฐํ์ ๋ฐ ์ ๋ก๋์ผ ์ถ์ถ ๋ก์ง ์ถ๊ฐ Heo Jin ๋ ์์ฒญ์ฌํญ์ผ๋ก ์ถ๊ฐ ๋ฐ ํ ์คํธ ์๋ฃํ์์ต๋๋ค. 1. ์ฃผ์ ๊ธฐ๋ฅ ๋ณธ ํฌ์คํ ์์๋ ์ ํ๋ธ ๊ฒ์ ๊ฒฐ๊ณผ ์ฝํ ์ธ ์ ์ ๋ณด๋ฅผ ์์งํ๋ Scraper๋ฅผ ๊ฐ๋ฐํฉ๋๋ค. โป Scrap์ด๋?('๋๋ณด๊ธฐ' ํด๋ฆญ) ๋๋ณด๊ธฐ Scrap[์คํฌ๋ฉ]์ ์น ํ์ด์ง์์ ํน์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์ค๋ ํ๋์ ๋งํฉ๋๋ค. ์ด์ฒ๋ผ Data Scraping์ ํ๋ ํ๋ก๊ทธ๋จ์ Data Scraper ๋๋ Web Scraper๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. (1) ์์ง ๋ฐ์ดํฐ ์ข ๋ฅ - ์ฝํ ์ธ ์ ๋ชฉ - ์ฝํ ์ธ ๋งํฌ - ์กฐํ์ - ์ ..