- Today
- Total
๋ชฉ๋ก๋น ๋ฐ์ดํฐ ๋ถ์ (2)
DATA101
๐ก ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฐ์ดํฐ๋ฅผ ์ ๋จ์๋ก ์นด์ดํ ํ๊ณ ์ด๋ฅผ ์๊ฐํํ๋ ๋ฐฉ๋ฒ์ ์๊ฐํฉ๋๋ค. 1. ํจํค์ง import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. ๋ฐ์ดํฐ์ ๋ถ๋ฌ์ค๊ธฐ ํฌ์คํ ์์ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ์ ์ ๊ณต์ ๊ฐ ๋ถ๊ฐํ์ค๋ ํ์ต ๋ชฉ์ ์ผ๋ก๋ง ๋ด์ฃผ์๊ธธ ๋ฐ๋๋๋ค. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. ๋ฐ์ดํฐ ํ์ ํ์ธ DATASET.dtypes ์๋์ ๊ฐ์ด, ๋ ์ง ์ ๋ณด(date)๋ ํ์ฌ ์ ์ํ(int)์ ๋๋ค. ํธ๋ฆฌํ๊ฒ ๋ ์งํ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํ์ฌ ์ด๋ฅผ datetime ํ์ ์ผ๋ก ๋ฐ๊ฟ์ค ํ์๊ฐ ์์ต๋๋ค. 4. ๋ฐ์ดํฐ ํ์ ๋ณ๊ฒฝ "์ฐ-..
๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ๋ณธ ํฌ์คํ ์์๋ LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ๊ฐ๋ , ๊ฐ์ , ์๊ณ ๋ฆฌ์ฆ ํ๋ก์ธ์ค์ ๋ํด ์์๋ด ๋๋ค. ํนํ, ์ํ์ ์ธ ์์ ์์ด LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ๋ฉ์ปค๋์ฆ์ ์ฌ์ด ์์์ ํจ๊ป ๋น ๋ฅด๊ฒ ์ดํดํ๋ ๋ฐ ์ด์ ์ ๋ก๋๋ค. LDA ํ ํฝ ๋ชจ๋ธ๋ง ๊ด๋ จ ์ค์ต์ ์๋ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์๊ธธ ๋ฐ๋๋๋ค.https://heytech.tistory.com/401 [NLP] LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ํ์ฉํ ์ฑ ๋ฆฌ๋ทฐ ๋ถ์ ํ๋ก์ ํธ๐ ๋ชฉ์ฐจ 1. ๊ฐ์ 2. ๋ฐ์ดํฐ์ 3. LDA ํ ํฝ ๋ชจ๋ธ๋ง ๊ฐ๋ 4. LDA ํ ํฝ ๋ชจ๋ธ๋ง ์๊ฐํ 5. ์ ์ฒด ์ฝ๋ 6. ์ฝ๋ ์ค๋ช 7. ๊ฒฐ๊ณผ ํด์๋ฐฉ๋ฒ 8. ์ธ์ฌ์ดํธ ๋์ถ 1. ๊ฐ์ ๋ณธ ํ๋ก์ ํธ๋ ๊ฑด๊ฐ๊ด๋ฆฌ ์ฑ ๋ฆฌ๋ทฐ ํ ์คํธ๋ง์ด๋heytech.tistory.com๐ ๋ชฉ์ฐจ 1. LDA ํ ํฝ ๋ชจ๋ธ๋ง์ ๊ฐ๋ 2...