- Today
- Total
๋ชฉ๋ก์ ์ฒด ๊ธ (360)
DATA101
๋ณธ ํฌ์คํ ์์๋ Python pandas ํจํค์ง๋ฅผ ํ์ฉํ์ฌ ๊ฒฐ์ธก์น๋ฅผ ํ์ธํ๊ณ ์ ๊ฑฐํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๋ค๋ฃน๋๋ค. ๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ ๊ธฐ๋ณธ์ ์ผ๋ก pandas ์ค์น ๋ฐ import๋ ๋์ด ์๊ณ ์ํ๋ ๋ฐ์ดํฐ์ ๋ ๋ถ๋ฌ์๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. pandas ํจํค์ง ์ค์น !pip install pandas !pip install openpyxl # excel ํ์ผ ๋ถ๋ฌ์ค๊ธฐ ์ํจ # pipenv ๊ฐ์ํ๊ฒฝ์ฉ # !pipenv install pandas # !pipenv install openpyxl pandas ํจํค์ง import import pandas as pd ๋ฐ์ดํฐ์ Load dataset_raw = pd.read_excel("./data/dataset_raw.xlsx") 1. ๊ฒฐ์ธก์น ํ์ธ ๊ฒฐ์ธก์น ๊ฐ์๋ฅผ ํ์ธํ๋ ๋ฐฉ๋ฒ์ ํฌ..
๐จ๐ป ๋ค์ด๊ฐ๋ฉฐKoNLPy์ Mecab ํจํค์ง๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ค์น๋์ด ์๋ค๊ณ ๊ฐ์ ํฉ๋๋ค. ํน์๋ ์ค์น๋์ด ์์ง ์๋ค๋ฉด ์๋ ํฌ์คํ ์ ์ฐธ๊ณ ํด ์ฃผ์ธ์.https://heytech.tistory.com/3 [Python/NLP] KoNLPy ์ค์นํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณด์!์ค๋์ ํ๊ตญ์ด ์์ฐ์ด์ฒ๋ฆฌ(NLP)๋ฅผ ์ํ ํ์ด์ฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ KoNLPy๋ฅผ ์ค์นํ๋ ๋ฐฉ๋ฒ์ ๊ณต์ ํฉ๋๋ค. 1. ํฐ๋ฏธ๋/์ปค๋งจ๋๋ผ์ธ ์คํ ๊ฐ์ฅ ๋จผ์ , ํฐ๋ฏธ๋/์ปค๋งจ๋๋ผ์ธ์ ์ด์ด์ค๋๋ค. 2. KoNLPy ํจํค์ง ์ค์น pip iheytech.tistory.comMecab ์ค์น๋ฐฉ๋ฒbash ๋ณธ๊ฒฉ์ ์ผ๋ก ์๋ฌ ํด๊ฒฐ๋ฐฉ๋ฒ์ ๋ค๋ฃน๋๋ค.๐ค ์๋ฌ ์ํฉfrom konlpy.tag import MecabMecab().nouns("ํค์ด ํ ํฌ ๋ธ๋ก๊ทธ์ ๋๋ค.")Mecab ํํ..
๐ ๋ชฉ์ฐจ1. ํ๋ก์ ํธ ๊ฐ์ 2. ๊ฐ๋ฐํ๊ฒฝ 3. Pretrained ์ธ์ด ๋ชจ๋ธ 4. ๊ฒฝ์ ๋ด์ค ๊ธฐ์ฌ ๊ฐ์ ๋ฐ์ดํฐ์ 5. ์ ์ฒด ์์ค์ฝ๋ 6. ์ฝ๋ ์ค๋ช 1. ํ๋ก์ ํธ ๊ฐ์Pretrained ์ธ์ด ๋ชจ๋ธ์ธ KLUE BERT-base ์์ ๊ฒฝ์ ๋ด์ค ๊ธฐ์ฌ์ ๊ฐ์ ์ด ๋ผ๋ฒจ๋ง ๋ ๋ฐ์ดํฐ์ ํ๊ตญ์ด ๋ฒ์ ์ Finance Phrase Bank์ ํ์ฉํ์ฌ ํ์ธํ๋ํ ๊ฐ์ ๋ถ๋ฅ ํ๋ก์ ํธ2. ๊ฐ๋ฐํ๊ฒฝGoogle Colab Pro / GPU3. Pretrained ์ธ์ด ๋ชจ๋ธKLUE(Korean Language Understanding Evaluation) BERT baseํ์ตํ ๋ฐ์ดํฐ์ ์ฐํฉ๋ด์ค์ ๋ด์ค ํค๋๋ผ์ธ์ฐํคํผ๋์์ํค๋ด์ค์ํคํธ๋ฆฌ์ ์น๋ด์คParaKQC(Parallel dataset of Korean Questions and Com..
๐ ๋ชฉ์ฐจStep 1. Github ๋ฆฌํฌ์งํ ๋ฆฌ ์ค๋นStep 2. Access ํ ํฐ ์์ฑStep 3. ์ฝ๋ฉ์ ๋๋ผ์ด๋ธ ๋ง์ดํธStep 4. Github ์ปค๋ฐ์ฉ ํด๋ ์์ฑStep 5. ๋๋ ํ ๋ฆฌ ๋ณ๊ฒฝStep 6. Git ํด๋ก Step 7. Git ์ ๊ทผ๊ถํ ๋ถ์ฌStep 8. Commit ํ ์คํธStep 1. Github ๋ฆฌํฌ์งํ ๋ฆฌ ์ค๋น๊ตฌ๊ธ ์ฝ๋ฉ(Google Colab)๊ณผ ์ฐ๋ํ ๋ฆฌํฌ์งํ ๋ฆฌ(Repository)๋ฅผ ์ค๋นํฉ๋๋ค(๊ทธ๋ฆผ 1).Step 2. Access ํ ํฐ ์์ฑStep 2-1. ๊ฐ์ธ Setting ์ฝ์ ์ ๊ทผ์ฐ์ธก ์๋จ ํ๋กํ ํด๋ฆญ - Settings ์์ผ๋ก ํด๋ฆญํฉ๋๋ค(๊ทธ๋ฆผ 2).Step 2-2. Personal access tokens ์ ๊ทผ์ข์ธก์ Personal access tokens๋ฅผ ํด๋ฆญํฉ๋๋ค(๊ทธ๋ฆผ 3..
๐ ๋ชฉ์ฐจ 1. MFA ๊ฐ๋ 2. AWS MFA ํ์ฑํ 1. MFA ๊ฐ๋ ๋ค์ค ์ธ์ฆ(MFA: Multi-Factor Authentication)์ ๋ง ๊ทธ๋๋ก ์๋น์ค์ ์ก์ธ์ค ํ ๋ ์ต์ 2๊ฐ์ง ์ด์์ ์ธ์ฆ์ ๋ฐ๊ฒ๋ ํ ์ก์ธ์ค ์ ์ด ๋ฐฉ์์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ธํฐ๋ท ๋ฑ ํน ๋ก๊ทธ์ธ ์ ๋ณด์ ๊ฐํ๋ฅผ ์ํ์ฌ OTP(One Time Password)๋ฅผ ์ฌ์ฉํ๋ ๊ฒ๋ MFA ๋ฐฉ์ ์ค ํ๋๋ผ๊ณ ๋ณผ ์ ์์ต๋๋ค(๊ทธ๋ฆผ 1). ์๋ง์กด์น์๋น์ค(AWS)์ ๋ฃจํธ ๊ณ์ ์ ๋ณด์์ด ๋ฌด์๋ณด๋ค ์ค์ํฉ๋๋ค. ๋ฃจํธ ๊ณ์ ์ด ํ์ทจ๋นํ ์ ์๋น์ค ์ ์ด๊ถ์ ์์ ํ ์์ด๋ฒ๋ฆฌ๋ ๊ฒ์ ๋ฌผ๋ก ์ด๊ณ , ํด์ปค์ ๋นํธ์ฝ์ธ ์ฑ๊ตด์ ํ์ฉ๋๋ฉฐ ๊ณผ๊ธ ํญํ์ ๋ฐ์ ์ ์๊ธฐ ๋๋ฌธ์ ๋๋ค. ๋ฐ๋ผ์ ๋ฃจํธ ๊ณ์ ์ฌ์ฉ์ ์ต๋ํ ์์ ํ๋ ๊ฒ์ด ์ข์ผ๋ฉฐ, ๋ก๊ทธ์ธ ์ 2๊ฐ ์ด์์ ์ธ์ฆ ์ ์ฐจ๋ฅผ ..
๐ ๋ชฉ์ฐจ 1. ๋ฃจํธ ์ฌ์ฉ์์ ๊ฐ๋ 2. IAM ์ฌ์ฉ์์ ๊ฐ๋ ๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ ์๋ง์กด์น์๋น์ค(AWS)์๋ ์๋์ ๊ฐ์ด 2๊ฐ์ง ์ข ๋ฅ์ ๊ณ์ ์ด ์กด์ฌํฉ๋๋ค(๊ทธ๋ฆผ 1 ์ฐธ๊ณ ). ๋ฃจํธ ๊ณ์ IAM ๊ณ์ ๋ณธ ํฌ์คํ ์์๋ 2๊ฐ์ง ์ฌ์ฉ์๋ณ ๊ฐ๋ ์ ๋ํด ๊ฐ๊ฐ ์์๋ด ๋๋ค. 1. ๋ฃจํธ ์ฌ์ฉ์์ ๊ฐ๋ AWS ๋ฃจํธ ์ฌ์ฉ์๋ ํ์๊ฐ์ ์ ๋ง๋ ๊ณ์ ์ผ๋ก์ ๋ชจ๋ AWS ๊ถํ์ ๊ฐ๊ณ ์๋ ์ฌ์ฉ์์ ๋๋ค. ์ด ๊ณ์ ์ ํ์ทจ๋นํ ์ ๋ณต๊ตฌ๊ฐ ๋งค์ฐ ์ด๋ ค์ธ ๋ฟ๋ง ์๋๋ผ, ์ต๊ทผ์๋ ํด์ปค๋ค์ด ๋นํธ์ฝ์ธ ์ฑ๊ตด์ AWS ๊ณ์ ์ ์ฐฉ์ทจํ์ฌ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์์์ ์ด์ํ๋ ๊ณผ๊ธํญํ์ ๋ง์ ์ ์์ต๋๋ค. ์ค์ ๋ก ์ต๊ทผ ๊ตญ๋ด์์ AWS ๊ณ์ ์ด ํดํน์ ๋นํ์ฌ ๊ณผ๊ธ๋ง 3์ต์ด ๋์จ ์ฌ๋ก๋ ์์ต๋๋ค. ๋ฐ๋ผ์, ๋ฃจํธ ์ฌ์ฉ์๋ ๊ณ์ ์ค์ ์ ๋ณ๊ฒฝํ๊ฑฐ๋ ๊ณผ๊ธ ๊ด๋ฆฌ(i.e., Bill..
๐ ๋ชฉ์ฐจ 1. AWS EC2 ๊ฐ๋ 2. AWS ๊ธฐ๋ณธ ์ธํ 3. AWS EC2 ์ฌ์ฉ๋ฐฉ๋ฒ 1. AWS EC2 ๊ฐ๋ AWS EC2๋ Elastic Compute Cloud์ ์ฝ์๋ก ๋ ๋ฆฝ๋ ๊ฐ์์ ์ปดํจํฐ๋ฅผ ์๋ํด ์ฃผ๋ ์น ์๋น์ค์ ๋๋ค. ๋ฌผ๋ฆฌ์ ์ธ ์ปดํจํฐ๊ฐ ์๋ ๋ฆฌ๋ ์ค, ์๋์ฐ์ ๊ฐ์ OS๊ฐ ์ค์น๋ ๊ฐ์ ๋จธ์ ์ ๋น๋ ค์ฃผ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ์ฌ์ฉ์๋ ์๊ฒฉ์ผ๋ก ํด๋น ์ปดํจํฐ๋ฅผ ์ ์ดํ์ฌ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ด๋ฌํ ๊ฐ์ ๋จธ์ ์ ์ธ์คํด์ค(Instance)๋ผ๊ณ ๋ถ๋ฆ ๋๋ค. AWS EC2๋ ์ฌ์ฉ๋ชฉ์ ์ด๋ ์์ฐ์ ๋ง์ถฐ ๋ฉ๋ชจ๋ฆฌ, ์คํ ๋ฆฌ์ง, ๋คํธ์ํฌ ์ฑ๋ฅ ๋ฑ์ ์ธ์คํด์ค ์คํ์ ์ ํํ ์ ์์ต๋๋ค(์ฐธ๊ณ ). AWS EC2๋ ์ธ์คํด์ค ์์๊ณผ ์ ๊ฑฐ(์ปดํจํฐ ์๋/๋ฐ๋ฉ)์ ์ ์ฐจ๊ฐ ๋งค์ฐ ๊ฐํธํฉ๋๋ค. ๋ง์ฝ ๋์ด์ ์ธ์คํด์ค๊ฐ ํ์ํ์ง ์์ผ๋ฉด ์ธ์ ๋ ์ง ๊ฐํธํ..
๐จ๐ป ๋ค์ด๊ฐ๋ฉฐ ๋ณธ ํฌ์คํ ์์๋ ๋ฅ๋ฌ๋ ๋ถ์ผ์์ ํ์ดํผํ๋ผ๋ฏธํฐ ์ต์ ํ ๋ฐฉ๋ฒ 3๊ฐ์ง์ธ Grid Search, Random Search, Bayesian Optimization์ ๋ํด ์์๋ด ๋๋ค. ๐ ๋ชฉ์ฐจ 1. Grid Search 2. Random Search 3. Bayesian Optimization 1. Grid Search ๊ทธ๋ฆฌ๋ ์์น(Grid Search)๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ผ์ ํ ๊ฐ๊ฒฉ์ผ๋ก ๋ณ๊ฒฝํ๋ฉฐ ์ต์ ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ์๊ฐ๋ ๊ธฐ๋ฒ์ ๋๋ค. ์๋์ ๊ทธ๋ฆผ 1์ฒ๋ผ ๊ฐ๋ก์ถ์ด ํ์ดํผํ๋ผ๋ฏธํฐ์ด๊ณ ์ธ๋ก์ถ์ด ๋ชฉํํจ์์ผ ๋, ๋ชฉํํจ์ ๊ฐ์ด ์ต๋๊ฐ ๋๋ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋ ๋ฌธ์ ๋ฅผ ํ์ด์ผ ํ๋ค๊ณ ๊ฐ์ ํด ๋ณด๊ฒ ์ต๋๋ค. ๊ทธ๋ฆฌ๋ ์์น๋ ํน์ ๋ฒ์ ๋ด์์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์ผ์ ๊ฐ๋งํผ ์ผ์ผ์ด ๋ณ๊ฒฝํ๋ฉฐ ์ถ๋ ฅ๊ฐ์ ๋น๊ตํ๋ ๋ฐฉ์์ผ๋ก..