๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก์ „์ฒด ๊ธ€ (352)

DATA101

[Python] Random Forest ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์ •์˜, ์žฅ๋‹จ์ , ์ตœ์ ํ™” ๋ฐฉ๋ฒ•

๐Ÿ“š๋ชฉ์ฐจ 1. ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ ์ •์˜ 2. ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ ์žฅ๋‹จ์  3. ์‹ค์Šต์ฝ”๋“œ ๋ฐ ๋ฐ์ดํ„ฐ์…‹ 4. ์ฝ”๋“œ ์„ค๋ช… 1. Random Forest ์ •์˜ Random Forest๋Š” ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๋ชจ๋ธ ์—ฌ๋Ÿฌ ๊ฐœ๋ฅผ ํ›ˆ๋ จ์‹œ์ผœ์„œ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ์ข…ํ•ฉํ•ด ์˜ˆ์ธกํ•˜๋Š” ์•™์ƒ๋ธ” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค. ๊ฐ ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ฌ ๋•Œ ๋ฐฐ๊น…(Bagging) ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋ฐฐ๊น…์€ ์ „์ฒด Train dataset์—์„œ ์ค‘๋ณต์„ ํ—ˆ์šฉํ•ด ์ƒ˜ํ”Œ๋งํ•œ Dataset์œผ๋กœ ๊ฐœ๋ณ„ ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ํ†ตํ•ด ์˜ˆ์ธกํ•œ ๊ฐ’์€ ํ‰๊ท ์„ ์ทจํ•˜์—ฌ ์ตœ์ข…์ ์ธ ์˜ˆ์ธก๊ฐ’์„ ์‚ฐ์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฐฐ๊น… ๋ฐฉ์‹์€ ์˜ˆ์ธก ๋ชจ๋ธ์˜ ์ผ๋ฐ˜ํ™”(generalization, a.k.a., ์•ˆ์ •์„ฑ) ์„ฑ๋Šฅ์„ ํ–ฅ์ƒํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค. 2. ๋žœ๋คํฌ๋ ˆ์ŠคํŠธ ์žฅ๋‹จ์  ์žฅ์  ๋‹จ์  ์ผ๋ฐ˜ํ™” ๋ฐ ์„ฑ๋Šฅ..

ํŒŒ์ด์ฌ ๊ธฐ๋ฐ˜ ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ์›น ํฌ๋กค๋Ÿฌ ๊ฐœ๋ฐœํ•˜๊ธฐ Version1

ํ•„๋…! ์•ˆ๋…•ํ•˜์„ธ์š”, ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ์›น ํŽ˜์ด์ง€ ๊ตฌ์กฐ๊ฐ€ ๋ณ€๊ฒฝ๋จ์— ๋”ฐ๋ผ ํ˜„์žฌ ํฌ์ŠคํŒ…์— ์—…๋กœ๋“œํ•œ ํฌ๋กค๋Ÿฌ๋Š” ์ž‘๋™ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ฐœํŽธ๋œ ์›น ํŽ˜์ด์ง€ ๊ตฌ์กฐ๋ฅผ ๊ณ ๋ คํ•˜์—ฌ ํฌ๋กค๋Ÿฌ๋ฅผ ์—…๋ฐ์ดํŠธํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์•„๋ž˜ ํฌ์ŠคํŒ…์„ ์ฐธ๊ณ ํ•ด ์ฃผ์„ธ์š”! ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. https://heytech.tistory.com/293 [Python] ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ์›น ํฌ๋กค๋Ÿฌ ์ฝ”๋“œ Version2 ์•ˆ๋…•ํ•˜์„ธ์š”! ์˜ค๋Š˜์€ ํŒŒ์ด์ฌ(์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ง์ ‘ ์ฝ”๋”ฉํ•œ ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ์›น ํฌ๋กค๋Ÿฌ ์ฝ”๋“œ๋ฅผ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค. ๐Ÿ“ ๋ชฉ์ฐจ 1. ์—…๋ฐ์ดํŠธ Log 2. ์ฃผ์š” ๊ธฐ๋Šฅ 3. ์ „์ฒด ์ฝ”๋“œ 4. ํ•„์ˆ˜ ์ดˆ๊ธฐ ์„ธํŒ… 5. heytech.tistory.com ์•ˆ๋…•ํ•˜์„ธ์š”! ์˜ค๋Š˜์€ ํŒŒ์ด์ฌ(์ฃผํ”ผํ„ฐ ๋…ธํŠธ๋ถ)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ง์ ‘ ์ฝ”๋”ฉํ•œ ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ์›น ํฌ๋กค๋Ÿฌ ์ฝ”๋“œ๋ฅผ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค. ..

[๋…ผ๋ฌธ ๋ฆฌ๋ทฐ] Leem, B. H., & Eum, S. W. (2021). Using text mining to measure mobile banking service quality. Industrial Management & Data Systems.

์˜ค๋Š˜์€ ๋ชจ๋ฐ”์ผ ๋ฑ…ํ‚น App ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ๋งˆ์ด๋‹ ๊ด€๋ จ ๋…ผ๋ฌธ์„ ๋ฐฉ๋ฒ•๋ก  ์œ„์ฃผ๋กœ ๋น ๋ฅด๊ฒŒ ๋ฆฌ๋ทฐํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.๊ทธ๋Ÿผ ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ !๐Ÿ“š ๋…ผ๋ฌธ ์ถœ์ฒ˜ APALeem, B. H., & Eum, S. W. (2021). Using text mining to measure mobile banking service quality. Industrial Management & Data Systems.๐Ÿ’ก ์š”์•ฝ์นด์นด์˜ค๋ฑ…ํฌ ์•ฑ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ๋งˆ์ด๋‹์„(ํ‚ค์›Œ๋“œ ์ถ”์ถœ, ํ† ํ”ฝ ๋ชจ๋ธ๋ง, ๊ฐ์ •๋ถ„์„) ํ†ตํ•ด ๋ชจ๋ฐ”์ผ ๋ฑ…ํ‚น ์•ฑ ์„œ๋น„์Šค ํ€„๋ฆฌํ‹ฐ ํ‰๊ฐ€ํ•œ ๋…ผ๋ฌธ1.  ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ „์ฒ˜๋ฆฌ1.1.  Data collection- ๋ฐ์ดํ„ฐ: ์นด์นด์˜ค ๋ฑ…ํฌ ๊ณ ๊ฐ ๋ฆฌ๋ทฐ 3,900๊ฑด- ์ˆ˜์ง‘ ์ถœ์ฒ˜: ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด- ์ˆ˜์ง‘ ๋ฐฉ๋ฒ•: WebHarvy ์›น ํฌ๋กค๋ง ์†”๋ฃจ์…˜ ํ™œ์šฉ- ์ˆ˜์ง‘์ผ..

[Python] ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด(Decision Tree)์˜ ์‚ฌ์šฉ์ด์œ , ์žฅ๋‹จ์ , ๋ชจ๋ธํ‰๊ฐ€๋ฐฉ๋ฒ•, ๋ณ€์ˆ˜ ์ค‘์š”๋„ ์‚ฐ์ถœ๋ฐฉ๋ฒ•

๐Ÿ“š ๋ชฉ์ฐจ 1. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด๋ž€? 2. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์˜ ์žฅ๋‹จ์  3. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ตฌ์กฐ ๋ฐ ์šฉ์–ด 4. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด์˜ ๋ถ„๋ฆฌ์กฐ๊ฑด 4.1. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ธฐ๋ฐ˜ ์˜ˆ์ธก ๋ชจ๋ธ๋ง 4.1.1. MSE(Mean Squared Error, ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ) 4.1.2. MAE(Mean Absolute Error, ํ‰๊ท  ์ ˆ๋Œ€ ์˜ค์ฐจ) 4.2. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๊ธฐ๋ฐ˜ ๋ถ„๋ฅ˜ ๋ชจ๋ธ๋ง 4.2.1. ์ง€๋‹ˆ ์ง€์ˆ˜(Gini Index) 4.2.2. ์—”ํŠธ๋กœํ”ผ ์ง€์ˆ˜(Entropy Index) 5. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด ๋ณ€์ˆ˜๋ณ„ ์ค‘์š”๋„ ๊ณ„์‚ฐ 1. ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด๋ž€? ์˜์‚ฌ๊ฒฐ์ •๋‚˜๋ฌด(Decision Tree)๋Š” ์„ค๋ช…๋ณ€์ˆ˜(X) ๊ฐ„์˜ ๊ด€๊ณ„๋‚˜ ์ฒ™๋„์— ๋”ฐ๋ผ ๋ชฉํ‘œ๋ณ€์ˆ˜(Y)๋ฅผ ์˜ˆ์ธกํ•˜๊ฑฐ๋‚˜ ๋ถ„๋ฅ˜ํ•˜๋Š” ๋ฌธ์ œ์— ํ™œ์šฉ๋˜๋Š” ๋‚˜๋ฌด ๊ตฌ์กฐ์˜ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ์„ค๋ช…๋ณ€์ˆ˜์˜ ๊ด€์ธก๊ฐ’์„ ๋ชจ๋ธ์— ์ž…๋ ฅํ•ด ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ๋ถ„..

BFS์•Œ๊ณ ๋ฆฌ์ฆ˜ #ํ”„๋กœ๊ทธ๋ž˜๋จธ์Šค #๊ฐ€์žฅ ๋จผ ๋…ธ๋“œ | ํŒŒ์ด์ฌ ํ’€์ด

๐Ÿ“š ๋ฌธ์ œ ์›๋ณธ: https://programmers.co.kr/learn/courses/30/lessons/49189?language=python3 ์ฝ”๋”ฉํ…Œ์ŠคํŠธ ์—ฐ์Šต - ๊ฐ€์žฅ ๋จผ ๋…ธ๋“œ 6 [[3, 6], [4, 3], [3, 2], [1, 3], [1, 2], [2, 4], [5, 2]] 3 programmers.co.kr ๐Ÿ’ก ์ ‘๊ทผ๋ฒ• โš™๏ธ ํ™œ์šฉ ์•Œ๊ณ ๋ฆฌ์ฆ˜: BFS ์ €์˜ ์ ‘๊ทผ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. 2์ฐจ์› ๋ฆฌ์ŠคํŠธ๋ฅผ ํ™œ์šฉํ•ด ๋…ธ๋“œ ๊ฐ„ ์—ฐ๊ฒฐ์ •๋ณด๋ฅผ ์—…๋ฐ์ดํŠธํ•˜๊ณ  ๋…ธ๋“œ๋ณ„ ๊ฑฐ๋ฆฌ ์ •๋ณด๋ฅผ ์ €์žฅํ•  1์ฐจ์› ๋ฆฌ์ŠคํŠธ๋ฅผ ์ดˆ๊ธฐํ™”ํ•ฉ๋‹ˆ๋‹ค. ์‹œ์ž‘ ๋…ธ๋“œ๋ฅผ ํ์— ์‚ฝ์ž…ํ•˜๊ณ  ํ•ด๋‹น ๋…ธ๋“œ์™€ ์—ฐ๊ฒฐ๋œ ๋…ธ๋“œ์˜ ๊ฑฐ๋ฆฌ ์ •๋ณด๋ฅผ ์‹œ์ž‘ ๋…ธ๋“œ์˜ ๊ฑฐ๋ฆฌ ์ •๋ณด์— 1์„ ๋”ํ•ด ์—…๋ฐ์ดํŠธํ•ฉ๋‹ˆ๋‹ค. ๋„์ฐฉ ๋…ธ๋“œ๋ฅผ ๋‹ค์‹œ ํ์— ์‚ฝ์ž…ํ•˜๊ณ  ์œ„์˜ ๊ณผ์ •์„ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค. ๐Ÿ’ป My solution fr..

DFS ์•Œ๊ณ ๋ฆฌ์ฆ˜ #ํ”„๋กœ๊ทธ๋ž˜๋จธ์Šค #ํƒ€๊ฒŸ๋„˜๋ฒ„ | ํŒŒ์ด์ฌ ํ’€์ด

๐Ÿ“š ๋ฌธ์ œ ์›๋ณธ: https://programmers.co.kr/learn/courses/30/lessons/43165?language=python3 ์ฝ”๋”ฉํ…Œ์ŠคํŠธ ์—ฐ์Šต - ํƒ€๊ฒŸ ๋„˜๋ฒ„ n๊ฐœ์˜ ์Œ์ด ์•„๋‹Œ ์ •์ˆ˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ˆ˜๋ฅผ ์ ์ ˆํžˆ ๋”ํ•˜๊ฑฐ๋‚˜ ๋นผ์„œ ํƒ€๊ฒŸ ๋„˜๋ฒ„๋ฅผ ๋งŒ๋“ค๋ ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด [1, 1, 1, 1, 1]๋กœ ์ˆซ์ž 3์„ ๋งŒ๋“ค๋ ค๋ฉด ๋‹ค์Œ ๋‹ค์„ฏ ๋ฐฉ๋ฒ•์„ ์“ธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. -1+1+1+1+1 = 3 +1-1+1+1+ programmers.co.kr ๐Ÿ’ก ์ ‘๊ทผ๋ฒ• โš™๏ธ ํ™œ์šฉ ์•Œ๊ณ ๋ฆฌ์ฆ˜: DFS ์ €์˜ ์ ‘๊ทผ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. DFS ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ค‘์‹ฌ์œผ๋กœ 0๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์—ฌ ๋ถ€๋ชจ ๋…ธ๋“œ์— number๋ฅผ ๋”ํ•˜๊ฑฐ๋‚˜ ๋นผ๋Š” ์ž‘์—…์„ ๋™์‹œ์— ์ˆ˜ํ–‰ํ•˜์—ฌ ์ž์‹ ๋…ธ๋“œ๋ฅผ ์ƒ์„ฑํ•˜๊ณ , ํ•ด๋‹น ์ž์‹ ๋…ธ๋“œ๋ฅผ ๋‹ค์‹œ ๋ถ€๋ชจ ๋…ธ๋“œ๋กœ ์น˜ํ™˜ํ•ด ์œ„ ์ž‘์—…์„ ๋ฐ˜๋ณต ์ˆ˜..