๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก์ „์ฒด ๊ธ€ (350)

DATA101

[๋”ฅ๋Ÿฌ๋‹] Drop-out(๋“œ๋กญ์•„์›ƒ) ๊ฐœ๋…, ์‚ฌ์šฉ์ด์œ , ์ˆ˜์‹

๋ณธ ํฌ์ŠคํŒ…์—์„œ๋Š” ๋”ฅ๋Ÿฌ๋‹์— ์žˆ์–ด์„œ Generalization ๊ธฐ๋ฒ• ์ค‘ ํ•˜๋‚˜์ธ Drop-out(๋“œ๋กญ์•„์›ƒ)์— ๋Œ€ํ•ด ์•Œ์•„๋ด…๋‹ˆ๋‹ค.๐Ÿ“š ๋ชฉ์ฐจ1. Drop-out ๊ฐœ๋… 2. Drop-out ์‚ฌ์šฉ์ด์œ 3. Mini-batch ํ•™์Šต ์‹œ Drop-out4. Test ์‹œ Drop-out 1. Drop-out ๊ฐœ๋…Drop-out์€ ์„œ๋กœ ์—ฐ๊ฒฐ๋œ ์—ฐ๊ฒฐ๋ง(layer)์—์„œ 0๋ถ€ํ„ฐ 1 ์‚ฌ์ด์˜ ํ™•๋ฅ ๋กœ ๋‰ด๋Ÿฐ์„ ์ œ๊ฑฐ(drop)ํ•˜๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์œ„์˜ ๊ทธ๋ฆผ 1 ๊ณผ ๊ฐ™์ด drop-out rate๊ฐ€ 0.5๋ผ๊ณ  ๊ฐ€์ •ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. Drop-out ์ด์ „์— 4๊ฐœ์˜ ๋‰ด๋Ÿฐ๋ผ๋ฆฌ ๋ชจ๋‘ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ๋Š” ์ „๊ฒฐํ•ฉ ๊ณ„์ธต(Fully Connected Layer)์—์„œ 4๊ฐœ์˜ ๋‰ด๋Ÿฐ ๊ฐ๊ฐ์€ 0.5์˜ ํ™•๋ฅ ๋กœ ์ œ๊ฑฐ๋ ์ง€ ๋ง์ง€ ๋žœ๋คํ•˜๊ฒŒ ๊ฒฐ์ •๋ฉ๋‹ˆ๋‹ค. ์œ„์˜ ์˜ˆ์‹œ์—์„œ๋Š” 2..

๊ณผ๋Œ€์ ํ•ฉ(overfitting) ๋ฐ ๊ณผ์†Œ์ ํ•ฉ(underfitting) ๊ฐœ๋…(+Early Stopping)

๐Ÿ“š ๋ชฉ์ฐจ1. ๊ฐœ๋… 1.1. ๊ณผ๋Œ€์ ํ•ฉ(Overfitting)์ด๋ž€? 1.2. ๊ณผ์†Œ์ ํ•ฉ(Underfitting)์ด๋ž€?2. ํƒ์ง€ 2.1. ๋ถ„์‚ฐ๊ณผ ํŽธํ–ฅ ๊ธฐ๋ฐ˜ ํƒ์ง€ 2.2. ์‚ฐ์ ๋„ ๊ทธ๋ž˜ํ”„ ๊ธฐ๋ฐ˜ ํƒ์ง€ 2.3. ๋ชจ๋ธ ๋ณต์žก๋„ ๋ฐ ์†์‹คํ•จ์ˆ˜ ๊ธฐ๋ฐ˜ ํƒ์ง€ 2.3.1. ๊ณผ์†Œ์ ํ•ฉ ๋ฐœ์ƒ ๊ตฌ๊ฐ„ 2.3.2. ๊ณผ๋Œ€์ ํ•ฉ ๋ฐœ์ƒ ๊ตฌ๊ฐ„ 2.3.3. ์ตœ์ ์˜ ๋ชจ๋ธ ์ ํ•ฉ ํฌ์ธํŠธ3. ๊ณผ๋Œ€์ ํ•ฉ ๋ฐฉ์ง€๋ฐฉ๋ฒ•: ํ•™์Šต ์กฐ๊ธฐ์ข…๋ฃŒ(Early Stopping)1. ๊ฐœ๋…1.1. ๊ณผ๋Œ€์ ํ•ฉ(overfitting)์ด๋ž€?๊ณผ๋Œ€์ ํ•ฉ(overfitting)์ด๋ž€ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ•™์Šตํ•  ๋•Œ ํ•™์Šต ๋ฐ์ดํ„ฐ์…‹์— ์ง€๋‚˜์น˜๊ฒŒ ์ตœ์ ํ™”ํ•˜์—ฌ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ์ž…๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ์„ ์ง€๋‚˜์น˜๊ฒŒ ๋ณต์žกํ•˜๊ฒŒ ํ•™์Šตํ•˜์—ฌ ํ•™์Šต ๋ฐ์ดํ„ฐ..

[ํ†ต๊ณ„] ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„(Logistic Regression)์˜ ์ดํ•ด

๐Ÿ“š ๋ชฉ์ฐจ 1. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ ์ •์˜ 2. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์˜ ๋“ฑ์žฅ ๋ฐฐ๊ฒฝ 3. Odds(์˜ค์ฆˆ ๋˜๋Š” ์Šน์‚ฐ) ๋ฐ Odds Ratio (์˜ค์ฆˆ๋น„ ๋˜๋Š” ์Šน์‚ฐ๋น„) 3.1. Odds(์˜ค์ฆˆ ๋˜๋Š” ์Šน์‚ฐ) 3.2. Odds Ratio (์˜ค์ฆˆ๋น„ ๋˜๋Š” ์Šน์‚ฐ๋น„) 4. ์—ฐ๊ฒฐํ•จ์ˆ˜(Link Function) 5. ์šฐ๋„(๊ฐ€๋Šฅ๋„, Likehood) 1. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ ์ •์˜ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์€ ์„ค๋ช…๋ณ€์ˆ˜(๋…๋ฆฝ๋ณ€์ˆ˜, X)์™€ ๋ฒ”์ฃผํ˜• ๋ชฉํ‘œ๋ณ€์ˆ˜(์ข…์†๋ณ€์ˆ˜, Y) ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋ชจํ˜•ํ™”ํ•˜์—ฌ ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ๋ถ„์„ํ•˜๊ฑฐ๋‚˜ ๋ถ„๋ฅ˜ํ•˜๋Š” ํ†ต๊ณ„์  ๋ฐฉ๋ฒ•๋ก ์ž…๋‹ˆ๋‹ค. ํŠนํžˆ, ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„์„ ํ™œ์šฉํ•œ ๋ถ„๋ฅ˜(classification) ๋ฌธ์ œ์—์„œ๋Š” ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ์ง์ ‘ ์˜ˆ์ธก(prediction)ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹Œ 2๊ฐœ์˜ ํด๋ž˜์Šค(e.g., '์„ฑ๊ณต' or '์‹คํŒจ') ์ค‘ ํ•˜๋‚˜์˜ ํด๋ž˜์Šค๋กœ ์˜ˆ์ธกํ• ..

[ํ†ต๊ณ„] ํšŒ๊ท€๋ถ„์„(Linear Regression) ์ ˆ์ฐจ ๋ฐ ๋ฐฉ๋ฒ•

๐Ÿ“š ๋ชฉ์ฐจ 1. ํšŒ๊ท€๋ถ„์„ ์ ˆ์ฐจ ์†Œ๊ฐœ 2. ๋ฐ์ดํ„ฐ ๊ฒฝํ–ฅ์„ฑ ํ™•์ธ 2.1. ์‚ฐ์ ๋„ ํ–‰๋ ฌ 2.2. ์ƒ๊ด€๋ถ„์„ 3. ๋ชจ๋ธ ์ ํ•ฉ์„ฑ ํ™•์ธ 3.1. ๋ถ„์‚ฐ ๋ถ„์„(F-๊ฒ€์ •) 3.2. ์ˆ˜์ • ๊ฒฐ์ •๊ณ„์ˆ˜ ํ™•์ธ 3.2.1. ์ˆ˜์ •๊ฒฐ์ •๊ณ„์ˆ˜๋ž€? 3.2.2. ์ˆ˜์ • ๊ฒฐ์ •๊ณ„์ˆ˜ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์ ํ•ฉ์„ฑ ํŒ๋‹จ 3.3. ์ž”์ฐจ(์˜ค์ฐจ) ๋ถ„์„ 3.3.1. ์ž”์ฐจ์˜ ๊ธฐ๋ณธ ๊ฐ€์ • 3.3.2. ๊ฐ€์ค‘์ตœ์†Œ์ œ๊ณฑ(Weighted Least Squares) 4. ํšŒ๊ท€๊ณ„์ˆ˜ ๊ณ„์‚ฐ ๋ฐ ์œ ์˜์„ฑ ํ™•์ธ 4.1. ํšŒ๊ท€๊ณ„์ˆ˜ ๊ณ„์‚ฐ 4.1.1. ์ตœ์†Œ์ž์Šน๋ฒ•์ด๋ž€? 4.1.2. ์ตœ์†Œ์ž์Šน๋ฒ• ๊ธฐ๋ฐ˜ ํšŒ๊ท€๊ณ„์ˆ˜ ๊ณ„์‚ฐ 4.2. ํšŒ๊ท€๊ณ„์ˆ˜ ์œ ์˜์„ฑ ๊ฒ€์ •(t-๊ฒ€์ •) 4.3. ์„ค๋ช…๋ณ€์ˆ˜ ๊ฐ„ ๋‹ค์ค‘๊ณต์„ ์„ฑ ํ™•์ธ 4.3.1. ๋‹ค์ค‘๊ณต์„ ์„ฑ์ด๋ž€? 4.3.2. ๋‹ค์ค‘๊ณต์„ ์„ฑ ๋ฐœ์ƒ ์›์ธ 4.3.3. ๋‹ค์ค‘๊ณต์„ ์„ฑ ํ™•์ธ ๋ฐฉ๋ฒ• 4.3.4. ๋‹ค์ค‘๊ณต์„ ์„ฑ..

[ํ†ต๊ณ„] ํšŒ๊ท€๋ถ„์„(Linear Regression) ์ •์˜, ํŠน์ง•, ์ข…๋ฅ˜

๐Ÿ“š ๋ชฉ์ฐจ 1. ํšŒ๊ท€๋ถ„์„ ๊ฐœ๋… 2. ํšŒ๊ท€๋ถ„์„์˜ ๊ธฐ๋ณธ ๊ฐ€์ • 3. ํšŒ๊ท€๋ถ„์„์˜ ํŠน์ง• 3.1. ์žฅ์  3.2. ๋‹จ์  4. ํšŒ๊ท€๋ถ„์„์˜ ์ข…๋ฅ˜ 4.1. ์„ ํ˜•ํšŒ๊ท€๋ถ„์„ 4.1.1. ํŠน์ง• 4.1.2. ์ข…๋ฅ˜ 4.2. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ 4.2.1. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ ์ •์˜ 4.2.2. ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋ถ„์„ ํŠน์ง• 1. ํšŒ๊ท€๋ถ„์„ ๊ฐœ๋… ํšŒ๊ท€๋ถ„์„(Linear Regression)์€ ์„ค๋ช…๋ณ€์ˆ˜\((X)\)์™€ ๋ชฉํ‘œ๋ณ€์ˆ˜\((Y)\) ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋ชจํ˜•ํ™”ํ•˜์—ฌ ๋ชฉํ‘œ๋ณ€์ˆ˜๋ฅผ ์„ค๋ช…(explanation)ํ•˜๊ฑฐ๋‚˜ ์˜ˆ์ธก(prediction) ํ•  ๋•Œ , ๋˜๋Š” ์ฃผ์š” ์„ค๋ช…๋ณ€์ˆ˜๋ฅผ ํƒ์ƒ‰ํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ํ†ต๊ณ„์  ๋ฐฉ๋ฒ•๋ก ์ž…๋‹ˆ๋‹ค. ์˜ˆ์‹œ ๊ด‘๊ณ  ์ง€์ถœ์•ก์ด ๋†’์„์ˆ˜๋ก ๋งค์ถœ์•ก์ด ๋†’์„๊นŒ? ์ฃผ๋ฅ˜ ํŒ๋งค๋Ÿ‰์ด ์ฆ๊ฐ€ํ•˜๋ฉด ๊ฐ„์•” ํ™˜์ž ์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ• ๊นŒ? 2. ํšŒ๊ท€๋ถ„์„์˜ ๊ธฐ๋ณธ ๊ฐ€์ • ์•„๋ž˜ ์‚ฌํ•ญ ์ค‘ ํ•˜๋‚˜๋ผ๋„ ์œ„๋ฐฐ๋˜..

[๋จธ์‹ ๋Ÿฌ๋‹] ๊ต์ฐจ๊ฒ€์ฆ(Cross-validation) ํ•„์š”์„ฑ ๋ฐ ์žฅ๋‹จ์ 

๐Ÿ“š ๋ชฉ์ฐจ 1. ๊ต์ฐจ๊ฒ€์ฆ ์ •์˜ 2. ๊ต์ฐจ๊ฒ€์ฆ์˜ ์žฅ๋‹จ์  3. ๊ต์ฐจ๊ฒ€์ฆ์˜ ์ข…๋ฅ˜ 3.1. Hold-out Cross-Validation 3.2. K-Fold Cross-Validation 3.3. Leave-p-Out Cross-Validation(LpOCV) 3.4. Leave-One-Out CV(LOOCV) 1. ๊ต์ฐจ๊ฒ€์ฆ ์ •์˜ ๊ต์ฐจ๊ฒ€์ฆ์ด๋ž€ ๋ชจ๋ธ ํ•™์Šต ์‹œ ๋ฐ์ดํ„ฐ๋ฅผ ํ›ˆ๋ จ์šฉ๊ณผ ๊ฒ€์ฆ์šฉ์œผ๋กœ ๊ต์ฐจํ•˜์—ฌ ์„ ํƒํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ๋งŽ์ด ์‚ฌ์šฉ๋˜๋Š” ๊ต์ฐจ๊ฒ€์ฆ ๋ฐฉ๋ฒ•๋ก ์œผ๋กœ์„œ K-Fold Cross Validataion์„ ์˜ˆ์‹œ๋กœ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. K-Fold Cross Validataion์— ๋Œ€ํ•œ ์ž์„ธํ•œ ์„ค๋ช…์€ ์•„๋ž˜ '3. ๊ต์ฐจ๊ฒ€์ฆ์˜ ์ข…๋ฅ˜'์—์„œ ๋‹ค๋ฃจ๊ฒ ์Šต๋‹ˆ๋‹ค :) ์œ„ ๊ทธ๋ฆผ 1 ๊ณผ ๊ฐ™์ด ์ „์ฒด ๋ฐ์ดํ„ฐ์…‹ 5๋ถ„์˜ 1(\(20%\))์„ ํ…Œ..

[Python] ํ…์ŠคํŠธ ํŒŒ์ผ ์ฝ๊ณ  ์“ฐ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž!(feat. open, with ๊ตฌ๋ฌธ)

์•ˆ๋…•ํ•˜์„ธ์š”, ์˜ค๋Š˜์€ ํŒŒ์ด์ฌ์„ ํ™œ์šฉํ•˜์—ฌ ํ…์ŠคํŠธ ํŒŒ์ผ์„ ์ฝ๊ฑฐ๋‚˜ ์“ฐ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ ! ๋ชฉ์ฐจ 1. ํ…์ŠคํŠธ ํŒŒ์ผ ํ•ธ๋“ค๋ง ์ ˆ์ฐจ 2. ํ…์ŠคํŠธ ํŒŒ์ผ ์ž‘์„ฑ(๋˜๋Š” ์ƒ์„ฑํ•˜๊ธฐ) 2.1. ํ…์ŠคํŠธ ํŒŒ์ผ ์ ‘๊ทผํ•˜๊ธฐ 2.2. ํ…์ŠคํŠธ ํŒŒ์ผ ์ž‘์„ฑํ•˜๊ธฐ 2.3. ํ…์ŠคํŠธ ํŒŒ์ผ ๋‹ซ๊ธฐ 3. ํ…์ŠคํŠธ ํŒŒ์ผ ์ฝ์–ด์˜ค๊ธฐ 3.1. ํ…์ŠคํŠธ ํŒŒ์ผ ์กด์žฌ ์—ฌ๋ถ€ ํ™•์ธ 3.2. open ํ•จ์ˆ˜: ๋ชจ๋“  ๋‚ด์šฉ ์ฝ์–ด์˜ค๊ธฐ 3.3. realine ํ•จ์ˆ˜: ํ•œ ์ค„๋งŒ ์ฝ์–ด์˜ค๊ธฐ 3.4. readlines ํ•จ์ˆ˜: ๋ชจ๋“  ๋‚ด์šฉ ํ•œ ์ค„์”ฉ ์ฝ์–ด์˜ค๊ธฐ 4. ํŒŒ์ผ ํฌ์ธํ„ฐ 4.1. tell ํ•จ์ˆ˜: ํ˜„์žฌ ํŒŒ์ผ ํฌ์ธํ„ฐ ์œ„์น˜ ๋ฐ˜ํ™˜ 4.2. seek ํ•จ์ˆ˜: ํŒŒ์ผ ํฌ์ธํ„ฐ ์œ„์น˜ ์ด๋™ 5. with ๊ตฌ๋ฌธ์„ ํ™œ์šฉํ•œ ํ…์ŠคํŠธ ํŒŒ์ผ ํ•ธ๋“ค๋ง 1. ํ…์ŠคํŠธ ํŒŒ์ผ ํ•ธ๋“ค๋ง ์ ˆ์ฐจ ํ…์ŠคํŠธ ํŒŒ์ผ์„ ์ฝ..

SW ๊ฐœ๋ฐœ/Python 2021. 7. 20. 16:04