๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋ก๋ชจ๋ธ ํ‰๊ฐ€ (5)

DATA101

[Deep Learning] ํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ(MSE) ๊ฐœ๋… ๋ฐ ํŠน์ง•

๐Ÿ’ก ๋ชฉํ‘œํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ(MSE)์˜ ๊ฐœ๋…๊ณผ ํŠน์ง•์— ๋Œ€ํ•ด ์•Œ์•„๋ด…๋‹ˆ๋‹ค.1. MSE ๊ฐœ๋…ํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ(Mean Squared Error, MSE)๋Š” ์ด๋ฆ„์—์„œ ์•Œ ์ˆ˜ ์žˆ๋“ฏ์ด ์˜ค์ฐจ(error)๋ฅผ ์ œ๊ณฑํ•œ ๊ฐ’์˜ ํ‰๊ท ์ž…๋‹ˆ๋‹ค. ์˜ค์ฐจ๋ž€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์˜ˆ์ธกํ•œ ๊ฐ’๊ณผ ์‹ค์ œ ์ •๋‹ต๊ณผ์˜ ์ฐจ์ด๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์ •๋‹ต์„ ์ž˜ ๋งž์ถœ์ˆ˜๋ก MSE ๊ฐ’์€ ์ž‘๊ฒ ์ฃ . ์ฆ‰, MSE ๊ฐ’์€ ์ž‘์„์ˆ˜๋ก ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ์„ฑ๋Šฅ์ด ์ข‹๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ˆ˜์‹์„ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.$$ E = \frac{1}{n}\sum_{i=1}^{n}(y_{i} - \tilde{y_i})^2 $$\(y_i\): \(i\)๋ฒˆ์งธ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์ •๋‹ต\(\tilde{y_i}\): \(i\)๋ฒˆ์งธ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์˜ˆ์ธกํ•œ ๊ฐ’2. ํŠน์ง•2.1. ์˜ค์ฐจ ๋Œ€๋น„ ํฐ ์†์‹ค ํ•จ์ˆ˜์˜ ์ฆ๊ฐ€ํญMSE๋Š” ์˜ค์ฐจ๊ฐ€ ์ปค์งˆ์ˆ˜๋ก..

[Deep Learning] ์†์‹คํ•จ์ˆ˜(Loss Function) ๊ฐœ๋…

๐Ÿ’ก ๋ชฉํ‘œ ์†์‹ค ํ•จ์ˆ˜์˜ ๊ฐœ๋…๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ํ•™์Šต์˜ ์ˆ˜ํ•™์  ์˜๋ฏธ์— ๋Œ€ํ•ด ์•Œ์•„๋ด…๋‹ˆ๋‹ค. 1. ์†์‹ค ํ•จ์ˆ˜์˜ ๊ฐœ๋… ์†์‹ค ํ•จ์ˆ˜(Loss Function)๋Š” ์ง€๋„ํ•™์Šต(Supervised Learning) ์‹œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์˜ˆ์ธกํ•œ ๊ฐ’๊ณผ ์‹ค์ œ ์ •๋‹ต์˜ ์ฐจ์ด๋ฅผ ๋น„๊ตํ•˜๊ธฐ ์œ„ํ•œ ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ์ฆ‰, 'ํ•™์Šต ์ค‘์— ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ์–ผ๋งˆ๋‚˜ ์ž˜๋ชป ์˜ˆ์ธกํ•˜๋Š” ์ •๋„'๋ฅผ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•œ ํ•จ์ˆ˜๋กœ์จ ์ตœ์ ํ™”(Optimization)๋ฅผ ์œ„ํ•ด ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฒƒ์ด ๋ชฉ์ ์ธ ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ๊ทธ๋ž˜์„œ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ๋ชฉ์  ํ•จ์ˆ˜(Objective Function)๋ผ๊ณ ๋„ ๋ถ€๋ฆ…๋‹ˆ๋‹ค. ์ด์™ธ์—๋„ ์†์‹ค ํ•จ์ˆ˜๋Š” ๋ถ„์•ผ์— ๋”ฐ๋ผ ๋น„์šฉ ํ•จ์ˆ˜(Cost Function), ์—๋„ˆ์ง€ ํ•จ์ˆ˜(Energy Function) ๋“ฑ์œผ๋กœ ๋‹ค์–‘ํ•˜๊ฒŒ ๋ถ€๋ฅด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. ์†์‹ค ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ ํ•™์Šต ์ค‘์— ์†์‹ค(loss)์ด ์ปค์งˆ์ˆ˜๋ก ํ•™..