๊ด€๋ฆฌ ๋ฉ”๋‰ด

๋ชฉ๋กํ…์ŠคํŠธ๋งˆ์ด๋‹ (5)

DATA101

๐Ÿš˜ Youtube ๋Œ“๊ธ€ ํ†ตํ•ด ์•Œ์•„๋ณด๋Š” '๊น€ํ•œ์šฉ์˜ MOCAR' ์ฑ„๋„ ์‹ฌ์ธต ๋ถ„์„ (๋ฐ์ดํ„ฐ๋ถ„์„์‚ฌ๋ก€zip)

์•ˆ๋…•ํ•˜์„ธ์š”, AI/๋น…๋ฐ์ดํ„ฐ๋ถ„์„ ์—ฐ๊ตฌ๊ฐœ๋ฐœ ์ „๋ฌธ๋ฒ•์ธ DATA101 ํŒ€์ž…๋‹ˆ๋‹ค๐Ÿ‘‹ ๐Ÿš˜ ๋Œ€ํ•œ๋ฏผ๊ตญ ๋Œ€ํ‘œ ์ž๋™์ฐจ ์œ ํŠœ๋ธŒ ์ฑ„๋„ ๊น€ํ•œ์šฉ์˜mocar์˜ 2024๋…„ ์—…๋กœ๋“œ ์˜์ƒ๋“ค์„ AI์™€ ๋น…๋ฐ์ดํ„ฐ ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•ด ์‹œ์ฒญ์ž๋“ค์˜ ๋ฐ˜์‘์„ ๋ถ„์„ํ•ด ๋ดค์Šต๋‹ˆ๋‹ค! ๐Ÿ‘€ ์ปจํ…์ธ  ์ฃผ์ œ๋ณ„ ๋Œ“๊ธ€์„ ํ…์ŠคํŠธ๋งˆ์ด๋‹ํ•˜๊ณ  ์กฐํšŒ์ˆ˜/์ข‹์•„์š”์ˆ˜/๋Œ“๊ธ€ ๋“ฑ์„ ์ข…ํ•ฉ ๊ณ ๋ คํ•˜์—ฌ, ์‹œ์ฒญ์ž๋“ค์ด ์ปจํ…์ธ ๋งˆ๋‹ค ์–ด๋–ค ๋ฐ˜์‘์„ ๋ณด์˜€๋Š”์ง€ ํ™•์ธํ•ด ๋ณด์„ธ์š”. ์ด๋ฒˆ ๋ถ„์„ ์ฃผ์ œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์•„์š”! #1. ์‹œ์ฒญ์ž๋“ค์ด ๊ฐ€์žฅ ๊ด€์‹ฌ์ด ๋†’์€ ์‹ ์ฐจ, ์‹œ์Šน๊ธฐ์— ๋Œ€ํ•œ ๋ฐ˜์‘ ๋ถ„์„#2. ๋Œ“๊ธ€ ํŠธ๋ Œ๋“œ๋กœ ์‚ดํŽด๋ณธ ์ „๊ธฐ์ฐจํฌ๋น„์•„ ์ธ์‹ ๋ณ€ํ™” ๋ถ„์„#3. ์˜์ƒ์„ฑ๊ณต์ง€ํ‘œ ๊ธฐ๋ฐ˜, 24๋…„ HOT ํ–ˆ๋˜ ์˜์ƒ๊ณผ ์‹ธ๋Š˜ํ•œ ๊ด€์‹ฌ์„ ๋ฐ›์€ ์˜์ƒ ์†Œ๊ฐœ ๐Ÿ‘จ‍๐Ÿ’ป ์ €ํฌ DATA101 ํŒ€์€ ์ด์ฒ˜๋Ÿผ ์œ ํŠœ๋ธŒ Data๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ์ „๋ฌธ์ ์ด๊ณ  ๋งž์ถคํ™”๋œ ์ปจํ…์ธ  ๋ถ„์„..

๐Ÿ† ๋ฐ์ดํ„ฐ์›Œ๋„ˆ์›, ํ”„๋ฆฌ๋žœ์„œ ๋งˆ์ผ“ ์ƒ์œ„ 2% ์ „๋ฌธ๊ฐ€ 'ํฌ๋ชฝ prime ์„œ๋น„์Šค' ์„ ์ •!

๐Ÿ‘ ์ง€๋‚œ 2์›”, ๋ฐ์ดํ„ฐ์›Œ๋„ˆ์› ํŒ€์˜ AI/๋น…๋ฐ์ดํ„ฐ๋ถ„์„ ์†”๋ฃจ์…˜์ด No.1 ํ”„๋ฆฌ๋žœ์„œ ๋งˆ์ผ“ ํฌ๋ชฝ์—์„œ ์—„์„ ํ•œ ์ƒ์œ„ 2% ์ „๋ฌธ๊ฐ€ ์„œ๋น„์Šค์ธ prime์— ์„ ์ •๋˜์—ˆ์Šต๋‹ˆ๋‹ค.  ๐Ÿ† prime์€ 100๋งŒ ๊ฑด ์ด์ƒ์˜ ํฌ๋ชฝ ๊ฑฐ๋ž˜ Data๋ฅผ ๋ถ„์„ํ•˜๊ณ  ์„œ๋น„์Šค ๋งŒ์กฑ๋„ 99% ์ด์ƒ์ธ ์ „๋ฌธ๊ฐ€ ์ธํ„ฐ๋ทฐ ๋ฐ ๋ ˆํผ๋Ÿฐ์Šค ์ฒดํฌ๋ฅผ ํ†ตํ•ด ์—„์„ ๋œ 300์—ฌ ๋ช…์˜ ์†Œ์ˆ˜ ์ „๋ฌธ๊ฐ€์—๊ฒŒ๋งŒ ์ฃผ์–ด์ง€๋Š” ์„œ๋น„์Šค์ž…๋‹ˆ๋‹ค.   ๐Ÿค ์ฃผ๋กœ Prime ์ „๋ฌธ๊ฐ€๋Š” ๋Œ€๊ธฐ์—…๋ถ€ํ„ฐ ์Šคํƒ€ํŠธ์—…, ์ •๋ถ€๊ธฐ๊ด€๊นŒ์ง€ B2B ๊ณ ๊ฐ์„ ์ฃผ ํƒ€๊ฒŸ์œผ๋กœ ๊ฑฐ๋ž˜ํ•˜๋Š” ํ’ˆ์งˆ๋ณด์žฅ ์—…์ฒด๋“ค๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.  ๐Ÿ‘จ‍๐Ÿ’ป ํ˜„์žฌ ์ €ํฌ ๋ฐ์ดํ„ฐ์›Œ๋„ˆ์› ํŒ€์€ AI๋ฅผ ํ™œ์šฉํ•œ ๋น…๋ฐ์ดํ„ฐ๋ถ„์„ ์†”๋ฃจ์…˜ ๊ตฌ์ถ•๋ถ€ํ„ฐ ๋‹ค์–‘ํ•œ ์‚ฐ์—…๊ตฐ์˜ ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„ ๊ณผ์ œ ์ˆ˜ํ–‰์„ ์ง€์›ํ•ด ๋“œ๋ฆฌ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.  ๐Ÿ™ AI ๊ธฐ์ˆ ์„ ํ™œ์šฉํ•œ SW ์ธํ”„๋ผ ๊ตฌ์ถ•์ด๋‚˜ ๋น…๋ฐ์ดํ„ฐ ๋ถ„์„..

[NLP] LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง์„ ํ™œ์šฉํ•œ ์•ฑ ๋ฆฌ๋ทฐ ๋ถ„์„ ํ”„๋กœ์ ํŠธ

๐Ÿ“š ๋ชฉ์ฐจ1. ๊ฐœ์š” 2. ๋ฐ์ดํ„ฐ์…‹ 3. LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง ๊ฐœ๋… 4. LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง ์‹œ๊ฐํ™” 5. ์ „์ฒด ์ฝ”๋“œ 6. ์ฝ”๋“œ ์„ค๋ช… 7. ๊ฒฐ๊ณผ ํ•ด์„๋ฐฉ๋ฒ• 8. ์ธ์‚ฌ์ดํŠธ ๋„์ถœ1. ๊ฐœ์š”๋ณธ ํ”„๋กœ์ ํŠธ์—์„œ๋Š” ๊ฑด๊ฐ•๊ด€๋ฆฌ ์•ฑ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ๋งˆ์ด๋‹์„ ํ†ตํ•ด ๊ณ ๊ฐ์˜ ๋‹ˆ์ฆˆ๋ฅผ ๋ถ„์„ํ•˜๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๊ฑด๊ฐ•๊ด€๋ฆฌ ์•ฑ์˜ ๋””์ž์ธ ์ „๋žต์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ๊ตญ๋‚ด ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด์—์„œ ๊ฑด๊ฐ•๊ด€๋ฆฌ ์•ฑ 424๊ฐœ์—์„œ ๋ฆฌ๋ทฐ 54๋งŒ ๊ฑด์„ ์ˆ˜์ง‘ํ•˜์˜€์œผ๋ฉฐ, LDA ํ† ํ”ฝ ๋ชจ๋ธ๋ง์„ ํ†ตํ•ด ์‹ฌ์ธต์ ์œผ๋กœ ๊ณ ๊ฐ์˜ ๋‹ˆ์ฆˆ๋ฅผ ๋ถ„์„ํ•˜์˜€์Šต๋‹ˆ๋‹ค. ์ „์ฒด ์ฝ”๋“œ ๋ฐ ๋ฐ์ดํ„ฐ์…‹์€ Github์— ์—…๋กœ๋“œํ•ด ๋‘์—ˆ์Šต๋‹ˆ๋‹ค.2. ๋ฐ์ดํ„ฐ์…‹2.1. ์‚ฌ์šฉ์ž ๋ฆฌ๋ทฐํ•œ๊ตญ ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ๋‚ด ๊ฑด๊ฐ•๊ด€๋ฆฌ ์•ฑ 424๊ฐœ์—์„œ ๋ฆฌ๋ทฐ 54๋งŒ ๊ฑด ์ˆ˜์ง‘(์›๋ณธ: Github)๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐฉ๋ฒ•: ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด ๋ฆฌ๋ทฐ ์ˆ˜์ง‘ ํฌ๋กค๋Ÿฌ ์ž์ฒด..

[NLP] Pretrained ์–ธ์–ด๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ•œ๊ตญ์–ด ๊ฒฝ์ œ ๋‰ด์Šค ๊ธฐ์‚ฌ ๊ฐ์ • ๋ถ„๋ฅ˜

๐Ÿ“š ๋ชฉ์ฐจ1. ํ”„๋กœ์ ํŠธ ๊ฐœ์š” 2. ๊ฐœ๋ฐœํ™˜๊ฒฝ 3. Pretrained ์–ธ์–ด ๋ชจ๋ธ 4. ๊ฒฝ์ œ ๋‰ด์Šค ๊ธฐ์‚ฌ ๊ฐ์ • ๋ฐ์ดํ„ฐ์…‹ 5. ์ „์ฒด ์†Œ์Šค์ฝ”๋“œ 6. ์ฝ”๋“œ ์„ค๋ช…1. ํ”„๋กœ์ ํŠธ ๊ฐœ์š”Pretrained ์–ธ์–ด ๋ชจ๋ธ์ธ KLUE BERT-base ์œ„์— ๊ฒฝ์ œ ๋‰ด์Šค ๊ธฐ์‚ฌ์˜ ๊ฐ์ •์ด ๋ผ๋ฒจ๋ง ๋œ ๋ฐ์ดํ„ฐ์…‹ ํ•œ๊ตญ์–ด ๋ฒ„์ „์˜ Finance Phrase Bank์„ ํ™œ์šฉํ•˜์—ฌ ํŒŒ์ธํŠœ๋‹ํ•œ ๊ฐ์ • ๋ถ„๋ฅ˜ ํ”„๋กœ์ ํŠธ2. ๊ฐœ๋ฐœํ™˜๊ฒฝGoogle Colab Pro / GPU3. Pretrained ์–ธ์–ด ๋ชจ๋ธKLUE(Korean Language Understanding Evaluation) BERT baseํ•™์Šตํ•œ ๋ฐ์ดํ„ฐ์…‹์—ฐํ•ฉ๋‰ด์Šค์˜ ๋‰ด์Šค ํ—ค๋“œ๋ผ์ธ์šฐํ‚คํ”ผ๋””์•„์œ„ํ‚ค๋‰ด์Šค์œ„ํ‚คํŠธ๋ฆฌ์ •์น˜๋‰ด์ŠคParaKQC(Parallel dataset of Korean Questions and Com..

[๋…ผ๋ฌธ ๋ฆฌ๋ทฐ] Leem, B. H., & Eum, S. W. (2021). Using text mining to measure mobile banking service quality. Industrial Management & Data Systems.

์˜ค๋Š˜์€ ๋ชจ๋ฐ”์ผ ๋ฑ…ํ‚น App ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ๋งˆ์ด๋‹ ๊ด€๋ จ ๋…ผ๋ฌธ์„ ๋ฐฉ๋ฒ•๋ก  ์œ„์ฃผ๋กœ ๋น ๋ฅด๊ฒŒ ๋ฆฌ๋ทฐํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.๊ทธ๋Ÿผ ๋ฐ”๋กœ ์‹œ์ž‘ํ•˜์ฃ !๐Ÿ“š ๋…ผ๋ฌธ ์ถœ์ฒ˜ APALeem, B. H., & Eum, S. W. (2021). Using text mining to measure mobile banking service quality. Industrial Management & Data Systems.๐Ÿ’ก ์š”์•ฝ์นด์นด์˜ค๋ฑ…ํฌ ์•ฑ ๋ฆฌ๋ทฐ ํ…์ŠคํŠธ๋งˆ์ด๋‹์„(ํ‚ค์›Œ๋“œ ์ถ”์ถœ, ํ† ํ”ฝ ๋ชจ๋ธ๋ง, ๊ฐ์ •๋ถ„์„) ํ†ตํ•ด ๋ชจ๋ฐ”์ผ ๋ฑ…ํ‚น ์•ฑ ์„œ๋น„์Šค ํ€„๋ฆฌํ‹ฐ ํ‰๊ฐ€ํ•œ ๋…ผ๋ฌธ1.  ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ์ „์ฒ˜๋ฆฌ1.1.  Data collection- ๋ฐ์ดํ„ฐ: ์นด์นด์˜ค ๋ฑ…ํฌ ๊ณ ๊ฐ ๋ฆฌ๋ทฐ 3,900๊ฑด- ์ˆ˜์ง‘ ์ถœ์ฒ˜: ๊ตฌ๊ธ€ ํ”Œ๋ ˆ์ด ์Šคํ† ์–ด- ์ˆ˜์ง‘ ๋ฐฉ๋ฒ•: WebHarvy ์›น ํฌ๋กค๋ง ์†”๋ฃจ์…˜ ํ™œ์šฉ- ์ˆ˜์ง‘์ผ..