- Today
- Total
목록AI & 빅데이터 (113)
DATA101

본 포스팅에서는 딥러닝에 있어서 Generalization 기법 중 하나인 Drop-out(드롭아웃)에 대해 알아봅니다.📚 목차1. Drop-out 개념 2. Drop-out 사용이유3. Mini-batch 학습 시 Drop-out4. Test 시 Drop-out 1. Drop-out 개념Drop-out은 서로 연결된 연결망(layer)에서 0부터 1 사이의 확률로 뉴런을 제거(drop)하는 기법입니다. 예를 들어, 위의 그림 1 과 같이 drop-out rate가 0.5라고 가정하겠습니다. Drop-out 이전에 4개의 뉴런끼리 모두 연결되어 있는 전결합 계층(Fully Connected Layer)에서 4개의 뉴런 각각은 0.5의 확률로 제거될지 말지 랜덤하게 결정됩니다. 위의 예시에서는 2..

📚 목차1. 개념 1.1. 과대적합(Overfitting)이란? 1.2. 과소적합(Underfitting)이란?2. 탐지 2.1. 분산과 편향 기반 탐지 2.2. 산점도 그래프 기반 탐지 2.3. 모델 복잡도 및 손실함수 기반 탐지 2.3.1. 과소적합 발생 구간 2.3.2. 과대적합 발생 구간 2.3.3. 최적의 모델 적합 포인트3. 과대적합 방지방법: 학습 조기종료(Early Stopping)1. 개념1.1. 과대적합(overfitting)이란?과대적합(overfitting)이란 머신러닝 모델을 학습할 때 학습 데이터셋에 지나치게 최적화하여 발생하는 문제입니다. 즉, 모델을 지나치게 복잡하게 학습하여 학습 데이터..

📚 목차 1. 로지스틱 회귀분석 정의 2. 로지스틱 회귀분석의 등장 배경 3. Odds(오즈 또는 승산) 및 Odds Ratio (오즈비 또는 승산비) 3.1. Odds(오즈 또는 승산) 3.2. Odds Ratio (오즈비 또는 승산비) 4. 연결함수(Link Function) 5. 우도(가능도, Likehood) 1. 로지스틱 회귀분석 정의 로지스틱 회귀분석은 설명변수(독립변수, X)와 범주형 목표변수(종속변수, Y) 간의 관계를 모형화하여 목표변수를 분석하거나 분류하는 통계적 방법론입니다. 특히, 로지스틱 회귀분석을 활용한 분류(classification) 문제에서는 목표변수를 직접 예측(prediction)하는 것이 아닌 2개의 클래스(e.g., '성공' or '실패') 중 하나의 클래스로 예측할..

📚 목차 1. 회귀분석 절차 소개 2. 데이터 경향성 확인 2.1. 산점도 행렬 2.2. 상관분석 3. 모델 적합성 확인 3.1. 분산 분석(F-검정) 3.2. 수정 결정계수 확인 3.2.1. 수정결정계수란? 3.2.2. 수정 결정계수 기반 모델 적합성 판단 3.3. 잔차(오차) 분석 3.3.1. 잔차의 기본 가정 3.3.2. 가중최소제곱(Weighted Least Squares) 4. 회귀계수 계산 및 유의성 확인 4.1. 회귀계수 계산 4.1.1. 최소자승법이란? 4.1.2. 최소자승법 기반 회귀계수 계산 4.2. 회귀계수 유의성 검정(t-검정) 4.3. 설명변수 간 다중공선성 확인 4.3.1. 다중공선성이란? 4.3.2. 다중공선성 발생 원인 4.3.3. 다중공선성 확인 방법 4.3.4. 다중공선성..

📚 목차 1. 회귀분석 개념 2. 회귀분석의 기본 가정 3. 회귀분석의 특징 3.1. 장점 3.2. 단점 4. 회귀분석의 종류 4.1. 선형회귀분석 4.1.1. 특징 4.1.2. 종류 4.2. 로지스틱 회귀분석 4.2.1. 로지스틱 회귀분석 정의 4.2.2. 로지스틱 회귀분석 특징 1. 회귀분석 개념 회귀분석(Linear Regression)은 설명변수\((X)\)와 목표변수\((Y)\) 간의 관계를 모형화하여 목표변수를 설명(explanation)하거나 예측(prediction) 할 때 , 또는 주요 설명변수를 탐색할 때 사용하는 통계적 방법론입니다. 예시 광고 지출액이 높을수록 매출액이 높을까? 주류 판매량이 증가하면 간암 환자 수가 증가할까? 2. 회귀분석의 기본 가정 아래 사항 중 하나라도 위배되..

📚 목차 1. 교차검증 정의 2. 교차검증의 장단점 3. 교차검증의 종류 3.1. Hold-out Cross-Validation 3.2. K-Fold Cross-Validation 3.3. Leave-p-Out Cross-Validation(LpOCV) 3.4. Leave-One-Out CV(LOOCV) 1. 교차검증 정의 교차검증이란 모델 학습 시 데이터를 훈련용과 검증용으로 교차하여 선택하는 방법입니다. 일반적으로 많이 사용되는 교차검증 방법론으로서 K-Fold Cross Validataion을 예시로 살펴보겠습니다. K-Fold Cross Validataion에 대한 자세한 설명은 아래 '3. 교차검증의 종류'에서 다루겠습니다 :) 위 그림 1 과 같이 전체 데이터셋 5분의 1(\(20%\))을 테..

안녕하세요, 오늘은 파이썬의 pandas 라이브러리를 활용하여 데이터프레임의 칼럼 이름을 변경하는 방법에 대해 공유해 드립니다. 그럼 바로 시작하죠! 목차 1. 데이터프레임 셋업 2. 칼럼 이름 변경하기 2.1. columns 함수: 새로운 칼럼 이름으로 덮어쓰기 2.2. rename 함수: 특정 칼럼만 지정하여 이름 변경하기 2.3. lambda 함수: 기존 칼럼 이름에 새로운 패턴 추가하기 1. 데이터프레임 셋업 판다스 모듈 설치하기 pip install pandas 판다스 라이브러리를 설치하지 않으셨다면 설치해 주세요. 판다스 모듈 불러오기 import pandas as pd 판다스 라이브러리를 불러옵니다. 데이터프레임 생성 df = pd.DataFrame({"식별번호": [1, 2, 3, 4, 5..

안녕하세요, 오늘은 SQLite 기반에서 데이터/테이블을 삭제하는 방법에 대해 공유해 드립니다. SQLite 설치는 아래 포스팅을 참고해 주세요. heytech.tistory.com/11 [SQL] SQLite 및 연습용 데이터셋 설치하기! 오늘부터 SQLite 데이터베이스를 활용하여 SQL의 기본적인 문법을 빠르고 쉽게 전달해 드립니다. 바로 시작하죠! 목차 1. SQLite란? 2. SQLite 설치 3. SQLite Studio 설치 4. 연습용 DB 설치: Baseball Databank.. heytech.tistory.com 바로 시작하죠! 목차 1. 데이터 삭제하기: DELETE 1.1. 특정 데이터 삭제하기 1.1.1. 특정 데이터 삭제 소스코드 1.1.2. 테이블 변화 확인 1.1.3. 실..