목록View All (352)
DATA101

안녕하세요, 오늘은 머신러닝 알고리즘 Random Forest로 Binary Classification 모델링하는 절차와 방법을 공유하고자 합니다. 실습 데이터는 오픈소스인 Wine Quality Data Set입니다. 1. 실습코드 및 데이터셋 데이터셋과 전체 파이썬 코드는 이곳에서 받으실 수 있습니다. GitHub - park-gb/wine-data-classification: The wine data classification using machine learning algorithms The wine data classification using machine learning algorithms - GitHub - park-gb/wine-data-classification: The wine dat..

📚목차 1. 랜덤포레스트 정의 2. 랜덤포레스트 장단점 3. 실습코드 및 데이터셋 4. 코드 설명 1. Random Forest 정의 Random Forest는 의사결정나무 모델 여러 개를 훈련시켜서 그 결과를 종합해 예측하는 앙상블 알고리즘입니다. 각 의사결정나무 모델을 훈련시킬 때 배깅(Bagging) 방식을 사용합니다. 배깅은 전체 Train dataset에서 중복을 허용해 샘플링한 Dataset으로 개별 의사결정나무 모델을 훈련하는 방식입니다. 이렇게 여러 모델을 통해 예측한 값은 평균을 취하여 최종적인 예측값을 산출합니다. 이 배깅 방식은 예측 모델의 일반화(generalization, a.k.a., 안정성) 성능을 향상하는 데 도움이 됩니다. 2. 랜덤포레스트 장단점 장점 단점 일반화 및 성능..

필독! 안녕하세요, 구글 플레이 스토어 웹 페이지 구조가 변경됨에 따라 현재 포스팅에 업로드한 크롤러는 작동하지 않습니다. 개편된 웹 페이지 구조를 고려하여 크롤러를 업데이트하였습니다. 아래 포스팅을 참고해 주세요! 감사합니다. https://heytech.tistory.com/293 [Python] 구글 플레이 스토어 웹 크롤러 코드 Version2 안녕하세요! 오늘은 파이썬(주피터 노트북)을 기반으로 직접 코딩한 구글 플레이 스토어 웹 크롤러 코드를 공유합니다. 📝 목차 1. 업데이트 Log 2. 주요 기능 3. 전체 코드 4. 필수 초기 세팅 5. heytech.tistory.com 안녕하세요! 오늘은 파이썬(주피터 노트북)을 기반으로 직접 코딩한 구글 플레이 스토어 웹 크롤러 코드를 공유합니다. ..

오늘은 모바일 뱅킹 App 리뷰 텍스트마이닝 관련 논문을 방법론 위주로 빠르게 리뷰해 보겠습니다.그럼 바로 시작하죠!📚 논문 출처 APALeem, B. H., & Eum, S. W. (2021). Using text mining to measure mobile banking service quality. Industrial Management & Data Systems.💡 요약카카오뱅크 앱 리뷰 텍스트마이닝을(키워드 추출, 토픽 모델링, 감정분석) 통해 모바일 뱅킹 앱 서비스 퀄리티 평가한 논문1. 데이터 수집 및 전처리1.1. Data collection- 데이터: 카카오 뱅크 고객 리뷰 3,900건- 수집 출처: 구글 플레이 스토어- 수집 방법: WebHarvy 웹 크롤링 솔루션 활용- 수집일..

📚 목차 1. 의사결정나무란? 2. 의사결정나무의 장단점 3. 의사결정나무 구조 및 용어 4. 의사결정나무의 분리조건 4.1. 의사결정나무 기반 예측 모델링 4.1.1. MSE(Mean Squared Error, 평균 제곱 오차) 4.1.2. MAE(Mean Absolute Error, 평균 절대 오차) 4.2. 의사결정나무 기반 분류 모델링 4.2.1. 지니 지수(Gini Index) 4.2.2. 엔트로피 지수(Entropy Index) 5. 의사결정나무 변수별 중요도 계산 1. 의사결정나무란? 의사결정나무(Decision Tree)는 설명변수(X) 간의 관계나 척도에 따라 목표변수(Y)를 예측하거나 분류하는 문제에 활용되는 나무 구조의 모델입니다. 즉, 설명변수의 관측값을 모델에 입력해 목표변수를 분..

안녕하세요 👨💻 오늘은 깃허브 커밋 시 로그인 에러가 발생했을 때 해결하는 방법에 대해 공유해 드립니다. 👀 에러 메시지(cf. 그림 1) git: 'credential-manager' is not a git command. See 'git --help'. Username for 'https://github.com': park-gb Password for 'https://park-gb@github.com': git: 'credential-manager' is not a git command. See 'git --help'. remote: Support for password authentication was removed on August 13, 2021. Please use a personal acc..

📚 문제 원본: https://programmers.co.kr/learn/courses/30/lessons/49189?language=python3 코딩테스트 연습 - 가장 먼 노드 6 [[3, 6], [4, 3], [3, 2], [1, 3], [1, 2], [2, 4], [5, 2]] 3 programmers.co.kr 💡 접근법 ⚙️ 활용 알고리즘: BFS 저의 접근법은 다음과 같습니다. 2차원 리스트를 활용해 노드 간 연결정보를 업데이트하고 노드별 거리 정보를 저장할 1차원 리스트를 초기화합니다. 시작 노드를 큐에 삽입하고 해당 노드와 연결된 노드의 거리 정보를 시작 노드의 거리 정보에 1을 더해 업데이트합니다. 도착 노드를 다시 큐에 삽입하고 위의 과정을 반복합니다. 💻 My solution fr..

📚 문제 원본: https://programmers.co.kr/learn/courses/30/lessons/43165?language=python3 코딩테스트 연습 - 타겟 넘버 n개의 음이 아닌 정수가 있습니다. 이 수를 적절히 더하거나 빼서 타겟 넘버를 만들려고 합니다. 예를 들어 [1, 1, 1, 1, 1]로 숫자 3을 만들려면 다음 다섯 방법을 쓸 수 있습니다. -1+1+1+1+1 = 3 +1-1+1+1+ programmers.co.kr 💡 접근법 ⚙️ 활용 알고리즘: DFS 저의 접근법은 다음과 같습니다. DFS 알고리즘을 중심으로 0부터 시작하여 부모 노드에 number를 더하거나 빼는 작업을 동시에 수행하여 자식 노드를 생성하고, 해당 자식 노드를 다시 부모 노드로 치환해 위 작업을 반복 수..