- Today
- Total
목록View All (350)
DATA101

❗️ 에러 메시지 컴파일 중 아래와 같은 에러를 마주하였습니다. Error: Could not find or load main class 패키지명.자바명 Caused by: java.lang.ClassNotFoundException: 패키지명.자바명 💡 원인 해당 에러의 원인은 이클립스 내 자바 라이브러리가 제대로 설정되어 있지 않기 때문입니다. 먼저, 코드 내 패키지, 클래스 이름, 파일명 등에 오탈자가 없는지 확인해 봅니다. 그럼에도 위와 같은 에러가 발생한다면, 아래의 해결방법을 참고해 주세요. ✅ 해결방법 Step 1. 프로젝트 Properties 접근 프로젝트 이름 우측 클릭 후 Properties 클릭합니다. Step 2. JRE System Library 체크 1) 좌측 메뉴바에서 Java ..

💡 들어가며 본 포스팅에서는 데이터를 주 단위로 카운팅하고 이를 시각화하는 방법을 소개합니다. 1. 패키지 import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. 데이터셋 불러오기 포스팅에서 사용되는 데이터셋은 공유가 불가하오니 학습 목적으로만 봐주시길 바랍니다. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. 데이터 타입 확인 DATASET.dtypes 아래와 같이, 날짜 정보(date)는 현재 정수형(int)입니다. 편리하게 날짜형 데이터를 처리하기 위하여 이를 datetime 타입으로 바꿔줄 필요가 있습니다. 4. 데이터 타입 변경 "연-..

💡 들어가며 본 포스팅에서는 데이터를 월 단위로 카운팅하고 이를 시각화하는 방법을 소개합니다. 1. 패키지 import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. 데이터셋 불러오기 포스팅에서 사용되는 데이터셋은 공유가 불가하오니 학습 목적으로만 봐주시길 바랍니다. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. 데이터 타입 확인 DATASET.dtypes 아래와 같이, 날짜 정보(date)는 현재 정수형(int)입니다. 편리하게 날짜형 데이터를 처리하기 위하여 이를 datetime 타입으로 바꿔줄 필요가 있습니다. 4. 데이터 타입 변경 "연-..

📚 목차 1. 사전 준비 2. 월 데이터 추출 3. 요일 데이터 추출 4. 특정 기간 데이터 추출 📌 1. 사전 준비 아래의 그림 1과 같이, 데이터셋에 날짜 데이터는 datetime 타입을 가지도록 사전에 준비해 주셔야 합니다. 만일, 날짜 데이터가 '20220101'과 같이 문자열이나 정수형이라면 아래의 포스팅을 참고하셔서 데이터 타입을 datetime으로 변경하시길 바랍니다. https://heytech.tistory.com/443?category=453614#recentComments [Python] 숫자형/문자열 데이터를 날짜형으로 바꾸기(pd.to_datetime) 📌 목표 숫자형 데이터를 날짜 형태로(i.e., datetime) 변환하기 예시: 20220816 (int) 👉 2022-08-1..

📌 목표 숫자형 데이터를 날짜 형태로(i.e., datetime) 변환하기 예시: 20220816 (int) 👉 2022-08-16 (datetime object) 🗂 목차 1. 데이터셋 예시 2. 데이터 타입 변경 3. 코드 뜯어보기 📝 데이터셋 예시 파이썬의 pandas 패키지를 활용하겠습니다. import pandas as pd 아래의 그림 1과 같이, 고객 ID, 리뷰 등록일, 텍스트 데이터가 담긴 데이터셋이 있습니다. 칼럼별 데이터 타입을 확인해 봅니다. 위의 그림 2와 같이, date 칼럼이 정수형인 것을 확인하실 수 있습니다. 💡 데이터 타입 변경 이제 date 칼럼을 datetime 형태로 변환해 보겠습니다. 🛠 코드 DATASET['datetime'] = DATASET['date'].ap..

💡 들어가며 Numpy 패키지의 where 함수를 사용하면 데이터프레임에서 특정 조건에 맞는 인덱스를 찾거나, 해당 인덱스의 값을 쉽게 바꿀 수 있습니다. 기본적으로 numpy 패키지 설치 및 import는 필수입니다. !pip install numpy import numpy as np 1. 조건에 맞는 인덱스 반환 아래와 같이 조건문을 입력하면, 조건에 해당되는 인덱스를 반환합니다. np.where(조건문) 아래와 같은 데이터셋이 있을 때, THK 칼럼 내 값이 30보다 큰 값의 인덱스를 조회해 보면 아래와 같습니다. np.where(30 < DATASET_RAW['THK']) 2. 조건에 따라 데이터 인코딩 아래와 같이, 조건문과 함께 조건문이 참 혹은 거짓일 경우 각각 데이터를 변환할 값을 입력해 ..

💡 들어가며데이터프레임 내 문자열 한 글자까지 완벽하게 일치하는 원소를 찾는지 혹은 일부 글자라도 일치하는 원소를 찾을지에 따라 사용해야 할 함수가 나뉩니다(아래 표 참고).No.함수활용방안1replace()완벽하게 일치하는 단어를 찾아 바꾸는 경우2str.replace()일부 단어라도 일치하는 단어를 찾아 바꾸는 경우함수별로 각각 자세히 알아봅니다.📚 목차1. replace 함수 1) 기본 사용방법 2) 여러 문자열 동시 변경 3) 특정 칼럼 데이터 변경 4) 원본 데이터 변경옵션(inplace)2. str.replace 함수1) 기본 사용방법내장 함수 replace는 데이터프레임 내 특정 문자열과 완벽하게 일치하는 데이터를 모두 찾아 변경합니다.df.replace('현재 ..

📚 목차 1. RNN 개념 2. RNN 수식 3. RNN 용도 1. RNN 개념 Recurrent Neural Network(RNN)은 자연어 문장과 같이 단어의 순서에 따라 의미가 달라지는 순차 데이터(Sequential Data)를 다룰 때 주로 사용되는 신경망입니다. 따라서 RNN은 단어의 어순에 따라 문장의 의미가 달라지고 앞에 어떤 단어가 쓰였는지 기억해야 뒤에 오는 단어를 예측하는 등의 문제를 풀 때 주로 활용됩니다. RNN은 Hidden Layer의 노드에서 활성화 함수(Activation Function)를 거쳐 나온 결괏값을 Output Layer로 보내면서 다시 다음 Hidden Layer 노드 계산의 입력값으로 보내는 신경망입니다. 이처럼, 결괏값이 다음 Hidden Layer 노드의..