- Today
- Total
목록View All (350)
DATA101

⁉️ 에러 상황 아래와 같이 데이터프레임에서 2가지 조건을 만족하는 데이터를 필터링했더니 코드는 잘 돌아가는데 에러 메시지가 출력되었습니다. 2018

변경 전 파이썬 pandas 패키지로 엑셀 파일을 불러오면 아래와 같이 파일에는 없던 칼럼이 자동으로 추가되는 것을 볼 수 있습니다. 일단 데이터를 불러온 후에 해당 칼럼을 삭제하는 방법도 있지만, 번거로운 작업을 2번에 할 필요는 없겠죠. 그래서 이번 포스팅에서는 데이터를 불러올 때부터 해당 칼럼이 자동으로 생성되는 것을 방지하는 방법에 대해 알아봅니다. 변경 후 "Unnamed: 0" 칼럼 없이 파일을 불러오는 방법은 간단합니다. read 메소드 실행 시 index_col 옵션 값을 0으로 설정하는 것입니다. dataset = pd.read_csv("데이터셋 경로", index_col = 0) dataset.head() 위와 같이 옵션을 설정하면 이제 해당 칼럼("Unnamed: 0") 없이 데이터가..

변경 방법 변경하고자 하는 칼럼들의 순서대로 아래와 같이 나열하여 작성해 주면 됩니다. 데이터프레임 = 데이터프레임[['칼럼1', '칼럼2', ...]] 변경 전 아래 예시 데이터셋에서는 appName, review_raw, date_full, date_year 칼럼 순서입니다. dataset.head() 만약 date_full, date_year 칼럼을 review_raw 앞으로 이동하고 싶다면 어떻게 하면 될까요? 변경 후 date_full, date_year 칼럼을 review_raw 칼럼보다 앞서 입력하였습니다. dataset = dataset[['appName', 'date_full', 'date_year', 'review_raw']] dataset.head() 위와 같이 정상적으로 칼럼 순서가..

🔥 목표 오늘은 파이썬 map 함수와 lambda 함수를 활용하여 데이터를 핸들링하는 방법과 이점에 대해 알아봅니다. 👨💻 문제 상황 예시 데이터프레임 내 특정 칼럼의 데이터를 활용하여 어떠한 연산을 거쳐 새로운 값들로 이루어진 칼럼을 새롭게 생성하고 싶다면 어떻게 해야 할까요? 구체적인 예시와 함께 알아보겠습니다. 아래와 같이 dataset이라는 데이터프레임에 yyyymmdd 형식의 date 정보가 담긴 date_full 칼럼이 있다고 가정해 보겠습니다. 만약, 아래와 같이 연도 정보만 추출하여 date_year라는 칼럼에 새롭게 저장하고 싶다면 어떻게 코드를 작성해야 할까요? 💡 해결방법 1: 반복문 활용(Bad Case ❌) 반복문을 활용하여 date_full 칼럼 내 데이터를 한 개씩 접근하여 ..

본 포스팅에서는 venv를 활용하여 Python 가상환경 내 패키지 설치 및 관리 방법을 알아봅니다.📚 목차1. 가상환경 필요성2. venv 활성화3. 패키지 설치4. 설치된 패키지 리스트 저장5. 패키지 일괄 설치1. 가상환경 필요성가상 환경은 프로젝트마다 격리된 환경(즉, 가상 환경)을 생성함으로써 프로젝트별로 패키지를 관리하기 위함입니다.파이썬을 입문하기로 마음 먹으셨다면 지금부터라도 가상 환경 사용을 권장해 드립니다.가상 환경의 필요성에 대한 상세한 설명은 이 포스팅을 참고해 주세요.2. venv 활성화먼저 생성해 두었던 venv를 활성화해야 합니다.venv 가상환경 생성 및 활성화 방법은 이곳을 참고해 주세요.참고로, Python 3.5 이후부터는 venv가 파이썬 표준 라이브러리..

본 포스팅에서는 venv를 활용하여 Python 가상환경을 생성하는 방법부터 활성화/비활성화, 삭제하는 방법까지 알아봅니다.📚 목차1. 가상환경 필요성2. 가상환경 생성3. 가상환경 활성화4. 가상환경 비활성화5. 가상환경 삭제1. 가상환경 필요성가상 환경은 프로젝트마다 격리된 환경(즉, 가상 환경)을 생성함으로써 프로젝트별로 패키지를 관리하기 위함입니다.파이썬을 입문하기로 마음 먹으셨다면 지금부터라도 가상 환경 사용을 권장해 드립니다.가상 환경의 필요성에 대한 상세한 설명은 이 포스팅을 참고해 주세요.2. 가상환경 생성참고로, Python 3.5 이후부터는 venv가 파이썬 표준 라이브러리에 내장되어 있기 때문에 따로 설치할 필요가 없습니다.Terminal 혹은 cmd 창을 여셔서 가상 ..

프로그래밍 시 변수명, 함수명 등의 관습(convention) 표기법 3가지에 대해 알아봅니다. 스네이크 표기법(snake_case) 단어 사이에 underscore(_)를 활용하는 표기법 Python에서 주로 사용 변수명, 함수명, 데이터 타입 등에 활용 예시) user_name, retention_score 카멜 표기법(camelCase) 소문자로 시작하고 이어지는 단어들의 시작은 대문자로 작성하여 단어 간 구분에 용이한 표기법 '단봉낙타 표기법'이라고도 불림 대문자와 소문자의 조합이 낙타의 혹처럼 솟았다가 내려갔다가 하는 모양 같다해서 붙여진 표기법 Java 언어에서 주로 사용 예시) getUserName, findByUserName 파스칼 표기법(PascalCase) 단어의 첫 시작은 항상 대문자..

안녕하세요!오늘은 파이썬(주피터 노트북)을 기반으로 직접 코딩한 구글 플레이 스토어 웹 크롤러 코드를 공유합니다.📝 목차1. 업데이트 Log2. 주요 기능3. 전체 코드4. 필수 초기 세팅5. 코드 및 설명1. 업데이트 Log📌 Last Updated @2024-11-05업데이트 일자 기준으로 구글 플레이 스토어 App 리뷰 데이터 수집 최신 Python 코드는 추가 업데이트되지 않을 예정이며,앞으로는 아래의 DATA101 서비스를 통해 코드 한 줄 없이 App 리뷰 데이터를 수집해 보세요 :) Last Updated @2022-08-24더보기미국 구글 플레이 스토어 크롤러 추가: Github 내 dev_us 브랜치 참고Last Updated @2022-08-21더보기@K1ddong 님께서..