반응형

판다스 5

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 5) 그래프로 시각화, folium

1. 그래프로 시각화하기 1-1. seaborn의 countplot 1-2. 기본 scatter plot을 matplotlib으로 그리기 1-3. hue를 활용하여 '상권업종중분류' 별로 다른 색상을 적용하여 그리기 1-4. hue를 활용하여 구별로 다른 색상을 적용하여 그리기 1-5. hue를 활용하여 시도별로 다른 색상을 적용하여 그리기 2. folium으로 위경도와 주소 데이터를 지도에 표현하기 1. 그래프로 시각화하기 1-1. seaborn의 countplot plt.figure(figsize=(15, 4)) sns.countplot(data=df_seoul, x="시군구명") 1-2. 기본 scatter plot을 matplotlib으로 그리기 df_seoul[["경도", "위도", "시군구명"..

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 4) 데이터 색인, 텍스트 데이터 전처리

1. 데이터 색인하기 1-1. '==' 활용하기 1-2. 2개의 조건 사용하기 : loc 1-3. 연산자를 활용하여 조건 정하기 : &, |, shape 2. 텍스트 데이터 전처리하기 2-1. 텍스트 데이터 색인하기 : str.contains('문구') 2-2. 데이터 제거하기, 리스트 형태로 변형하기 : tolist() 1. 데이터 색인하기 1-1. '==' 활용하기 : copy() df_medical = df[df["상권업종중분류명"] == "약국/한약방"].copy() 만약 특정 값을 바꿀 때, copy를 하지 않고 바꾸면 원본 df값도 같이 바뀌기 때문에 copy를 해 df_medical이라는 변수에 넣는다. 1-2. 2개의 조건 사용하기 : loc df[df["상권업종대분류명"] == "의료"]..

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 3) 수치, 문자열 데이터 요약하기

1. 수치데이터 요약하기 1-1. 데이터의 기초 통계값 알아보기 1-2. 2개 이상의 column 요약하기 1-3. 특정 데이터만 요약하기 2. 문자열 데이터 요약하기 2-1. 중복 제거한 값 보기 2-2. 그룹화된 요약값 보기 1. 수치 데이터 요약하기 1-1. 데이터의 기초 통계값 알아보기 1) 평균값 (mean) df["위도"].mean() 2) 중앙값 (median) df["위도"].median() 3) 최댓값 (max) df["위도"].max() 4) 최소값 (min) df["위도"].min() 5) 개수 (count) df["위도"].count() 6) 요약값 확인 (describe) df["위도"].describe() 결과가 한 번에 나온다. - 25%는 앞에서 1/4 되는 값, 1 사분위수..

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 1) 공공데이터 로드 및 데이터 미리보기

안녕하세요, 빵감자입니다 :) 2주 차 강의는 '서울 종합병원 분포 확인하기'입니다. 본격적으로 데이터를 내려받아 분석하는 과정을 배우기 시작합니다. + 강의를 들으며 모든 내용을 블로그에 기재하지는 않고, 보충이 필요하다고 생각하는 부분만 정리하려고 합니다. 1. 공공데이터 로드하기 폰트가 선명하게 보이게 하기 위해 'retina'로 설정한다. + 내 컴퓨터에서는 오류남 파일 경로와 파일명을 입력해 불러온다. df.shape을 했을 때 나오는 결과는 (행, 열) 순으로 출력된다. 2. 데이터 미리 보기 2-1. head() head()는 기본적으로는 맨 앞에 있는 데이터 5개 행을 불러온다. 그리고 괄호 안에 넣은 숫자만큼의 행을 불러올 수 있다. 2-2. shift + tab shift + tab을 ..

[코칭스터디 13기] Data Science 2023 : 1주차 - 2) 데이터 분석 준비하기

안녕하세요, 빵감자입니다 :) 1주 차 두 번째 강의는 '데이터 분석 준비하기' 강의입니다. 이번 강의에서는 - 데이터 분석을 위한 파이썬 속성 코스 - 판다스 치트시트를 활용한 기초 익히기 - 파일 경로 설정 방법 이렇게 3가지를 학습합니다. + 강의를 들으며 모든 내용을 블로그에 기재하지는 않고, 보충이 필요하다고 생각하는 부분만 정리하려고 합니다. 1. Python 기초 문법 # 1) 리스트 만들기 alp = [] alp.append('a') alp.append('b') alp.append('c') alp # 결과 ['a', 'b', 'c'] # 2) emerate를 사용해 인덱스 번호와 원소를 같이 가져오기 for i, val in enumerate(alp): print(i, val) # 결과 0..

반응형