반응형

코칭스터디 6

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 5) 그래프로 시각화, folium

1. 그래프로 시각화하기 1-1. seaborn의 countplot 1-2. 기본 scatter plot을 matplotlib으로 그리기 1-3. hue를 활용하여 '상권업종중분류' 별로 다른 색상을 적용하여 그리기 1-4. hue를 활용하여 구별로 다른 색상을 적용하여 그리기 1-5. hue를 활용하여 시도별로 다른 색상을 적용하여 그리기 2. folium으로 위경도와 주소 데이터를 지도에 표현하기 1. 그래프로 시각화하기 1-1. seaborn의 countplot plt.figure(figsize=(15, 4)) sns.countplot(data=df_seoul, x="시군구명") 1-2. 기본 scatter plot을 matplotlib으로 그리기 df_seoul[["경도", "위도", "시군구명"..

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 4) 데이터 색인, 텍스트 데이터 전처리

1. 데이터 색인하기 1-1. '==' 활용하기 1-2. 2개의 조건 사용하기 : loc 1-3. 연산자를 활용하여 조건 정하기 : &, |, shape 2. 텍스트 데이터 전처리하기 2-1. 텍스트 데이터 색인하기 : str.contains('문구') 2-2. 데이터 제거하기, 리스트 형태로 변형하기 : tolist() 1. 데이터 색인하기 1-1. '==' 활용하기 : copy() df_medical = df[df["상권업종중분류명"] == "약국/한약방"].copy() 만약 특정 값을 바꿀 때, copy를 하지 않고 바꾸면 원본 df값도 같이 바뀌기 때문에 copy를 해 df_medical이라는 변수에 넣는다. 1-2. 2개의 조건 사용하기 : loc df[df["상권업종대분류명"] == "의료"]..

[코칭스터디 13기] Data Science 2023 : 2주차 서울 종합병원 분포 확인하기 - 1) 공공데이터 로드 및 데이터 미리보기

안녕하세요, 빵감자입니다 :) 2주 차 강의는 '서울 종합병원 분포 확인하기'입니다. 본격적으로 데이터를 내려받아 분석하는 과정을 배우기 시작합니다. + 강의를 들으며 모든 내용을 블로그에 기재하지는 않고, 보충이 필요하다고 생각하는 부분만 정리하려고 합니다. 1. 공공데이터 로드하기 폰트가 선명하게 보이게 하기 위해 'retina'로 설정한다. + 내 컴퓨터에서는 오류남 파일 경로와 파일명을 입력해 불러온다. df.shape을 했을 때 나오는 결과는 (행, 열) 순으로 출력된다. 2. 데이터 미리 보기 2-1. head() head()는 기본적으로는 맨 앞에 있는 데이터 5개 행을 불러온다. 그리고 괄호 안에 넣은 숫자만큼의 행을 불러올 수 있다. 2-2. shift + tab shift + tab을 ..

[코칭스터디 13기] Data Science 2023 : 1주차 - 2) 데이터 분석 준비하기

안녕하세요, 빵감자입니다 :) 1주 차 두 번째 강의는 '데이터 분석 준비하기' 강의입니다. 이번 강의에서는 - 데이터 분석을 위한 파이썬 속성 코스 - 판다스 치트시트를 활용한 기초 익히기 - 파일 경로 설정 방법 이렇게 3가지를 학습합니다. + 강의를 들으며 모든 내용을 블로그에 기재하지는 않고, 보충이 필요하다고 생각하는 부분만 정리하려고 합니다. 1. Python 기초 문법 # 1) 리스트 만들기 alp = [] alp.append('a') alp.append('b') alp.append('c') alp # 결과 ['a', 'b', 'c'] # 2) emerate를 사용해 인덱스 번호와 원소를 같이 가져오기 for i, val in enumerate(alp): print(i, val) # 결과 0..

[코칭스터디 13기] Data Science 2023 : 1주차 - 1) 데이터 분석 환경 구성

안녕하세요, 빵감자입니다 :) 1주 차 첫 번째 강의는 '데이터 분석 환경 구성' 강의입니다. 이번 강의는 Anaconda와 Jupyter Notebook 사용법으로 구성되어 있었습니다. 아나콘다와 주피터 노트북은 이미 설치되어 있어서 기초부터 꼼꼼히 다시 점검한다는 생각으로 강의를 들었습니다. 1. Anaconda 가상 개발 환경 아나콘다 하나만 설치하면 Python을 비롯해 관련된 다양한 생태계를 설치할 수 있음 환경설정 과정이나 다양한 도구를 설치하느라 많은 시간을 허비하거나 버전이 맞지 않는 등의 문제로 부딪힐 때가 있는 데 아나콘다를 통해 편리함↑ 2. Jupyter Notebook 2-1. Jupyter Notebook과 Jupyter Lab 1) Jupyter Notebook 하나의 노트북이..

[코칭스터디 13기] Data Science 2023 : 시작!

안녕하세요, 빵감자입니다 :) 이번에 네이버 부스트코스에서 진행하는 코칭스터디 13기 Data Science 2023에 참여하게 되었습니다. 부스트코스는 단순히 이론과 지식만을 공부하는 게 아니라 매주 개별 퀴즈, 팀별 미션, 프로젝트 등의 과정까지 경험할 수 있습니다. 참여하게 된 계기는 비전공자인 제가 데이터 분석을 혼자 공부하려니 막히는 부분도 많고, 방향성에 대한 고민도 많았습니다. 그래서 함께 공부하거나 프로젝트를 진행할 팀원들이 있었으면 좋겠다는 생각을 항상 해왔습니다. 그러던 중, 네이버 부스트코스를 알게 되었고, 마침 Data Science 코칭스터디를 모집하고 있어 바로 지원 접수하였습니다. 그리고 좋은 기회로 '부스터'에 선정되어 스터디에 참여하게 되었습니다. 앞으로 4주간 온라인으로 ..

반응형