본문 바로가기
공부해요

[Data] Python_인구데이터 시각화 활용 1

by Broyles 2021. 1. 18.

 

여러 일들로 파이썬 공부를 조금 소홀히 하다가 최근 다시 공부를 시작했다.

 

오늘은 인구 공공데이터를 활용한 시각화에 대해 공부했다.

참고로 인구 공공데이터는 행정안전부 홈페이지의 통계 탭에서 다운 받을 수 있다.

 

행정안전부> 정책자료> 통계> 통계연보·주제별 통계

행정안전부 홈페이지에 오신것을 환영합니다.

mois.go.kr

 

오늘은 특정지역의 연령별 인구 구조를 시각화하는 연습을 했다.

 

 

먼저 데이터를 다운 받았으면 어떤 주제를 할지 설정하는 게 우선이다. 엑셀을 쭉 보면 1열은 지역, 2열과 3열은 총인구, 4열부터는 0세부터 100세까지 인구 수가 나누어져 있다.

 

나는 오늘 이 데이터를 통해 연령별 인구통계 시각화를 할 것이다.

 

 

어떤 지역을 해볼까 하다가 내가 다닌 대학교 근처를 해보기로 했다. 이곳의 경우 동이 두 개로 나누어져 있는데, 한 곳은 학교 근처고, 한 곳은 학교 살짝 옆동네이기 때문에 대학생 거주 인구의 차이가 있을 것 같다는 생각이 들어 비교해보고 싶었다.

 

일단 csv 모듈을 통해 파일을 읽어준다. 그 후 데이터를 일단 나열해본다. 끝까지 잘 나오는 것 같다.

맨 마지막 열은 100세 이상인데 꽤 많으셔서 놀랐다.. 건강하게 오래 사세요!!

 

이제 시각화를 위한 준비를 해야 한다. 그러기 위해서 가장 우선될 건 빈 리스트를 만들고 그 안에 다 넣어주는 것이다! 교재에는 한 지역으로 했는데 나는 두 지역을 비교하고 싶었기 때문에 리스틀 두 개 만들어서 각각 넣어주었다.

 

 

 

이제는 시각화 라이브러리인 matplotlib과 pyplot 모듈을 이용해 시각화로 만들어주기만 하면 된다!

일단 다양한 그래프가 있겠지만 나는 꺾은선 그래프를 이용했고, 색깔 구분과 범례를 추가해 구분을 해주었다. 그리고 기본적으로 파이썬은 영어 호환이기 때문에 한글 사용을 위해 plt.rc~ 부분을 추가해주었다.

 

이제 위에 구했던 코드 밑에다가 이걸 그대로 넣어주면..!

이렇게 나온다.

 

실제로 이문1동이 학교를 포함한 그 근처이고, 이문2동이 학교에서 좀 벗어난 지역이다. 그래서인지 이문1동에 20대 인구 비율이 압도적으로 높은 것을 확인할 수 있다. 원하는 결과를 얻어냈다.

 

 

풀코드!

 

 

다음엔 조금 더 다양한 그래프 형태와 주제를 활용하는 연습을 할 것이다.

 

 

 

댓글