공공 데이터는 이전보다 구하기 쉬워졌습니다.
여전히 공급자 기준으로 데이터를 제공하는 경우가 있어서 활용하는 입장에서는 불편한 경우도 간혹 있지만, 확실히 이전보다 신뢰성 높은 다양한 데이터를 쉽게 구할 수 있는 점은 긍정적입니다.
이번 시각화는 통계청에서 운영하는 국가통계포털(KOSIS)의 쇼핑 데이터를 활용했습니다.
데이터 시각화 순서는 다음과 같습니다.
1. 국가통계포털에서 검색창에 ‘온라인 쇼핑몰 판매매체별 거래액 상품군별 거래액’을 입력합니다.
2. 검색 결과 중 2017~2021로 표시되는 링크를 클릭하면 요약 정보를 볼 수 있는 팝업이 노출되는데, 이 때 시점을 2017년 1월부터 현재 최신 데이터까지 설정 후 ‘통계표 조회’ 버튼을 선택합니다.
3. 조회한 기간의 거래액 데이터를 시각적으로 활용하기 위해 데이터를 다운로드 받습니다. 이 때 Excel 파일로 다운로드 받고자 하는 경우 가급적이면 ‘셀 병합’은 체크해제 하시기 바랍니다. 이유는 셀 병합은 사람 눈에 익숙한 방식으로 여러 항목을 입력하는 것이 비효율적이기 때문에 셀 병합을 하지만, 데이터 분석 과정에서는 셀 병합은 항목 (또는 변수)에 값을 누락시켜, 데이터의 신뢰성을 방해하는 요소일 수 있습니다.
4. Excel과 같은 스프레드 시트 유형의 데이터 원본은 사람의 눈에 익숙한 방식으로 각 월별로 데이터가 열 방향으로 길게 표시가 됩니다. 이 경우에는 매달 데이터가 쌓이면 새로운 열(칼럼)이 생성이 되므로 데이터를 관리하는 측면에서나 분석하는 과정에서도 비효율적일 수밖에 없습니다. 따라서 열 방향으로 쌓이는 데이터를 행 방향으로 보내서 관리하고자 하는 칼럼 (변수 또는 필드)의 수를 줄이는 과정이 필요합니다. 흔히 열 방향의 데이터를 행 방향으로 변환 시키는 과정을 피벗(Pivot)이라고 합니다.
5. 여기에서는 비교 형식의 데이터 시각화를 합니다. 비교 방식의 시각화는 동종 업계 내 경쟁사 (또는 브랜드, 제품 등) 비교를 하거나, 특정 이벤트를 기점으로 그 이전과 이후를 비교할 때 유용한 방식입니다.
여기에서 활용한 데이터 원본의 기간은 2017년 1월부터 2021년 7월까지이며, 2021년 6월과 7월은 추정치입니다. 또한 총 23개의 상품군이 있으나, 여기에서는 비교하고자 하는 상품군에만 집중할 수 있도록 두 가지 상품군만 따로 색상을 진하게 강조하고 나머지 21개 상품군은 흐릿하게 설정합니다.
그리고 비교를 위해 A 상품군은 파란색, B는 빨간색, 나머지 기타 상품군들은 회색으로 설정합니다.
6. 위 이미지에서 A는 음식 서비스로 2021년 7월 기준 추정 거래액은 2조 3천 7백 8십억원입니다. B는 여행 및 교통 서비스로 8천 2백 2십억원입니다. 이 둘을 비교했을 때 빨간색 부분인 여행 및 교통 서비스는 줄곧 1,2위를 다투던 섹터였으나, 2020년 초 발생한 코로나 팬데믹으로 인해 2020년 2월을 기점으로 이 둘의 거래액이 역전이 되면서 음식 서비스는 가파르게 상승하는 반면, 여행 및 교통 서비스는 팬데믹 이전으로 회복 되지 않는 것을 보여줍니다.
7. 상단에 있는 상품군 매개 변수는 변경이 가능합니다. 이번에는 A는 ‘가전,전자,통신기기’를 선택하고, B는 ‘화장품’을 선택하면 이 역시 코로나 팬데믹 이전에는 둘의 거래액 차이는 없었으나, 팬데믹 이후로는 추세가 다른 것을 쉽게 확인할 수 있습니다. 아무래도 재택 근무 및 온라인 수업으로 인해 IT 장비를 구매하는 것은 계속 증가하는 반면, 외출의 필수 요소인 화장품은 2020년 2월 이후로 정체 및 하락 추세인 것을 알 수 있습니다.
아무래도 마스크를 벗게 되는 날이 오면 저 둘의 추세는 지금과는 다른 모습일 것 같습니다.
여러분들이 관심 있는 데이터로 시각화를 해봅시다. 그리고 시간이 지난 다음 새로운 데이터로 갱신하고 이전과 달라진 패턴이 있는지 살펴보는 것도 데이터 시각화하는 재미 요소 중 하나입니다.
아래 페이지에서 직접 코로나 팬데믹 전후 온라인 쇼핑몰 거래액을 비교 해보실 수 있습니다.
https://public.tableau.com/app/profile/seungilkang/viz/36252/sheet0
'DataViz' 카테고리의 다른 글
데이터 시각화 컨설턴트에 대한 질문 7가지 (2) | 2022.08.09 |
---|---|
[나이키 데이터] 나이키 주식 데이터 수집 및 시각화 (0) | 2021.11.30 |
AWS + Tableau 웨비나 중급 실습 영상 공유 드립니다. (0) | 2021.05.27 |
[나이키 데이터] 데이터 시각화, 어렵나요? (0) | 2021.05.09 |
[주식 데이터] 네이버와 카카오 주식은 최근 1년 사이 얼마나 올랐나? (0) | 2021.04.10 |
댓글