본문 바로가기
SportsViz

2020 프로야구 팀별 타자 성적 - 삼성 라이온즈

by 강쌤 의 ViziBiziBusy 2020. 5. 18.

2020 프로야구 팀별 타자 성적 - 삼성 라이온즈

 

안녕하세요 강쌤입니다.

 

늘은 Sports Viz 중에서

특정 팀의 타자들의 성적을 만든 대시보드입니다. 

 

데이터는 일간 단위로 수집했고,

이를 Tableau Prep Builder란 프로그램에서

Union 및 Pivot을 적용해 데이터를 처리했습니다. 

그리고 Extract한 다음 Tableau Desktop에서 계산식을 써서 구현했습니다. 

 

삼성 라이온즈 타자 시즌 성적 보러 가기 >> 

https://public.tableau.com/profile/seungilkang#!/vizhome/2020__15898026679620/2020_1

 

Tableau Public

 

public.tableau.com

시즌 (5/5~17) 동안 규정 타석을 기록한 삼성 라이온즈 선수를 AVG(타율) 기준으로 내림차순 정렬한 테이블

 

야구 데이터는 항목들이 많고, 특히 연관된 데이터들이 많이 있습니다. 

여기에서는 TPA(전체 타석수)와 AB(타수)가 따로 있지만 TPA는 있고, AB가 없다면

전체 타석수에서 BB(볼넷), HBP(몸에 맞는 공), Sacrifice Fly & Bunt (희생타) 등은 빼야합니다. 

또한 일반적으로 표시하는 단위도 달라서

Tableau Prep Builder에서 데이터를 전처리를 할 때 Pivot을 일단 적용했지만

Pivoting한 값을 그대로 활용하기에는 모든 항목들의 단위를 동일하게 표시해야하는 불편함이 있기 때문에

별도로 각 항목별로 계산식을 하나씩 만들었습니다. 

 

5월 17일 경기 타자들을 안타수 기준으로 내림차순 정렬

 

그렇다면 데이터 전처리시에 Pivot한 이유가 뭘까요?

바로 parameter로 정렬 기준을 AVG(타율) 기반으로 할지, H(안타) 기준으로 할 것인지 등을 적용하기 위함입니다. 

또한 계산식으로 H(안타), AVG(타율), RBI(타점)등을 계산식으로 별도로 만든 이유는

안타, 타점 등은 정수 형태로 표현하면 되지만, AVG(타율) 같은 경우에는

기본적으로 숫자를 소수점 세 자리(할/푼/리)로 표현하는 것이 일반적이기 때문에 하나씩 별도로 계산식을 만들었습니다.

Tableau Prep Builder로 데이터 연결 및 전처리 과정

 

야구는 갈수록 통계가 반영되고, 세세한 기록 데이터로 승부가 되고

이를 합산해 성과 측정 및 연봉 등에 반영되기 때문에 갈수록 세부적으로 관리되고 있습니다. 

 

오늘 소개한 데이터는 올드 스쿨 방식의 데이터이기 때문에

추후에는 좀더 깊이 있는 데이터를 다루도록 해보겠습니다. 

 

오늘도 강쌤의 Vizi였습니다. 

 

(데이터 출처 - 스탯티즈 2020.05.05~05.17)

(데이터 전처리 - Tableau Prep Builder)

(화면 개발 - Tableau Desktop)

댓글