본문 바로가기
  • ㄹㅇ
패스트캠퍼스

[패스트캠퍼스] 데이터 분석 부트캠프 13기 - Tableau (1)

by 한강석 2024. 5. 10.
저번주부터 태블로 강의를 시작했다. 태블로는 데이터를 시각화하기 위한 도구 중 하나인데 직관적인 조작법으로 쉽게 익힐 수 있는 듯했다. 근데 이번주 예비군 동원훈련 갔다와서 화수목 3일 동안 강의를 못 들었다. 

 

 

이중축

한 대시보드에 여러가지 그래프를 넣을 수 있다. 예를 들어 평균 할인율과 평균 마진율을 함께 보고싶다면, 각각을 드래그해 표시한 뒤 이중축으로 설정해주면 된다. 이 때 축 동기화를 해주면 두 축이 같은 레벨로 표시되고 하지 않으면 각각 따로 표시된다. 그래서 두 범주가 크게 다르다면 동기화를 하지 않고 둘 다 퍼센트 같이 레벨이 같으면 함께 동기화해서 표시하는 것이 좋다. 

 

또 다른 방법으로는 하나를 표시해 놓고 다른 하나를 축 위로 끌어주면 두 그래프가 함께 표시된다. 근데 이 때에는 축이 하나이기 때문에 두 개의 범주가 크게 다르다면 시각적으로 좋은 방법은 아니다. 하나의 그래프가 완전히 바닥에 깔려 안 보이기 때문이다. 

 

그래서 이럴 때에는 각각을 넣고 이중축을 설정해 주면 된다. 

 

그리고 두 그래프를 함께 그린 다음 이중축으로 다른 내용까지 넣어줄 수 있는데 이러면 총 3개의 그래프가 표시되게 된다. 이 때에도 이중축 동기화를 해주지 않는 것이 좋다. 

 

 

예측

태블로는 주로 가지고 있는 데이터를 어떻게 효율적으로 보여주는 지에 초점을 맞추고 있는데 알고리즘을 이용한 예측이 몇 가지 가능하다. 그 중 하나가 예측이라는 기능이다. 시계열 데이터에서 예측을 사용하면 현재 가지고 있는 데이터로 앞으로의 추세선을 그려 예측해준다.

 

이 때에 주의해야 할 점은 만약 데이터가 2012년 12월까지 있다고 치면, 예측을 할 때 2012년도 예측값으로 표시하게 된다는 것이다. 왜냐하면 태블로에서 2013년의 데이터가 없으면, 즉 년도가 바뀌기 전까지는 계속 데이터를 수집 중이라고 판단하기 때문에 2012년의 데이터를 가지고 다시 2012년도 예측하여 표시하게 된다. 그러므로 이를 유의해야 한다. 

 

인구 데이터로 예측한 앞으로의 노인, 유아 비율

 

 

파이썬이나 SQL과는 다르게 태블로는 딱히 설명할 것이 많지 않은 것 같다. 아무래도 시각화에 초점을 맞춘 것이다 보니 어떻게 효율적으로 보여줄 수 있을까가 중요한 것 같다.