본문 바로가기

Data Scientist

태블로 (막대차트, 분산차트, 대시보드)

반응형

태블로가 동작하는 원리

1. 필드는 차원측정값으로 구분된다.

 - 차원: 측정값을 쪼개어 보는 관점

 - 측정값: 숫자 형태로 집계가 되는 데이터

2. 측정값은 집계(Aggregate)되어 표현된다.

 집계는 합계, 평균, 중앙값, 카운트, 카운트(고유), 최소값, 최대값, 백분위수, 표준편차, 분산을 의미한다. 

 

집계의 형태를 변경해주는 방법은 

1) 행 또는 열, 마크 선반에 놓여진 알약에서 마우스 오른쪽 버튼 클릭 후 측정값의 집계 형태를 변경
2) 측정값을 가져올 때부터 집계 형태를 변경
- Windows : 측정값에서 마우스 오른쪽 버튼을 누른 상태로 드래그
- Mac : Option키 누른 상태로 드래그

워크시트

3. 알약을 행 선반에 놓으면 Y축에 표현, 에 놓으면 X축에 표현된다. 

4. 마크 카드에 있는 마크의 형태, 색상, 크기, 레이블, 세부 정보, 도구 설명, (경로, 각도, 모양) 속성을 통해 원하는 형태로 다양한 시각화를 표현할 수 있다. 

5. 필요한 값은 필터 카드를 통해 필터링 할 수 있다.

6. 대시보드는 기존에 만들어 놓은 워크시트를 조합하여 만든다. 

 

원본 데이터 출처: Tableau(Slack)

위와 같이 측정값을 변경할 수 있으며, 우선 카테고리 별 평균 칼로리와 평균 카페인을 막대그래프로 나타내었다. 

행선반에 놓으면 Y축에 나타나고 열선반에 놓으면 X축에 나타나므로 열에 평균 칼로리와 평균 카페인을 드래그앤드랍.

행에는 카테고리를 드래그앤 드랍해준다. 

 

시각화를 위한 자세한 설정은 마크에서 변경 가능하다. 아래의 경우는 카페인에 빨간색으로 색상을 준 것이다. 

시각화를 위해 크기, 레이블, 세부정보, 도구설명 모두 사용 가능하다. 데이터를 분석하기 더 용이한 것을 사용하면 된다.


다음은 당분 함유량과 칼로리의 상관관계를 나타내기 위한 분산 차트를 사용하고 추세선을 그려준다. 분산차트의 경우 열과 행에 당류와 칼로리를 드래그앤 드랍해준다. 그리고 마크의 경우 자동이 아닌 '원'으로 바꿔준다.

추세선은 분산 차트를 그린 후 차트 위에서 우클릭 하면 추세선이 있다.

가로 세로의 평균 선을 나타내기 위해서는 해당하는 축을 누르고 우클릭을 해주면 참조선 추가가 있다.

여기에서 필요한 라인, 구간, 분포, 박스플롯을 추가할 수 있으며 범위 또한 변경 가능하다. 


시군구 별 스타벅스 매장 수를 파악해보자. 측정값 중 경도와 위도를 열과 행에 드래그앤 드랍해주고, 마크에 색과 크기로 숫자를 파악하기 쉽게 시각화를 한다. 마크에는 매장코드를 카운트하면 매장 수와 동일하므로 카운트(매장코드)로 설정한다. 


대시보드에는 앞서 워크시트에서 했던 내용들을 한번에 정리할 수 있다. 단순히 드래그앤 드랍으로 사용가능하다.

 

😁

출처: 태블로 Tableau

https://www.tableau.com/ko-kr/learn

 

학습

학습 방법 더 보기 강사가 진행하고 참석자 Q&A 시간이 있는 1시간 분량의 실시간 웹 세미나 주제를 선택할 수 있습니다. 자세한 내용 전 세계의 여러 도시에서 제공되는 오프라인 교육 과정을 통

www.tableau.com

 

반응형