이전에 학교 수업을 통해서 Tableau라는 데이터 시각화 툴을 처음 접하게 됐다
원리를 듣기는 했으나,, 여러 명이 같이 수강하는 수업이다 보니 이해하기는 커녕 빨리빨리 작업을 따라가는 것에만 치중해서
정작 내가 원하는 데이터를 끌어와서 시각화하는 것에는 지식의 한계가 있었다
그래서 몇 년간 손 놓고 있다가 다시 흥미가 생긴 툴
쓸 줄은 아나, 제대로 쓸 줄 모르기에
이번에 인프런 "웰컴 투 태블로 월드" 강의를 접하게 되고 "제대로" 익혀보려한다
기초를 할 줄 알았으나,, drill down 할수록 더 재미진 툴
본 게시물은 tableau 데이터 연결 창에서 기본으로 제공하는 sample - Superstore 데이터를 활용했습니다!
기본적인 Bar chart를 그리기 전에 ..
데이터를 보면 파란색으로 표시된 '차원'과 초록색으로 표시된 '측정값' 데이터를 나누어 볼 수 있습니다.
측정값은 숫자로 된 데이터, 차원은 범주형 데이터라고 생각하면 쉽겠는데요,
'측정값을 어떤 차원의 시선으로 바라보냐' 라고 생각하면 보다 데이터 가공에 도움이 될 것같습니다.
ex) Sales를 region별로 나누어 바라보겠다 !
그렇다면 기본적인 Bar chart를 그려봅시다
※ 측정값은 기본적으로 합계로 나타나게 됨 ( 태블로 기본 설정 )
해당 차트의 경우 4년치 매출의 합계를 region별로 나누어 보겠다고 할 수 있겠습니다.
해당 차트에서 추가로 작업한 부분은
1) 불필요한 필드 레이블 숨기기
2) 축 머리글 해제 후 레이블 붙히기
3) 배경에 불필요한 참조선 없애기
4) 0이 되는 기준선 표시하기
( 특별한 경우가 아니고서는, 0이 되는 선이 없는 경우 바 차트가 허공에 둥둥 떠다니는 것처럼 보일 수 있음 )
5) 색상변경
( 짙은 색상 or 불투명도를 조절해야 보기 편함 )
시트 배경 편집 & 0 기준선 설정
이 작업들 중에서 그나마 까다롭다고 생각되었던 시트배경 편집 및 0 기준선 설정에 대해 다뤄보겠습니다.
시트에 커서를 대고 우클릭후 서식으로 들어가면 화면 좌측에
다음과 같은 창이 생성되는 것을 확인할 수 있습니다.
( 기본 설정이 되게 미세하게 나타나있어서 보다 차이를 강조하기 위해 색상을 진하게 설정하였습니다! )
행 카테고리에서 격자선, 축 눈금자를 '없음'으로 바꾸어주고,
영(0)기준선을 보다 선명하게 변경해주었습니다.
영(0)기준선을 강조해주는 이유는 기준선이 없을 경우 차트가 둥둥 떠다니는 느낌을 없애기 위해서
특별한 경우가 아니고서는 해주는 것이 좋다고 합니다.
사실 기본 설정도 크게 거슬리지는 않지만, 원래 완벽한 디자인은 디테일이 아닐까요 ..
각 막대별로 색상을 다르게 지정하는 방법?
데이터 시각화를 하는 경우 특정 막대의 색상을 다르게 지정하여 강조해야하는 경우,
카테고리 별로 색상을 다르게 지정해야 하는 경우가 존재합니다.
category 차원을 기준으로 sales의 합계를 분류한 막대 그래프입니다.
category를 마크의 색상에 drop하게 되면, category별로 다르게 색상이 부여되는 것을 볼 수 있습니다.
여기서 Technoloy만 색상을 다르게 하여 강조하고 싶다면
우측 상단에 범례를 더블클릭하여 막대별로 원하는 색상을 지정해줄 수 있습니다.
막대가 너무 많아 지저분해 보인다 ,, 비슷한 항목의 막대끼리 합치기
이해의 편의를 위해 막대의 개수가 이미 적지만,
그룹화를 통해 2개의 막대를 하나의 막대로 합치는 법에 대해 작성해보겠습니다.
저는 category별 sales 합계에서 office supplies와 technology를 합쳐 하나의 막대로 표현했는데요
우선 해당 작업을 위해서 병합하길 원하는 막대를 ctrl 키를 눌러 선택해줍니다.
이후 커서를 막대에 두면 새로운 창이 뜨는데, 해당 창에서 클립모양을 클릭해줍니다.
그러면 두개의 항목이 그룹화된 새로운 차원이 생성되는데요.
열에 들어가있던 category를 드랍해주고 새로 생성된 category(그룹)을 열에 넣어주면
위 그림처럼 두 항목을 합친 새로운 막대를 표현할 수 있게 됩니다!
예시로는 서울, 경기도 데이터가 따로 있을 때 => 수도권으로 합쳐줄 수 있겠네요!
레이블 화폐단위로 표현하기
숫자 형식으로 된 레이블 중 원화로 표시하고 싶은 경우 변경방법에 대해 알아보도록 하겠습니다.
방법은 총 두 가지로 들 수 있는데요.
1) 해당 시트에서만 적용하기
행으로 들어가있는 sales의 우클릭을 통해 속성으로 들어갑니다.
좌측에 아래와 같은 창이 생성되며 배율의 숫자를 통해 원화로 형식을 변경해줍니다.
2) 해당 데이터를 활용하는 모든 곳에 적용하기
위의 예시는 작업하는 해당 시트에서만 원화로 표시되도록 설정하는 예시이고
속성이 아닌 좌측의 데이터 탭 sales의 '기본설정'에서 -> 숫자형식을 통해 원화로 형식을 변경하는 경우
적용하는 모든 시트에 형식이 변화됩니다.
※ 즉, 특정 데이터의 형식을 반복해서 사용할 필요가 있는 경우에는 아래와 같은 적용이 더욱 유용할 것 -!
상위 N개의 값만 표시하기
카테고리가 너무 많은 경우 항목의 상위 N값만 표시하기 위해서는 필터기능을 활용합니다.
사실 단순히 내림차순을 통해 상위 5개값만 남겨두고, 나머지는 지울 수 있지만
유동적인 데이터의 경우 값의 변동이 있을 때, 변동을 반영하지 못하기 때문에 필터 기능을 활용하는 것을 추천합니다.
본 예시는 product name별 sales를 알아보는 막대그래프를 활용하여 진행합니다.
좌측 필터에 product name을 drop하고 아래와 같이 상위 5개를 기준으로 설정해줍니다.
마지막으로, 레이블 위치를 막대 안 중앙 위쪽으로 지정하고 싶을 때?
강의에서 진행하는 것과 같이, 레이블 위치를 굳이굳이 중앙 위쪽으로 지정하고 싶은 경우도 실습을 진행해봅시다.
먼저, 기본적인 레이블의 위치를 조정하기 위해서는
마크의 레이블, 맞춤을 통해서 다양한 위치로 레이블을 설정할 수 있습니다.
하지만 !
위 그림처럼 막대그래프 안, 중앙 위쪽으로 레이블을 설정하기 위해서는 이중축 기능을 활용해주어야 합니다.
해당 그래프는 단순히 막대그래프가 아닌, 간트차트가 함께 섞여있는 그래프라고 할 수 있겠습니다.
우선 이중축을 나타내기 위해서, 행에 동일한 sales를 두개 얹어줍니다.
이후
위의 sales 마크는 '막대'로 ( 자동으로 지정된 것을 막대로 변경해주어야만 함 !! )
아래의 sales 마크는 '간트차트'로 모양을 변경해줍니다.
행에 있는 우측 sales를 클릭하여 '이중축'을 선택하면, 두개의 그래프가 합쳐지게 됩니다.
아래에 있던 그래프를 간트차트로 설정해주어 합친 이후에도 그냥 막대그래프처럼 보여지게 되네요!
이중축을 사용할 때 유의할 점은 좌우의 이중축 단위가 다를 수 있기 때문에
우측에 있는 축 -> 우클릭 -> 축 동기화를 통해 좌우 축단위를 맞춰주어야 합니다 !!
마지막으로 간트차트의 마크 레이블 하위 가운데 맞춤을 진행해주면 의도한 레이블의 위치를 도출할 수 있습니다!
사실 하나하나 기능을 뜯어보면 사소하고 자잘한 게 많다고 느껴질 수 있는데
데이터 시각화를 진행하다보면,, 이런 사소한 것들이 모여서 결과적으로 퀄리티를 높여주기 때문에
더더욱 사소한 것도 아는 것이 중요하다는 생각이 듭니다!
인프런 강의를 들으며 하나하나 기록하는 이유는 복습겸,
이런 자잘한 기능들이 실제 시각화를 진행할 데이터를 끌어오면
바로바로 응용이 안되는 경우가 많기에 참고용으로 --..
'Tableau' 카테고리의 다른 글
[Tableau] 필터기능 익히기 (0) | 2022.02.14 |
---|---|
[Tableau] 실무에서 많이 쓰이는 하이라이트 차트 그리기 (히트맵) (0) | 2022.02.12 |
[Tableau] 산점도 차트 그리기 (0) | 2022.02.12 |
[Tableau] 비율 차트의 모든 것 (0) | 2022.01.28 |
[Tableau] 라인 차트를 쓰는 경우와 영역 차트를 쓰는 경우 (0) | 2022.01.26 |