6. 차트 종류별 그래프 그리기
6.13. 박스 그래프
박스 그래프(Box plot)는 통계 정보와 분포를 시각적으로 보여주는 시각화 차트입니다.
막대 그래프와 비슷하게 x축에는 대상을 두고 y축에
값을 두어 x축 대상 별로 y축 대표 값의 크기 차이를 보여줄
수 있습니다. 추가적으로 차트에는 데이터들의 분포를 표시해주고, 축에는
통계 값들을 표시할 수 있기 때문에 분포, 통계 정보들을 추가적으로 제공합니다.
박스 그래프의 모습
위 그림은 예시 데이터 테이블로
그린 박스 그래프 모습입니다. x축에는 Ticker, y축에는
EPS 값을 두었습니다. 차트에 표시되는 박스는 Q1(1분위수; 하위 25%)과
Q3(3분위수; 상위 25%)를
의미하고, 박스를 관통하는 세로 줄은 LAV(Lower
Adjacent Value)와 UAV(Upper Adjacent Value)를 의미합니다. 이처럼 막대와 세로줄은 컬럼의 값 분포를 보여줍니다. 또한 x축에는 통계 값들이 표로 표시되어 구체적인 숫자도 확인할 수 있습니다.
박스 그래프와 막대 그래프의
비교
박스 그래프는 기본적으로
막대 그래프와 유사합니다. 막대 그래프에서는 하나의 컬럼 데이터들을 하나의 대표 값 막대로 표시되었고, 박스 그래프에서는 하나의 컬럼 전체 데이터에 대한 분포 등을 보여 줍니다. 즉, 박스 그래프에서 표시하는 값들 중 하나만 막대 그래프에 표시됩니다. 위
그림에서 왼쪽 박스 그래프는 count, median, outliers, Q1, Q3, LAV, UAV 등을
표시 해주지만, 오른쪽 막대 그래프는 median 하나만
막대로 표시하고 있습니다.
l 6.13.1 박스 그래프의 모습
박스 그래프는 Q1, Q3, LAV, 그리고 UAV 이외에도 내부의 세부적인 분포를
시각적으로 표시할 수 있습니다. 물론 세부적인 분포를 보여준다고 해서 구체적인 분포를 알 수 있지 않지만, 직관적인 분포를 가늠할 수 있게 합니다. 이 설정은 차트 속성의
외관 탭 에서 설정할 수 있습니다. 분포 이외에도 다양한 모습 설정이 가능합니다. 박스 폭, 흐트러짐, 표시할
마커의 크기와 투명도 등을 지정할 수 있습니다. 추가적으로 데이터 들의 분포와 95% 신뢰구간, 비교 원과 상대치 등의 표시 여부를 설정할 수 있습니다.
박스 그래프에서의 외관 탭
설정
박스 그래프는 2가지 방법으로 통계 값들을 제공합니다. 하나는 시각적 모습으로 제공하고
다른 하나는 표로 제공합니다. 시각적 모습은 박스에 여러 통계 값들을 표시하여 차트의 모습을 직관적으로
이해하는데 도움을 줍니다. 또한 통계 값이 적힌 표를 제공하여 구체적인 통계 값을 알 수 있게 해줍니다. 물론 표시할 통계 값들은 설정에서 변경 가능합니다. 시각적인 값은
참조점 탭에서 설정할 수 있습니다. 시각적인 모습은 기호나 선으로 표시 할 수 있으며, 원하는 집계 함수에는 체크 표시 후 원하는 모습을 설정할 수 있습니다. 표로
표시하는 것은 통계 테이블 탭에서 설정할 수 있습니다. 표시하고 싶은 집계 함수를 오른쪽으로 이동하면
박스 그래프 아래쪽 x축 쪽에 표시가 됩니다. 박스 그래프에서
기본적으로 표현해주는 통계 값은 count, median, outliers 입니다. 이 외에도 여러가지 통계 값을 선택할 수 있습니다.
참조점 탭의 설정과 이를
반영한 차트의 시각화 모습
통계 테이블 탭의 설정과
이를 반영한 차트의 표 모습
6.14. 표
표(Table)는 가장 널리 사용되는 시각화 차트의 한 종류입니다.
Spotfire에서 표는 컬럼은 차원을 나타내고 로우는 데이터를 나타냅니다. 따라서 Excel에서 사용하던 셀 기준이 아닌 컬럼과 로우 중심으로 생각하는 습관을 가져야 합니다. 한편, 표는 데이터 테이블이 가진 전체 컬럼과 전체 로우를 빠짐없이
보여줍니다. 때문에 보여주기 위한 용도 이외에도 데이터를 구체적으로 확인할 때 많이 활용 됩니다. 예를 들면, 사용자가 데이터를 불러오기가 정상적으로 작동했는지, 데이터 처리 후 의도대로 처리가 되었는지, 차트의 구체적인 수치를
확인하는 등의 다양한 이유로 사용됩니다. 예시 데이터 테이블을 나타낸 표는 아래 그림과 같은 모습입니다.
표의 모습
l 6.14.1. 표 서식
표를 시각적인 차트로 활용하기
위해서는 서식을 깔끔하게 정리할 필요가 있습니다. 표에서 컬럼 사이의 폭은 일괄적으로 기본값 100으로 설정되어 있습니다. 컬럼 폭은 표 위에서 우클릭 시에 나타나는
메뉴에서 컬럼 크기를 조정하여 맞춤으로 자동 조절할 수 있습니다.
표에서 컬럼 폭 자동 조절
컬럼 폭 이외에도 정렬 역시
표가 시각적으로 깔끔하게 보이는 것에 중요한 영향을 줍니다. 표에서는 컬럼 값이 숫자이면 오른쪽 정렬, 문자이면 왼쪽 정렬이 기본 값으로 설정되어 있습니다. 컬럼 이름
위에서 좌클릭 시에 나타나는 메뉴에서 컬럼 이름과 컬럼 값을 가운데 정렬 설정을 할 수 있습니다.
표에서 컬럼 이름 및 컬럼
값 가운데 정렬
이 밖에도 컬럼 이름 위에서
좌클릭 시 나타나는 메뉴에서 각종 서식 설정이 가능합니다. 가로 정렬,
세로 정렬, 글자 기울기, 글자 색, 바탕 색, 두껍게, 그리고
이텔릭체 설정 등이 가능합니다. 다른 것들은 적용하지 않아도 되지만,
표를 시각적으로 표시해야 될 때에는 위에서 다룬 컬럼 폭과 정렬은 설정하는 것이 좋습니다.
표에서의 세부 서식 설정
l 6.14.2. 컬럼 보이기/감추기/이동
표에서 모든 데이터를 보여
줄 필요는 없습니다. 특정한 컬럼은 보여주고 다른 컬럼은 감출 수도 있으며, 표에서 시각화 할 때 컬럼 간의 순서를 바꿀 수도 있습니다. 이는
설정에서 컬럼 탭에서 가능합니다.
위치: 차트 속성 - 컬럼 탭
표에서 컬럼 탭을 통한 컬럼
보이기와 감추기, 순서 변경
위 그림과 같이 컬럼 탭에서는
표에서 표시할 컬럼과 컬럼 간의 순서에 대한 설정이 가능합니다. 속성의 오른쪽 선택한 컬럼에 표시한
컬럼과 순서로 표에 표시 됩니다. 순서의 경우 표에서 컬럼 이름을 드래그 해서 순서를 변경할 수도 있습니다. 마지막으로 데이터 처리 과정에서 새로 컬럼이 생성되는 경우, 표에
새로 생긴 컬럼을 바로 포함되지 않습니다. 생성과 동시에 표에 반영하기 위해서는 컬럼 탭의 아래 부분
자동으로 새 컬럼 추가를 선택해야 합니다.
l 6.14.3. 데이터 선택/복사/수정
표에서는 원하는 데이터를
선택, 복사, 그리고 수정 등의 데이터 편집이 가능합니다. 먼저 데이터 선택하는 방법은 클릭이나 드래그를 통해 가능하며, 선택
시 로우 전체가 선택됩니다. 그리고 ctrl, shift 등과
조합하여 사용할 수도 있습니다. 각 의미는 다른 프로그램과 유사하게
ctrl + 선택은 선택한 로우를 추가, shift + 선택은 기존 선택된 로우에서부터
새로 선택한 로우까지 전체 선택이라는 의미입니다. 복사의 경우 복사를 원하는 로우 선택 후 ctrl + c 를 할 수 있으며, 이 경우 로우 전체가 복사됩니다. 또는 선택한 데이터에서 우클릭하여 복사(Copy) 또는 셀 복사(Copy cell)를 선택하면 됩니다. 복사의 경우 로우 전체가 복사, 셀 복사의 경우 선택한 셀의 내용만 복사 됩니다.
표에서의 데이터 선택과 복사
표에서는 데이터의 수정도
가능합니다. 대부분 다른 차트들에서는 시각화 모습만 바뀔 뿐, 데이터
테이블의 데이터 값이 실제로 바뀌지 않습니다. 하지만 표 상태에서는 실제 데이터 편집들이 제한되긴 하지만
가능합니다. 아래 그림과 같이 표에서 바꾸기를 원하는 데이터 선택 후 우클릭 시 값 바꾸기(Replace value) 또는 데이터 더블 클릭을 통해 데이터 변경으로 접근이 가능합니다. 데이터를 바꾸는 것은 컬럼 내의 동일한 값을 모두 변경하거나 해당 값만을 바꿀 수 있습니다. 데이터 테이블의 중요 컬럼(Key column)이 지정되지 않은
경우에는 아래 그림의 오른쪽처럼 해당 값만을 바꾸는 기능이 불활성화 되어 있습니다. 데이터 테이블에서
데이터 로드 시 값을 받아오는 기준인 키 컬럼을 등록하면 사용할 수 있습니다.
표에서의 데이터 수정
6.15. 크로스 테이블
크로스 테이블(Cross table)은 컬럼과 로우로 구성된 양방향 표입니다. 피벗
테이블(Pivot table) 또는 다차원 테이블이라 부르기도 합니다.
크로스 테이블은 매우 활용도가 큰 시각화 표 중에 하나 입니다. 크로스 테이블은 표를 내가
원하는 형태로 바꿔 표현할 수 있어서 자유도가 비교적 큽니다. 기본적으로는 표의 내용을 집계할 때 많이
사용되지만, 피벗 형태로 변환도 가능하기 때문에 데이터 테이블을 다른 형태로 변환한 시각화 표가 필요할
때는 대부분 크로스 테이블을 사용합니다.
크로스 테이블의 모습
위 그림은 예시 데이터 테이블을
이용해 크로스 테이블을 만든 모습입니다. 크로스 테이블에는 축에 대해
x축에 해당하는 가로(Horizontal), y축에 해당하는 세로(Vertical), 그리고 셀(Cell)이라고 따로 용어가 있습니다. 가로에는 Year를, 세로에는 Ticker를 설정하였고, 각 셀에는 EPS 평균 값을 표시하고 있습니다.
l 6.15.1. 크로스 테이블의 각 요소
크로스 테이블의 구조는 크게
가로, 세로, 그리고 셀로 구성됩니다. 각 요소는 차트에서 컬럼을 넣어줄 수도 있지만 차트 속성의 축 탭에서 컬럼을 넣어 줄 수도 있습니다.
위치: 차트 속성 - 축 탭
크로스 테이블의 생성 방법
데이터 테이블 모습에서 크로스
테이블로 변환하는 과정은 다음과 같은 순서로 진행됩니다. 가로로 설정한 컬럼으로, 컬럼의 데이터 값들을 컬럼 이름으로 하는 컬럼이 생성됩니다. 그래서
가로를 Year로 설정하여 Year의 값인 2015Y, 2016Y, 2017Y, 2018Y, 2019Y, 그리고 2020Y
를 컬럼 이름으로 하는 컬럼이 생성 되었습니다. 로우 방향으로도 세로로 설정한 컬럼으로, 컬럼의 데이터 값들을 로우로 하는 로우가 생성됩니다. 그래서 세로를
Ticker로 설정하여 각 로우가 A, B, C, D, E, 그리고
F가 로우로 생겼습니다. 셀 값으로는 가로와 세로의 조건에
해당하는 EPS 값에 집계 함수가 적용되어 들어갑니다. 이러한
변환을 피벗이라고 하고 생성된 표는 피벗 테이블이라고 합니다. 따라서 크로스 테이블과 피벗 테이블은
동일한 변환입니다. 또한 다른 측면에서 생각해보면, 우리는 Spotfire에서 사용하는 데이터 형식에서, Excel에서 사용하는
데이터 형식으로 바꾸었습니다. 즉, 동일한 내용의 데이터를
표현 형태만 바꾼 변환이라는 점을 다시 상기할 수 있습니다.
l 6.15.2. 합계
크로스 테이블에서의 총합계와
부분합
크로스 테이블에서는 합계를
사용할 수 있습니다. 총합계는 전체 합으로 세로 줄로 모두 합하는 로우 방향 총합계와, 가로 줄로 모두 합하는 컬럼 방향 총합계가 있습니다. 그리고 총합계
이외에도 부분합을 구할 수도 있습니다. 부분합이 적용되는 컬럼은 여러 개의 로우 설정 시 앞서 설정한
차원 단위로 부분합이 묶이게 됩니다.
6.16. 그래픽 테이블
그래픽 테이블(Graphical table)은 데이터 테이블에는 없는 값들을 표 내에 표시하게 해주는 테이블 형태입니다. 표에는 일반적으로 문자나 숫자 그리고 날짜 등과 같은 형식을 가지는 값들이 들어갑니다. 하지만 값 이외의 그래프나 그림, 아이콘, 동적인 값 등으로 간단히 표시하는 것이 더 효과적인 경우가 있습니다. 많이
활용하는 방법 중 하나는 시간에 따라 변화는 변수들을 빠르게 모니터링 할 때 사용합니다. 예를 들면
주식에서 기업들의 일봉을 빠르게 모니터링하는 경우, 구체적인 숫자보다 오르면 빨간색, 내리면 파란색으로 색깔로 구별하는 파악하거나, ↑, ↓과 같은 아이콘으로
표시할 수도 있습니다. 이런 경우 그래픽 테이블을 통해 테이블 내 그래프, 그림, 아이콘, 동적인
값 등으로 표시할 수 있습니다.
그래픽 테이블 모습
위 그림에서는 예시 데이터
테이블을 사용한 그래픽 테이블 입니다. 테이블이라는 이름처럼 표와 같은 형식을 가지지만, 그 내부에는 그래프나 그림 등이 표시 됩니다. 데이터는 Ticker에 따른 EPS 평균 값을 각 그래픽 형태로 표현하였습니다.
l 6.16.1. 그래픽 테이블 전체 모습 설정
그래픽 테이블에서 표시할
수 있는 그래픽 형태는 총 4가지로 스파크라인(Sparkline), 계산된
값(Calculated value), 아이콘(Icon), 그리고
불릿 그래프(Bullet graph) 입니다. 이 4가지 종류 그래픽들은 그래픽 테이블 이외에도 텍스트 영역(Text area)에서도
사용할 수 있습니다. 그래픽 테이블에 각 그래픽을 넣는 방법은 차트 속성에서 축 탭에서 원하는 그래픽
컬럼을 선택하면 됩니다.
위치: 차트 속성 - 축 탭
그래픽 테이블에 원하는 종류의
그래픽 컬럼 넣기
차트 속성의 축 탭에서는
가장 먼저 행에 넣을 컬럼을 선택해야 합니다. 선택하는 컬럼 단위로 행 정보가 표시됩니다. 이후 컬럼에 넣고 싶은 그래픽 컬럼을 추가 버튼을 통해 넣습니다. 그래픽
컬럼에 대한 세부적인 설정은 개별적인 설정 창이 나옵니다. 세부적인 그래픽 컬럼에 대한 설명은 뒤에서
다루겠습니다.
l 6.16.2. 스파크라인
스파크라인(Sparkline)은 선 그래프를 작고 간단하게 나타낸 선으로 정확한 값을 알기보다는 대략적인 추세를 살펴보는데
많이 사용합니다. 앞서 KPI 차트에서 주요 지수의 스파크라인을
표시해 본 적이 있습니다. 그때와 동일한 방법으로 설정이 가능합니다.
그래픽 컬럼의 스파크라인
세부 설정
축 탭에서 스파크라인에 사용되는 x축과 y축을 설정할 수 있습니다.
스파크라인은 간단하지만 전체적인 추세를 보여주기 때문에 추세가 명확한 데이터를 사용하는 것이 좋습니다.
l 6.16.3. 계산된 값
그래픽 테이블의 아쉬운 점
한 가지는 그래픽 컬럼만으로는 제공할 수 있는 정보가 매우 한정적 이라는 것 입니다. 계산된 값(Calculated value)은 구체적인 값을 표기해줌으로써 그래픽 테이블에서 부족할 수 있는 세부 정보를
표기해 줍니다. 단순히 집계 함수를 사용한 컬럼 뿐만 아니라 표현식을 통해 다양한 값을 표시해 줄 수
있습니다.
그래픽 컬럼의 계산된 값
세부 설정
l 6.16.4. 아이콘
아이콘(Icon)은 다른 그래프에는 없는, 아이콘들을 사용할 수 있기 때문에
그래픽 테이블의 독특함을 잘 보여줄 수 있습니다. 값으로 표기하는 대신 아이콘을 넣음으로써 매우 직관적인
결과를 보여줄 수 있습니다. 아이콘을 넣을 규칙을 설정하기 위해 설정 창에서는 첫 번째로 값을 계산하는
부분을 넣고, 두 번째로 계산된 값을 참으로 하는 규칙을 넣어야 합니다. 예를 들면, 아래 그림에서는 EPS
평균 값을 계산하였고, 규칙은 상위 1 값을
넣음으로써 계산 된 값들 중 상위 1인 행만이 참이 되어 규칙을 만족하게 했습니다.
그래픽 컬럼의 아이콘 세부
설정
l 6.16.5. 불릿 그래프
불릿 그래프(Bullet graph)는 대상 값을 가로 막대로 표현하고 비교 값을 선으로 표현한 그래프입니다. 불릿 그래프는 대상 값, 비교 값 선택과 가로 막대의 스케일, 그리고 범위 등을 설정하여 표현 할 수 있습니다.
그래픽 컬럼의 불릿 그래프
세부 설정
6.17. 요약 테이블
요약 테이블(Summary table)은 데이터 테이블의 통계 정보를 표시해 주는 표입니다.
요약 테이블은 로우 방향으로 컬럼 이름을 표시하고, 컬럼 방향으로 통계 값들을 표시해 줍니다. 하지만 이와 같은 로우에 컬럼 이름과 각 통계량이 표시되는 양식은 고정되어 있으며, 사용자는 컬럼이나 집계 함수를 바꾸는 정도의 변형이 가능합니다. 요약
테이블의 모습은 아래와 같습니다.
요약 테이블의 모습
위 그림은 예시 데이터 테이블을
사용해 만든 요약 테이블 입니다. 대상 컬럼은 Ticker, EPS,
Net income이고, 표시되는 통계 값은 합(Sum),
평균(Avg), 최소(Min), 최대(Max), 중간(Med), 그리고 표준편차(StdDev)가 기본 값으로 표시 됩니다.
l 6.17.1. 요약 테이블의 변경
요약 테이블에서 표시하고
싶은 컬럼 선택은 차트 속성의 컬럼 탭에서 설정할 수 있습니다. 컬럼 탭의 오른쪽 선택한 컬럼에 있는
컬럼들이 차트에 표시됩니다. 한편, 요약 테이블에서 표시하고
싶은 집계 함수는 차트 속성의 통계 측정 탭에서 설정할 수 있습니다. 통계 측정 탭의 오른쪽 선택한
측정에 있는 통계 값들이 차트에 표시됩니다. 흔히 사용하는 평균(Avg),
중간(Med), 표준편차(StdDev), 총합(Sum), 최대(Max), 최소(Min)
등을 많이 사용합니다.
위치: 차트 속성 - 컬럼 탭 / 차트 속성 - 통계
측정 탭
요약 테이블의 모습
l 6.17.2. 요약 테이블의 대체
요약 테이블은 결과를 알려주는 차트 혹은 대시보드에서 사용할 수 있지만, 다른 시각화 차트들은 통계 정보를 포함한 다른 정보들도 표시할 수 있기 때문에 요약 테이블 보다는 다른 시각화 차트를 사용합니다. 특히나 크로스 테이블은 요약 테이블의 상위 호환 기능이기 때문에 많은 경우 크로스 테이블로 대체 됩니다.
0 댓글