[spotfire] 27. Tips



Bin 분리


데이터의 형식 중에서 실수(real)의 특징 중 하나는 연속이라는 것입니다. 하지만 때때로 연속보다는 불연속한 구간이나 범위가 필요할 때가 있습니다. 예를들면 물의 상태를 온도에 따라 얼음, 물, 증기로 나눈다거나 사람들의 나이를 태어난 연도에 따라 80년대생, 90년대생, 00년대생 등으로 나누는 등, 연속적인 흐름보다는 범위가 특정 의미를 지니고 있을 때가 있고, 이를 불연속적으로 표현 할 수 있다면 더 효과적일 것입니다. spotfire에서는 이 점에 착안하여 값들을 몇개의 덩어리로 나누는 bin이라는 기능을 제공합니다. bin의 의미는 영어로는 통이라는 의미이고 data processing, data science 쪽에서는 구획, 덩어리 그리고 binning을 구획을 나누다, 덩어리를 나누다 정도로 해석하는 것이 좋을 것 같습니다. 참고로 다른 매체에서는 저장함이라고 해석하는 경우도 있습니다. 위의 예시에서는 숫치형 자료에만 적용하였지만, spotfire의 bin은 범주형 자료에서도 사용할 수 있습니다. bin의 분류 방법과 사용 예시를 알아 보겠습니다.

위치 : data - add binned column

add binned column 위치와 설정창

add binned column 실행 시 위와 같은 설정창이 뜹니다. 설정창은 크게 대상 data table과 대상 column을 선택하는 부분과 bin method를 선택하는 부분, 그리고 새로 생성될 column 이름을 넣는 칸으로 구별되어 있습니다. bin method는 선택하는 column 형식에 의존적으로 다른 것으로 바뀝니다. column 형식 별 적용 가능한 방법은 그림에 적어두었습니다. bin method는 6 가지 방법이 제안되어 있습니다.
① 은 임의의 수치로 나누는 것입니다. 임의의 수치 사이에는 세미콜론(;)을 넣어 구분합니다. 예를들어 물의 온도에 따른 상태 변화를 나타내고자 한다면 온도 column에서 0;100 으로 적용하면 (0 이하, 0 ~ 100, 100 이상) 으로 분류 될 것입니다. ② 는 일정 개수의 등간격으로 나누는 것입니다. 나누는 bin 개수를 5로 설정하면, column에서 (max - min)/5 로 간격을 설정하여 나눕니다. ③ 은 각 bin 당 동일한 개수의 row가 되도록 bin을 나누는 것입니다. column을 정렬하고 일정 개수 만큼 동일한 bin으로 분류한다고 생각하면 될 것 같습니다. ④ 는 표준편차로 나누는 것이다. bin으로 나눌 표준편차 값이 0.5, 1, 2, 3, 6으로 설정되어 있으며, 원하는 값을 선택하면 작동합니다. 과거 제조 업체들에서 많이 사용된 3 sigma, 6 sigma 에 대한 분포와 유사하게 사용됩니다. ⑤ 는 앞자리부터 혹은 뒷자리부터 몇번째 글자까지 사용해서 그 값으로 bin을 나누는 것입니다. 예를들면 정수의 일의 자리 숫자 별로 bin을 나누기 위한 방법으로 사용할 수 있습니다. 마지막 ⑥ 은 범주형 데이터에 사용할 수 있는 것으로 ①과 유사하게 임의로 나누는 것입니다. 각 bin 별로 범주형 데이터를 임의로 선택하여 bin을 부여합니다.
위와 같이 나뉜 bin은 새로운 column에 기록되고 binned column의 값은 spotfire에서 제공하는 규칙 값으로 부여 됩니다. 또한 임의로 나누는 bin method를 제외하고는 표현식으로 적용할 수 있습니다. 즉, add calculated column으로 동일하게 표현 할 수 있습니다.

Tag와 List


spotfire에서 논리의 단위는 column 이기 때문에 특정 기능을 구현함에 있어 모든 것은 column을 기준으로 생각해야 됩니다. 가령 [value] 라는 column을 기준으로 한다면 spotfire에서는 [value]에 관계된 모든 파생적인 기능들은 [value]에 종속적으로 작동 합니다. 차트를 그릴 때도 [value] 값으로 나타내고, add calculated column을 하더라도 function은 [value]와 관련된 값을 내놓을 것 입니다. 하지만 가끔은 어떠한 column과도 관련되지 않지만 임의로 나누어야 되는 경우가 생깁니다. 이처럼 기존의 column에 종속되지 않는 기준으로 나누어야 될 때, spotfire의 tag 또는 list 라는 기능을 사용할 수 있습니다. tag는 data table 내에서 나누는 기능이고 list는 data table과 상관없이 특정 값만 선택하는 기능입니다.

- Tag

tag 를 생성하기 위해서는 tag collection 이라는 tag들의 집합을 만들어야 합니다. tag 생성은 아래의 경로로 생성할 수 있습니다.

위치 : View - tags

tag 생성 경로와 tag collection, tag 생성

tag collection을 생성하면 tag collection 이름으로 새로운 column이 생성됩니다. column의 각 row 데이터로 임의로 분류된 tag들이 들어가게 됩니다. tag는 중복을 허락하지 않으며 반드시 하나의 tag에는 속해야 합니다. tag 부여 방법은 아래 그림과 같이 데이터 선택 후 tag 이름에 우클릭으로 추가할 수 있습니다. tag 가 부여 된 후에는 tag 선택 시 분류된 tag 데이터들이 선택됩니다. 분류한 tag들은 언제든 임의로 수정 가능합니다.

tag 부여 방법과 tag 선택

tag 기능은 단순히보면 row를 나눠주고 각각 편하게 선택하게 해주는 기능밖에 없지만, related data, marker와 같이 사용되어 임의의 조건에 해당되는 결과들만 표시하는 경우가 많습니다.

- List

list는 data table, column에서 값을 선택하여 list로 지정하면 해당 unique value들을 list로 사용할 수 있습니다. list 중 하나의 값 선택 시 해당되는 모든 row를 선택해 줍니다. list box filter 또는 tag와 비슷한 기능 입니다. 다만 한 가지 차이점은 tag에서는 column에 따로 tag 해당 유무를 표시 했지만 list는 column과 무관합니다. 물론 list 역시 tag처럼 column에 list 해당 유무를 표시할 수 있습니다. list는 아래의 경로에서 실행할 수 있습니다.

위치 : View - tags

List 경로, list 생성과 선택

list 실행 후 ④에서처럼 원하는 column 선택 후 list 를 생성하면 아래쪽에 unique value를 표기해 줍니다. 아래의 표기된 값을 선택 시 ⑤와 같이 해당 data table의 column에서 선택한 value에 해당되는 row 전체를 선택해 줍니다. 이처럼 tag와 list는 원하는 row 선택을 편리하게 해주는 기능이지만 cross table 활용이나 property를 이용해 동일한 기능을 구현할 수 있습니다. 자주 사용되는 기능은 아니기 때문에 모르고 있어도 spotfire 사용에 거의 지장이 없습니다.

주석과 대화


주석과 대화는 spotfire에 표현되는 시각화 차트와는 별도로 최상단에 부착할 수 있는 텍스트 상자입니다. 현실에서의 포스트잇처럼 어떤 코멘트를 적어두기 위해 많이 사용됩니다. 하지만 spotfire에서는 주석과 대화라는 2가지 기능을 별개로 제공합니다. 2가지 방법을 알아보는 시간을 갖도록 하겠습니다.

- 주석(annotation)

주석의 모습은 현실에서의 포스트잇이나 개인 컴퓨터에서 사용하는 스티커 메모와 같은 모습을 하고 있습니다. 따라서 사용하는 경우도 일방적인 코멘트나 개인 생각등을 적어두는 단방향 커뮤티케이션으로 활용합니다. 주석을 붙이면 해당 주석은 붙여놓은 시각화의 일부로 취급됩니다. 따라서 시각화 차트를 이동, 복제하는 경우에도 주석이 포함되어 이동, 복제가 됩니다. 시각화로 내보내는 경우 주석을 넣을지 뺄지를 결정할 수 있습니다.

annotation 실행과 시각화 모습

- 대화(conversation)

대화도 주석과 비슷하게 시각화 차트에 부착되어 텍스트를 남길수 있지만, 대화는 양방향 커뮤니케이션으로 서로 간의 의견 제안이나 대화가 가능합니다.

conversation 실행과 시각화 모습

저장파일의 URL 얻기


저장된 파일의 URL을 알아야되는 경우가 간혹 있습니다. data function 적용, ironpython 으로 로드 등 사람이 개입하여 저장된 위치를 불르는 것이 아닌 자동으로 정해진 규칙에 따라 필요한 파일을 부를 때가 있습니다. 이 경우는 저장 된 파일의 URL을 제공받아 활용해야 됩니다. URL은 library 에 저장 시 자동으로 URL이 부여됩니다.

위치 :files and data - Browse the library - 해당파일 - ...(details) - library URL 또는 web client URL

이 밖에도 저장된 파일의 detail에서 파일 수정일, 수정자, 생성일, 작성자, 파일 크기 등 부수적인 정보도 얻을 수 있습니다.

댓글 쓰기

0 댓글