앞선 시간에서는 데이터 처리 중에서도 데이터를 확인하고 원하는 데이터만 거르고, 그리고 선택하는 처리 방법들, 즉 데이터에는 직접적인 변화 없이 보이는 표현 방식만을 이용하여 데이터를 처리하는 방법을 배웠습니다. 이번 시간부터는 데이터를 추가, 삭제, 변형 등의 직접적인 변화를 주어 처리하는 방법들을 소개하고자 합니다. 데이터를 처리하는 방법도 data table 내에서의 처리, data table 간의 처리 2가지로 나눌 수 있습니다. 각각에 대해 설명 드리는 시간을 가지겠습니다.
data table 내 변환
data table 하나에서 변화를 주는 data table 내의 변환은 여러가지가 있습니다. spotfire에서는 data table 내 변환을 data transform이라고 합니다. spotfire에서 제공한 data transform 의 종류는 아래와 같습니다.
Calculated new column : 새 column 만들기
Calculated and replace column : column 내용 변경
replace specific value : column 내용 변경
replace value : column 내용 변경
Cahnge column names : column 이름변경
Change data types : column 형식 변환
Exclude columns : column 삭제
filter rows : row 삭제
Data function : column 생성, 수정
Normalization : column 값 normalization(column 내용 변경)
pivot : pivot 변환
unpivot : unpivot 변환
여러가지 data transform 이 있지만 본질적으로는,
1. 새로 만들거나(calculated new column, data function, normalization)
2. 수정하거나(calculated and replace column, change column names, change data types, replace specific value, replace value)
3. 삭제하거나(exclude columns, filter rows)
4. pivot / unpivot 변환
을 적용하느 총 4가지로 볼 수 있습니다. 그리고 data transform을 설정하는 양식도 거의 비슷하거나 시각화 차트와 표를 그리면서 다루었던 양식과 거의 유사합니다. 다음 시간부터 caculated new column을 시작으로 데이터 내 변환을 알아보도록 하겠습니다.
0 댓글