[spotfire] 4. Spotfire 입출력 - 불러오기, 내보내기, 저장




4. Spotfire 입출력

Spotfire를 사용하여 본격적으로 차트를 그리기에 앞서, 차트를 그릴 때 사용할 데이터 테이블을 불러오고 수정된 데이터를 저장할 수 있어야 합니다. 또한 완성한 차트와 표 그리고 대시보드 등을 파일로 저장하고 필요할 때 불러 올 수 있어야 합니다. 특히 Spotfire는 데이터를 불러오는 다양한 방법을 제공하고 있기 때문에 상황에 맞는 방법을 잘 찾아 활용하는 것이 중요합니다.

 

4.1. 데이터 테이블 불러오기

Spotfire에서 데이터 불러오는 과정은 크게 2 단계로 이루어 집니다. 1단계는 불러오는 데이터 소스(data source)를 선택하여 연결하는 것 입니다. 데이터 소스는 DB가 될 수도 있고, 클립보드, Excel 파일 등 다양하게 선택할 수 있습니다. 2단계는 데이터 소스에 저장되어 있는 데이터를 파악하여 Spotfire의 데이터 테이블 형식으로 바꾸는 것 입니다. 이는 데이터 소스로부터 데이터를 받아오지만 그 과정에서 형식이나 표현의 차이로부터 오는 오류를 방지하기 위함이며, 가져오기 설정(import setting)이라고 합니다. Spotfire에서 데이터 불러오기를 위해서는 두 가지 과정을 모두 진행해야 하며, 손쉽게 진행 할 수 있습니다.

 

 

l  4.1.1. 데이터 소스 연결

데이터를 불러오는 1단계로, 데이터 소스와 연결하는 방법을 먼저 설명 드리겠습니다. Spotfire에서는 4가지 방법으로 데이터 소스와의 연결을 지원합니다.

 

n 클립보드 복사-붙여넣기

로컬 컴퓨터의 클립보드에 저장되어 있는 데이터를 불러옵니다. 보통 컴퓨터에서 사용하는 복사-붙여넣기(Copy & paste)를 떠올리시면 됩니다. 불러오는 방법들 중에 데이터 작업 간에 가장 편리하고 손쉽게 사용할 수 있지만, 데이터가 크거나 형태가 부적절하면 의도하지 않은 데이터 테이블 모습이 되기 때문에 주의 해야 합니다. 복사를 원하는 데이터 테이블 또는 데이터를 ctrl + c를 통해 클립보드에 넣은 후 Spotfire에서 아래 위치를 실행합니다.

위치: 편집 - 붙여넣기 / 파일 및 데이터 - 기타 - 클립보드에서 데이터 붙여넣기

 


클립보드 복사-붙여넣기로 데이터 로드

 

n 로컬 컴퓨터 파일

사용자의 로컬 컴퓨터에 저장되어 있는 파일을 불러오는 기능입니다. Excel 파일(*.xls, *xlsb, *xlsx, *.xlsm) 이나 텍스트 파일(*.txt, *.csv), 또는 SAS(*.sas7bdat) 등 여러가지 파일들에 있는 데이터를 받아 올 수 있습니다. 아래의 위치에서 실행합니다.

위치: 파일 및 데이터 - 로컬 파일 찾아보기 - 윈도우창에서 파일 선택



로컬 컴퓨터에서 저장된 파일을 이용한 데이터 로드

 

n 내부 네트워크, DB 파일

내부에 연결된 네트워크 망이나 사내 인프라 망 등을 통해 다른 컴퓨터나 서버, DB에 저장되어 있는 데이터를 불러옵니다. 본 기능부터는 미리 네트워크 연결을 위한 하드웨어나 통신 세팅이 필수적입니다. 불러오는 방법은 일반적인 사내 네트워크는 라이브러리(Library)를 통해 불러오고, DB의 데이터 불러오기는 인포메이션 링크+(information link+)를 통해 불러 올 수 있습니다. 두 가지 방법의 차이는 불러오기가 아니라 저장에 차이가 있습니다. 저장 할 때 언급하겠지만, 라이브러리는 기본적으로 읽고 쓰기가 자유롭습니다. 설정에 따라 권한이나 제한을 할 수 있지만 특별히 세팅하지 않는 이상 자유롭게 읽고 쓰고 접속이 가능합니다. 하지만 DB와 같은 경우에는 입장이 다릅니다. 원본 데이터는 관리자 이외에는 쓰기나 수정을 원천적으로 차단해야 됩니다. 이를 위해서 공용 사용 공간인 라이브러리 이외에 다른 인포메이션 링크를 통해 데이터를 불러올 수 있게 만들었습니다. 먼저 라이브러리를 통한 네트워크 파일 불러오기 방법을 보여 드리겠습니다. 위치는 아래와 같습니다.

위치: 파일 및 데이터 - 라이브러리 - 라이브러리 찾아보기 - 파일 선택



내부 네트워크의 라이브러리를 통한 데이터 로드

 

인포메이션 링크+를 통해 DB데이터 불러오는 방법은 아래 위치에서 선택 할 수 있습니다.

위치: 파일 및 데이터 - 기타 - 인포메이션 링크+

 


인포메이션 링크+로 데이터 로드

 

n 클라우드 파일

외부 네트워크를 통해 클라우드 서비스에 저장된 데이터를 활용하는 방법입니다. 대표적인 클라우드 서비스 업체로 아마존, 오라클, 구글, IBM, 마이크로소프트, SAP 등 해외의 유명 테크 기업들의 클라우드 서비스와 연결하는 기능입니다. 물론 TIBCO에서도 자체 클라우드 서비스를 제공하며, TIBCO의 클라우드를 사용할 경우 더 좋은 성능을 발휘하기도 합니다. 클라우드와 연결하기 위해서는 클라우드 Spotfire에서 최초 접근 구성이 필요합니다. 각 클라우드 마다 IP주소 및 방화벽 규칙 등에 맞춰 세팅한 후 데이터로의 접근이 가능합니다. 이후 데이터 불러오기는 아래의 위치에서 실행합니다.

위치: 파일 및 데이터 - 연결 대상 - 클라우드 선택

 


클라우드 데이터 로드


 

l  4.1.2. 가져오기 설정

앞서 4가지 방법으로 데이터 소스를 선택한 후에는 가져오기 설정을 해야 합니다. 가져오기 설정(Import settings)데이터 소스의 데이터를 Spotfire에서 어떻게 받아올까에 대한 설정입니다. 데이터 소스로부터 데이터 테이블을 만들기 위해 컬럼, 로우, 컬럼 이름이 필요합니다. 또한 데이터는 데이터의 구체적인 값(Value)뿐만 아니라 형식(Type)도 필요합니다. 1이라는 것을 숫자로 받을지 문자로 받을지 또는 20220101을 날짜의 한 형태로 봐야할지, 숫자로 봐야할지, 문자로 봐야할지 등 형식은 데이터 값 이외에도 중요한 부분을 차지 합니다. 가져오기 설정에서는 이와 같은 데이터 테이블과 데이터를 잘 받기 위한 확인 작업을 합니다. 데이터 소스 선택 후 가져오기 설정 창은 아래와 같습니다.

 


가져오기 설정 화면 모습

 

데이터 소스에 따라 가져오기 설정이 약간씩 차이는 있지만 동일한 작업을 합니다. Spotfire에서 일차적으로 데이터 테이블과 형식을 지정해 줍니다. 여기서 필요한 것이 데이터와 데이터 사이의 구별을 해주는 기호를 구분자(Seperator)와 데이터 포맷(format) 입니다. Spotifre에서는 데이터 소스에 따라 구분자와 포맷을 적절하게 선택해 줍니다. 또한 데이터를 보고 형식 또한 적절하게 선택해 줍니다. 물론 사용자가 임의로 변경할 수 있게 구분자, 포맷, 형식을 선택할 수 있게 만들어 놓았습니다. 미리보기를 통해 사용자가 기대하는 데이터가 맞는 확인하면서 수정 시에는 수정 후 refresh 버튼을 클릭해 제대로 수정이 되었는지 확인이 필요합니다. 가져오기 설정에 있는 항목들에 대한 설명은 아래와 같습니다.

 


가져오기 설정에서 구분자, 포맷 수정 또는 데이터 테이블 구성 수정

 

n 구분자

일반적으로 Delimiter, Terminator, 또는 Separator 로 불리는 구분자를 의미합니다. 각종 프로그램들에서는 시각적으로는 보이지 않지만 내부적으로 사용하고 있는 구분자들이 있습니다. 예를 들면, txt 로 대표되는 메모장 같은 파일들은 줄 변경은 탭(Tab)을 사용합니다. csv로 대표되는 엑셀 같은 파일들은 comma, xls 로 대표되는 엑셀 파일들은 탭으로 구별됩니다. Spotfire에서 자동으로 설정해주지만, 간혹 원하는 세팅이 아닐 경우 구분자를 바꿔 주면 됩니다.

 

n 포맷

역시 파일들 별로 각자 처리하는 텍스트 방식이 있습니다. 한글을 반영할 수 있는 UFC-8 과 같은 포맷을 고려해야 하지만, 구분자와 마찬가지로 데이터의 형식에 따라 자동으로 설정되며, 크게 문제가 되는 경우는 없습니다. 일반적으로 한국에서 사용할 경우 많은 경우 Ko-KR, Korean이 많이 사용됩니다.


 

n 추가 설정

추가 설정(Advanced)에서 좀 더 세부적인 설정이 가능합니다. 일정한 규칙을 제공하거나 컬럼 이름을 임의로 넣을 수 있지만, 추가설정에서 진행하는 것보다 데이터 불러오기 이후에 데이터 테이블을 수정하는 것이 더 편리하고 유연하게 대처할 수 있습니다.

 

n 미리보기

미리보기(Data preview)는 구분자, 포맷 그리고 데이터 테이블을 구성에 따라 Spotfire 에서 받게 될 데이터 테이블 모습을 미리 보여줍니다. 설정한 구분자, 포맷이 올바른지 확인할 수 있으며, 데이터 형식, 컬럼 이름으로 사용할 열 선택 그리고 컬럼 포함 여부 등을 선택 할 수 있습니다. 다른 것은 크게 신경 쓸 경우가 적지만, 날짜나 숫자 형식 등의 원하는 데이터 형식이 있을 때에는 반드시 확인해야 합니다.

 

모든 검토가 끝나면 비로소 데이터를 불러올 수 있습니다. 데이터 소스 선택과 가져오기 설정은 말 그대로 설정을 선택한 것이고, 데이터 불러오는 작업은 선택 이후 진행됩니다. 데이터가 큰 경우 이 때 하중(load)이 걸리며 시간이 오래 소요 됩니다.


 

4.2. 내보내기

Spotfire에서 사용한 데이터 테이블이나 시각화 차트를 저장하고 싶다면, 내보내기(Export) 기능을 사용해야 합니다. 지원하는 내보내기(Export) 방식은 구현된 시각화 차트나 페이지 등을 이미지 파일 또는 PDF 파일 또는 MS PowerPoint 파일로 내보낼 수 있으며, 데이터 테이블은 Excel이나 텍스트 파일(.csv, .txt, .stdf, .xls) 등으로 내보낼 수 있습니다.

위치: 파일 - 내보내기 - 원하는 형식 선택

 


Spotfire 내보내기 기능의 위치

 

내보내기에서 원하는 형식을 선택하면 이후에는 내보내기 설정 창이 뜨면서 상세한 설정을 할 수 있습니다. Spotfire에서 가장 많이 하는 내보내기 형식은 이미지 파일과 데이터 테이블 파일입니다. 하지만 이 경우에는 Spotfire의 내보내기 기능보다는 외부 기능을 활용하는 경우가 많습니다. 이미지 파일로 내보내는 것은 캡처 프로그램이나 프린트 스크린(Print screen)으로 가능합니다. 데이터 테이블 역시 내보내기 기능 대신 복사-붙여넣기(copy & paste)를 많이 사용합니다. 하지만 데이터가 매우 큰 경우 클립보드 메모리를 초과하기 때문에 이 경우 내보내기 기능이 필수적입니다. 데이터에서 파일로를 클릭하면 데이터 테이블을 내보낼 수 있습니다.

 

 

데이터 테이블 내보내기

 

데이터 내보내기에서는 차트 이미지를 내보낼 수도 있고, 데이터 테이블을 내보낼 수도 있습니다. 내보낼 이미지 또는 데이터 테이블을 선택한 뒤, 모든 데이터 또는 필터링된 행, 마크된 행 등 세부적인 데이터까지 선택이 가능합니다. 다른 형식의 내보내기 설정 창은 활용 빈도가 낮고 간단히 구성되어 있기 때문에 필요할 때 크게 어렵지 않게 사용할 수 있습니다.

추가적으로 클라우드 Spotfire에서는 내보내기 기능 외에도 공유 기능이 추가되어 있습니다. 웹으로 바로 공유할 수도 있고 트위터에 공유할 수도 있습니다. 링크를 다른 사람에게 공유할 때는 해당 사용자의 액세스 권한이 있는 폴더에 분석 대시보드를 저장해야 합니다.


 

4.3. 파일 저장

데이터를 저장 할 때에도 2단계를 거치게 됩니다. 1단계는 데이터 로드 설정(Data loading settings)입니다. 데이터 소스와 연결 상태를 어떻게 저장할지를 설정합니다. 2단계는 다른 프로그램의 저장 방법과 마찬가지로 저장 위치나 이름을 설정하고 저장합니다.

Spotfire의 작업 내용을 저장하기 위해서 저장(Save) 기능들이 있습니다. 구체적으로는 저장(Save), 다른 이름으로 저장(Save as), 그리고 다른 이름으로 복사본 저장(Save copy as)이 있습니다. 저장이나 다른 이름으로 저장 시 기존 저장 위치를 기본 저장 위치로 저장하지만, 다른 이름으로 복사본 저장은 기본 저장 위치는 그대로 기존 저장 위치에 유지하면서 다른 곳에 사본을 생성할 때 사용합니다. 기존 프로젝트를 유지하면서 백업 파일을 만드는 것이라고 생각하면 좋을 것 같습니다. 하지만 필요성이 느껴지지 않는다면 저장이나 다른 이름으로 저장 기능만 활용해도 무방합니다. 저장 위치는 로컬 컴퓨터나 라이브러리에 저장 할 수 있습니다.

위치: 파일 - 저장, 다른 이름으로 저장, 다른 이름으로 복사본 저장

 


Spotfire 파일 저장 방법

l  4.3.1. 데이터 로드 설정

저장 버튼을 누르면 1단계로 데이터 로드 설정(Data loading settings)을 할 수 있습니다. 데이터 로드 설정에서는 데이터 소스와의 연결을 어떻게 저장하고 나중에 어떻게 로드 해야 되는지를 설정합니다.

 


Spotfire 파일 저장 중, 데이터 로드 설정 창

 

데이터 로드 세팅 창은 처음에는 위 그림의 왼쪽처럼 간단하게 표시 됩니다. 여기서 아무런 작업없이 확인을 눌러 넘어 가면, Spotfire에서는 데이터 소스와의 연결은 디폴트(Default) 값으로 설정하게 됩니다. 디폴트 값은 데이터 소스와 연결되어 있다면 항상 새 데이터(Always new data)를 로드하고, 데이터 소스 없는 것들은 저장된 데이터(Stored data)로 저장합니다. 이 디폴트 값 이외로 설정하고 싶다면 데이터 로드 세팅 창에서 상세 정보 표시(Show details)를 클릭합니다. 상세 정보 표시가 되면 각 세부 데이터 테이블 별로 어떻게 저장할지 설정 할 수 있습니다.

 

1. 항상 새 데이터(Always new data)

2. 가능한 경우 새 데이터(New data when possible)

3. 저장된 데이터(Stored data)


데이터 소스와 연결이 되어 있다면 3가지 중 하나로 저장 할 수 있고, 복사-붙여넣기로 데이터를 넣었다면 저장된 데이터만 사용 가능합니다. 디폴트 값을 사용하면 될 것 같지만, Spotfire의 사용 목적, 사용 환경에 따라 다른 방식으로 저장하는 것이 필요할 경우가 있습니다. Spotfire에서 데이터 소스 연결 후 그래프를 그리고 이를 데일리 대시보드(Daily dashboard)를 만들었다면, 단순히 데이터 테이블을 한번 저장하고 사용하는 것이 아닌 매번 업데이트 되는 새로운 데이터를 받아와야 합니다. 이를 위해서는 데이터 테이블은 매번 바뀌는 데이터 소스와 데이터 로드 조건으로 설정해야 합니다. 따라서 위와 같은 경우를 위해서 Spotfire에서는 항상 새 데이터, 가능한 경우 새 데이터라는 기능을 제공합니다. 따라서 데이터 저장 할 때에는 상세 정보 표시를 눌러 세부적인 데이터 소스와의 연결을 확인해 주는 것이 좋습니다.

 

l  4.3.2. 저장 위치 확인

2단계는 저장 위치를 확인해 줍니다. 우리가 많이 보아왔던 저장 창이 뜨며, 저장할 이름 및 경로를 선택하고 저장을 누르면 해당 경로에 해당 이름을 가진 Spotfire 파일이 생성됩니다. Spotfire 파일 확장자는 .dxp입니다.

 


Spotfire 파일 저장 중, 데이터 로드 설정 창

 

4.4. 파일 불러오기

Spotfire 파일은 확장자가 .dxp 입니다. 파일을 실행하거나 Spotfire 실행 후 오픈으로 해당 파일을 선택하면 이전에 저장한 Spotfire로 로드 됩니다. 한 가지 중요한 사실은 Spotfire는 파일 로드 시, 이전 작업 내용을 그대로 재현한다는 것입니다. 즉 데이터 소스 연결부터 데이터 처리, 차트 그리기까지 일련의 과정을 저장해 두었다가 그대로 반복하여 재현합니다. 때문에 과정 중에 오류가 있거나 비가역적인 과정이 있었다면, Spotfire는 파일을 온전히 불러오지 못하고 오류가 발생하게 됩니다. 이것은 데이터가 아닌 과정을 저장해야 새로운 데이터를 불러오더라도 동일하게 구현가능하기 때문입니다. 따라서 Spotifre로 작업 후 저장 계획이 있다면, 작업은 항상 명확한 과정으로 실행 되어야 합니다. 이는 데이터 캔버스(Data canvas)를 사용하면 명확한 과정을 나타낼 수 있습니다.

댓글 쓰기

0 댓글