데이터 상품
From IT Wiki
데이터 수요자가 비즈니스 목표 달성을 용이하게 할 수 있도록 지원하는 구매할 수 있는 디지털 자산
분류[edit | edit source]
가공 형태에 따른 분류[edit | edit source]
- 원천 데이터: 거래내역, 로그, 센싱 정보, 설문조사 결과, 연구관찰 데이터 등 수집·기록된 원시 데이터 자체
- 가공 데이터: 원천 데이터를 가공한 데이터로, 대부분의 데이터 거래는 가공 데이터 형태로 이루어짐
- 가공 데이터는 원천 데이터의 변화에 따라 변경되는 종속적인 데이터로서 원천 데이터를 가공 처리함으로써 가치 상승
- 보고서: 원천 데이터, 가공 데이터, 시장 조사 분석, 연구 결과 등 기업 내외부의 데이터를 활용하여 정리된 보고서
- 데이터 항목과 값 자체를 제공하는 것이 아닌, 해당 데이터를 활용하여 정리된 문서를 판매
- 주로 비정형 데이터 형태로 판매되며, 정형화된 형태로 표현하기 어려운 정보 전달이 필요한 경우 활용됨
- 데이터 분석 모델: 데이터에 머신러닝 등 다양한 형태의 분석을 적용하여 가치 도출 후, 데이터 자체가 아닌 분석 모델을 상품화
- ex) 신용평가 모델, 부도예측 모델, 고객 세분화 모델, 이미지 인식 모델 등
- 분석 모델의 기반 데이터와 알고리즘을 판매하는 형태와 분석 모델을 서비스화(Analytics as a Service)하여 판매하는 형태 존재
데이터 제공 방식에 따른 분류[edit | edit source]
- 파일 상품: 텍스트, 엑셀, 이미지 등의 파일 형태로 데이터를 제공
- 지속적으로 업데이트가 필요한 시계열 데이터 상품보다는 특정 시점·기간의 일회성 데이터 상품에 적합
구분 | 형태 | 설명 | |
---|---|---|---|
판독성 | 정형 데이터
(Structured Data) |
필드가 고정되어 있으며 기계 판독 및 자동화된 연산이 가능한 형태
ex) CSV, XLS, SQL 등 |
|
반정형 데이터
(Semi-Structured Data) |
필드가 지정되어 있으나 고정되어 있지 않고 연산을 위한 가공이 필요한 형태
ex) JSON, XML, HTML 등 |
||
비정형 데이터
(Unstructured Data) |
형태가 고정되어 있지 않고 기계 판독이 어려운 형태
ex) PPT, HWP, PDF, 음성, 이미지, 영상 등 |
||
독점성 | 독점 포맷
(Proprietary Format) |
특정 상용 소프트웨어를 통해 열람할 수 있는 소프트웨어 종속적인 파일 포맷
ex) XLS, PPT, HWP, PDF |
|
비독점 포맷
(Non-proprietary Format) |
텍스트 형태로 제공되며, 표준화된 체계를 통해 소프트웨어 종속적이지 않은 형태
ex) CSV, JSON, XML, HTML, SQL |
- API 상품: 데이터를 호출할 수 있는 애플리케이션 인터페이스를 통해 데이터 상품을 제공하는 방식
- 데이터가 주기적으로 업데이트 또는 갱신되는 경우 적합
- 서비스 상품: 데이터를 시각화하여 그래프, 대시보드 등의 분석화면이나 BI 도구와 같은 서비스 형태로 제공하는 방식
- 데이터 상품과 데이터 기반 서비스를 결합한 방식으로, 수요자가 분석을 통해 얻을 수 있는 결과를 사전에 정리된 형태로 제공
- 기업 내부에서 열람하기 위한 대시보드, BI 도구 형태와 대고객 서비스에 직접 출력하기 위한 웹페이지 형태 등으로 제공될 수 있음
참고 문헌[edit | edit source]
- 금융권 데이터 유통 가이드(2020.10, 금융보안원)