데이터 품질 관리: Difference between revisions
From IT Wiki
No edit summary |
m (문자열 찾아 바꾸기 - "분류:데이터/통계학" 문자열을 "분류:데이터 과학" 문자열로) |
||
(11 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
[[분류:데이터베이스]][[분류:데이터 과학]] | |||
;Data Quality Management | ;Data Quality Management | ||
== 데이터 품질 관리 구조 == | == 품질 관리 대상 및 품질 지표 == | ||
=== 데이터 품질 관리 대상 === | |||
{| class="wikitable" | |||
|- | |||
! 관리 대상 !! 내용 | |||
|- | |||
| 데이터 값 || | |||
* 데이터 현상적 값 | |||
* 데이터 구조적 값 | |||
|- | |||
| 데이터 구조 || | |||
* 각 단계별 데이터 구조 | |||
* 각 조직 단위별 데이터 구조 | |||
|- | |||
| 데이터 관리 프로세스 || | |||
* 데이터 정의 프로세스 | |||
* 데이터 변경 프로세스 | |||
* 데이터 평가 프로제스 | |||
|} | |||
=== 데이터 품질 지표 === | |||
{| class="wikitable" | |||
|- | |||
! 구분 !! 지표 !! 설명 || 세부 지표 | |||
|- | |||
| rowspan="2"| 유효성 || 정확성 || 실세계를 정확히 반영 || 사실성, 적합성, 필수성, 연관성 | |||
|- | |||
| 일관성 || 동일 데이터간 불일치 미존재 || 정합성, 일치성, 무결성 | |||
|- | |||
| rowspan="4"| 활용성 || 유용성 || 요구되는 데이터 충족 || 충분성, 유연성, 사용성, 추적성 | |||
|- | |||
| 접근성 || 원하는 데이터를 손쉽게 이용 || - | |||
|- | |||
| 적시성 || 최신성 유지 || - | |||
|- | |||
| 보안성 || 내외부 요인으로부터 데이터 보호 || 보호성, 책임성, 안정성 | |||
|} | |||
== 데이터 품질 관리 프레임워크 == | |||
{| class="wikitable" | {| class="wikitable" | ||
! 구분 | ! 구분 | ||
! | ! 데이터 값 | ||
! | ! 데이터 구조 | ||
! 데이터 관리 프로세스 | |||
|- | |- | ||
| | | CIO/EDA | ||
(개괄적 관점) | |||
| colspan="3" style="text-align: center;" | 데이터 관리 정책 | |||
|- | |- | ||
| DA | |||
(개념적 관점) | |||
| 표준 데이터 | |||
| 개념 데이터 모델 | |||
데이터 참조 모델 | |||
| 데이터 표준 관리 | | 데이터 표준 관리 | ||
요구사항 관리 | |||
|- | |- | ||
| 데이터 | | 모델러 | ||
(논리적 관점) | |||
| 모델 데이터 | |||
| 논리 데이터 모델 | |||
| 데이터 모델 관리 | |||
데이터 흐름 관리 | |||
|- | |- | ||
| | | DBA | ||
(물리적 관점) | |||
| 관리 데이터 | |||
| 데이터 | | 물리 데이터 모델 | ||
| | 데이터베이스 | ||
| DB 관리 | |||
| | DB 보안 관리 | ||
|- | |- | ||
| 사용자 | |||
(운용적 관점) | |||
| 업무 데이터 | |||
| 사용자 View | |||
| 데이터 활용 관리 | | 데이터 활용 관리 | ||
|} | |} | ||
Line 51: | Line 91: | ||
| 데이터 품질기준 수립 | | 데이터 품질기준 수립 | ||
| – [[DQI]], [[CTQ]] 선정 | | – [[DQI]], [[CTQ]] 선정 | ||
| | | | ||
* 데이터 품질 기준정보 | |||
* DQI 등 업무영역 선정 | |||
|- | |- | ||
| ② | | ② | ||
| 프로파일링 | | 프로파일링 | ||
| | | 대상선정 프로파일링 | ||
| | | | ||
* 일반적 유형 현황 파악 | |||
* 컬럼, 관계, 패턴, 코드 등 | |||
|- | |- | ||
| ③ | | ③ | ||
| [[BR]] 선정 | | [[BR]] 선정 | ||
| | | BR 도출 및 확정 | ||
| | | | ||
* 각종 업무 규칙 수집 | |||
* 측정 가능형태로 선정 | |||
|- | |- | ||
| ④ | | ④ | ||
| 데이터품질진단 | | 데이터품질진단 | ||
| | | BR 측정 및 진단 | ||
| | | | ||
* 확정 BR의 측정, 진단 | |||
* 결과에 따른 현상 분석 | |||
|- | |- | ||
| ⑤ | | ⑤ | ||
| 개선/정제 | | 개선/정제 | ||
| | | 데이터 정제 | ||
| | | | ||
* 저품질 BR 오류 분석 | |||
* 개선/정제 후 재측정 | |||
|} | |} | ||
== 참조 모델 == | |||
* [[ISO 8000]]: 데이터 품질 관리 국제 표준 | |||
* [[DQM3]]: 국내 데이터 품질 관리 표준 모델 |
Latest revision as of 23:29, 6 May 2020
- Data Quality Management
품질 관리 대상 및 품질 지표[edit | edit source]
데이터 품질 관리 대상[edit | edit source]
관리 대상 | 내용 |
---|---|
데이터 값 |
|
데이터 구조 |
|
데이터 관리 프로세스 |
|
데이터 품질 지표[edit | edit source]
구분 | 지표 | 설명 | 세부 지표 |
---|---|---|---|
유효성 | 정확성 | 실세계를 정확히 반영 | 사실성, 적합성, 필수성, 연관성 |
일관성 | 동일 데이터간 불일치 미존재 | 정합성, 일치성, 무결성 | |
활용성 | 유용성 | 요구되는 데이터 충족 | 충분성, 유연성, 사용성, 추적성 |
접근성 | 원하는 데이터를 손쉽게 이용 | - | |
적시성 | 최신성 유지 | - | |
보안성 | 내외부 요인으로부터 데이터 보호 | 보호성, 책임성, 안정성 |
데이터 품질 관리 프레임워크[edit | edit source]
구분 | 데이터 값 | 데이터 구조 | 데이터 관리 프로세스 |
---|---|---|---|
CIO/EDA
(개괄적 관점) |
데이터 관리 정책 | ||
DA
(개념적 관점) |
표준 데이터 | 개념 데이터 모델
데이터 참조 모델 |
데이터 표준 관리
요구사항 관리 |
모델러
(논리적 관점) |
모델 데이터 | 논리 데이터 모델 | 데이터 모델 관리
데이터 흐름 관리 |
DBA
(물리적 관점) |
관리 데이터 | 물리 데이터 모델
데이터베이스 |
DB 관리
DB 보안 관리 |
사용자
(운용적 관점) |
업무 데이터 | 사용자 View | 데이터 활용 관리 |
데이터 품질 관리 프로세스[edit | edit source]
# | 프로세스 | 주요 절차 | 설명 |
---|---|---|---|
① | 데이터 품질기준 수립 | – DQI, CTQ 선정 |
|
② | 프로파일링 | 대상선정 프로파일링 |
|
③ | BR 선정 | BR 도출 및 확정 |
|
④ | 데이터품질진단 | BR 측정 및 진단 |
|
⑤ | 개선/정제 | 데이터 정제 |
|