데이터 표준화: Difference between revisions

From IT Wiki
No edit summary
No edit summary
 
(6 intermediate revisions by 3 users not shown)
Line 1: Line 1:
[[분류:데이터베이스]]
[[분류:데이터베이스]]
;Data Standardization
;Data Standardization


== 필요성 ==
시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 작업
 
*적용 범위에 따라서 업계, 또는 국가가 대상이 될 수도 있음
 
==필요성==
{| class="wikitable"
{| class="wikitable"
|-
|-
! 문제점 !! 원인
!문제점!!원인
|-
|-
|  
|
* 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
*데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
* 데이터에 파악 지연으로 정보 제공의 적시성 결여
*데이터에 파악 지연으로 정보 제공의 적시성 결여
* 데이터 통합의 어려움
*데이터 통합의 어려움
* 정보시스템 변경 및 유지보수 곤란
*정보시스템 변경 및 유지보수 곤란
||
||
* 동시 다발적인 정보시스템 개발
*동시 다발적인 정보시스템 개발
* 전사 데이터 관리 마인드 미형성
*전사 데이터 관리 마인드 미형성
* 전사 데이터 관리 인력 부재
*전사 데이터 관리 인력 부재
* 전사 데이터 표준 관리 도구 부재
*전사 데이터 표준 관리 도구 부재
|-
|-
! colspan="2" | 개선 방안
! colspan="2" |개선 방안
|-
|-
| colspan="2" |
| colspan="2" |
* 데이터 표준화, 규격화를 위한 기본 방침 설정
*데이터 표준화, 규격화를 위한 기본 방침 설정
* 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
*전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
* 전사적인 데이터 요소 등록 및 관리 체계 구축
*전사적인 데이터 요소 등록 및 관리 체계 구축
|}
|}


== 기대 효과 ==
==기대 효과==
* 명칭의 통일로 인한 명확한 의사소통의 증대
 
* 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
*명칭의 통일로 인한 명확한 의사소통의 증대
* 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
*필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
* 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소
*일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
*정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소
 
==표준화 요소==
===[[데이터 명칭]]===
표준화 요구사항
{| class="wikitable"
!특성
!요구사항
|-
|'''고유성'''
|
* 특정 데이터 개념을 표현하는 데이터의 명칭은 다른 개념을 표현하는 명칭과 동일하지 않은 값이어야 함
|-
|'''규칙성'''
|
* 데이터 명칭을 구성하는 용어·단어들은 통일된 규칙을 가져야 함
* 용어의 축약, 나열 순서 등이 통일되지 않을 경우 같은 의미를 가진 중복된 데이터 명칭이 혼용될 수 있음
|-
|'''보편성'''
|
* 데이터 명칭은 데이터를 취급하는 관점에서 보편타당하게 인지되어야 함
* 데이터 명칭 구성 시 업무에서 보편적으로 사용되는 표현을 차용해야 함
|-
|'''충분성'''
|
* 데이터의 명칭은 데이터 개념을 충분히 표현할 수 있도록 구체적이어야 함
* 처음부터 충분성을 고려하지 않고 명칭을 표준화할 경우 향후 데이터가 다양해질수록 유일성이 위배 될 가능성 증가
|}
 
===데이터 정의===
 
*데이터가 의미하는 범위 및 자격 요건
 
===데이터 형식===
 
*Numeric
*Text
*Date
*Char
*Timestamp
 
===데이터 규칙===
 
*기본 값
*허용 값
*허용 범위
 
==표준화 구성==
===데이터 표준===
 
*'''단어''': 금지 단어, 표준 단어
**금지 단어: 손님, 휴대폰, 스마트폰
**표준 단어: 고객, 핸드폰
**단어 사전: 고유코드, 한글명: 고객, 영문명: Customer, 영문 약어명: CUST
*'''용어''': 단어의 조합, 조합 규칙
**고객 휴대폰 번호 → 고객_핸드폰_번호 → CUST_CPHONE_NO, custCphoneNo
*'''도메인''': 용어, 단어의 분류
**주소: 고객 주소, 직장 주소, 수령지 주소
**연락처: 집전화번호, 핸드폰번호, 팩스번호
*'''코드''': 코드 분류, 코드 값
**코드 분류: 담보 구분코드
**코드 값: 11-주택, 12-토지, 21-자동차, 22-기타기계
 
===데이터 표준 조직===
 
*전사 데이터 관리자
*업무 데이터 관리자
*업무 시스템 데이터 관리자


== 표준화 요소 ==
===데이터 표준 절차===
=== 데이터 명칭 ===
* 유일성
* 업무적 관점의 보편
* 의미 전달의 충분성


=== 데이터 정의 ===
*데이터 표준화 요구 사항수집
* 데이터가 의미하는 범위 및 자격 요건
*데이터 표준 정의
*데이터 표준 확정
*데이터 표준 관리


=== 데이터 형식 ===
==참고 문헌==
* Numeric
* Text
* Date
* Char
* Timestamp


=== 데이터 규칙 ===
*[http://www.dbguide.net/db.db?cmd=view&boardUid=12803&boardConfigUid=9&categoryUid=216&boardIdx=30&boardStep=1 디비가이드넷]
* 기본 값
* 허용 값
* 허용 범위

Latest revision as of 13:20, 30 March 2021


Data Standardization

시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 작업

  • 적용 범위에 따라서 업계, 또는 국가가 대상이 될 수도 있음

필요성[edit | edit source]

문제점 원인
  • 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
  • 데이터에 파악 지연으로 정보 제공의 적시성 결여
  • 데이터 통합의 어려움
  • 정보시스템 변경 및 유지보수 곤란
  • 동시 다발적인 정보시스템 개발
  • 전사 데이터 관리 마인드 미형성
  • 전사 데이터 관리 인력 부재
  • 전사 데이터 표준 관리 도구 부재
개선 방안
  • 데이터 표준화, 규격화를 위한 기본 방침 설정
  • 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
  • 전사적인 데이터 요소 등록 및 관리 체계 구축

기대 효과[edit | edit source]

  • 명칭의 통일로 인한 명확한 의사소통의 증대
  • 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
  • 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
  • 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소

표준화 요소[edit | edit source]

데이터 명칭[edit | edit source]

표준화 요구사항

특성 요구사항
고유성
  • 특정 데이터 개념을 표현하는 데이터의 명칭은 다른 개념을 표현하는 명칭과 동일하지 않은 값이어야 함
규칙성
  • 데이터 명칭을 구성하는 용어·단어들은 통일된 규칙을 가져야 함
  • 용어의 축약, 나열 순서 등이 통일되지 않을 경우 같은 의미를 가진 중복된 데이터 명칭이 혼용될 수 있음
보편성
  • 데이터 명칭은 데이터를 취급하는 관점에서 보편타당하게 인지되어야 함
  • 데이터 명칭 구성 시 업무에서 보편적으로 사용되는 표현을 차용해야 함
충분성
  • 데이터의 명칭은 데이터 개념을 충분히 표현할 수 있도록 구체적이어야 함
  • 처음부터 충분성을 고려하지 않고 명칭을 표준화할 경우 향후 데이터가 다양해질수록 유일성이 위배 될 가능성 증가

데이터 정의[edit | edit source]

  • 데이터가 의미하는 범위 및 자격 요건

데이터 형식[edit | edit source]

  • Numeric
  • Text
  • Date
  • Char
  • Timestamp

데이터 규칙[edit | edit source]

  • 기본 값
  • 허용 값
  • 허용 범위

표준화 구성[edit | edit source]

데이터 표준[edit | edit source]

  • 단어: 금지 단어, 표준 단어
    • 금지 단어: 손님, 휴대폰, 스마트폰
    • 표준 단어: 고객, 핸드폰
    • 단어 사전: 고유코드, 한글명: 고객, 영문명: Customer, 영문 약어명: CUST
  • 용어: 단어의 조합, 조합 규칙
    • 고객 휴대폰 번호 → 고객_핸드폰_번호 → CUST_CPHONE_NO, custCphoneNo
  • 도메인: 용어, 단어의 분류
    • 주소: 고객 주소, 직장 주소, 수령지 주소
    • 연락처: 집전화번호, 핸드폰번호, 팩스번호
  • 코드: 코드 분류, 코드 값
    • 코드 분류: 담보 구분코드
    • 코드 값: 11-주택, 12-토지, 21-자동차, 22-기타기계

데이터 표준 조직[edit | edit source]

  • 전사 데이터 관리자
  • 업무 데이터 관리자
  • 업무 시스템 데이터 관리자

데이터 표준 절차[edit | edit source]

  • 데이터 표준화 요구 사항수집
  • 데이터 표준 정의
  • 데이터 표준 확정
  • 데이터 표준 관리

참고 문헌[edit | edit source]