데이터 표준화

From IT Wiki


Data Standardization

시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 작업

  • 적용 범위에 따라서 업계, 또는 국가가 대상이 될 수도 있음

필요성[edit | edit source]

문제점 원인
  • 데이터의 중복 및 조직, 업무, 시스템별 데이터 불일치
  • 데이터에 파악 지연으로 정보 제공의 적시성 결여
  • 데이터 통합의 어려움
  • 정보시스템 변경 및 유지보수 곤란
  • 동시 다발적인 정보시스템 개발
  • 전사 데이터 관리 마인드 미형성
  • 전사 데이터 관리 인력 부재
  • 전사 데이터 표준 관리 도구 부재
개선 방안
  • 데이터 표준화, 규격화를 위한 기본 방침 설정
  • 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
  • 전사적인 데이터 요소 등록 및 관리 체계 구축

기대 효과[edit | edit source]

  • 명칭의 통일로 인한 명확한 의사소통의 증대
  • 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
  • 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
  • 정보시스템 간 데이터 인터페이스 시 데이터 변환, 정제 비용 감소

표준화 요소[edit | edit source]

데이터 명칭[edit | edit source]

표준화 요구사항

특성 요구사항
고유성
  • 특정 데이터 개념을 표현하는 데이터의 명칭은 다른 개념을 표현하는 명칭과 동일하지 않은 값이어야 함
규칙성
  • 데이터 명칭을 구성하는 용어·단어들은 통일된 규칙을 가져야 함
  • 용어의 축약, 나열 순서 등이 통일되지 않을 경우 같은 의미를 가진 중복된 데이터 명칭이 혼용될 수 있음
보편성
  • 데이터 명칭은 데이터를 취급하는 관점에서 보편타당하게 인지되어야 함
  • 데이터 명칭 구성 시 업무에서 보편적으로 사용되는 표현을 차용해야 함
충분성
  • 데이터의 명칭은 데이터 개념을 충분히 표현할 수 있도록 구체적이어야 함
  • 처음부터 충분성을 고려하지 않고 명칭을 표준화할 경우 향후 데이터가 다양해질수록 유일성이 위배 될 가능성 증가

데이터 정의[edit | edit source]

  • 데이터가 의미하는 범위 및 자격 요건

데이터 형식[edit | edit source]

  • Numeric
  • Text
  • Date
  • Char
  • Timestamp

데이터 규칙[edit | edit source]

  • 기본 값
  • 허용 값
  • 허용 범위

표준화 구성[edit | edit source]

데이터 표준[edit | edit source]

  • 단어: 금지 단어, 표준 단어
    • 금지 단어: 손님, 휴대폰, 스마트폰
    • 표준 단어: 고객, 핸드폰
    • 단어 사전: 고유코드, 한글명: 고객, 영문명: Customer, 영문 약어명: CUST
  • 용어: 단어의 조합, 조합 규칙
    • 고객 휴대폰 번호 → 고객_핸드폰_번호 → CUST_CPHONE_NO, custCphoneNo
  • 도메인: 용어, 단어의 분류
    • 주소: 고객 주소, 직장 주소, 수령지 주소
    • 연락처: 집전화번호, 핸드폰번호, 팩스번호
  • 코드: 코드 분류, 코드 값
    • 코드 분류: 담보 구분코드
    • 코드 값: 11-주택, 12-토지, 21-자동차, 22-기타기계

데이터 표준 조직[edit | edit source]

  • 전사 데이터 관리자
  • 업무 데이터 관리자
  • 업무 시스템 데이터 관리자

데이터 표준 절차[edit | edit source]

  • 데이터 표준화 요구 사항수집
  • 데이터 표준 정의
  • 데이터 표준 확정
  • 데이터 표준 관리

참고 문헌[edit | edit source]