데이터 웨어하우스: 두 판 사이의 차이

IT위키
(새 문서: 분류:데이터베이스분류:기술사 기출 ;DW; Data Warehouse ;기업의 정보분석 요구를 충족시키기 위해 분석, 가공된 데이터를 저장 및 관리...)
 
편집 요약 없음
 
(사용자 3명의 중간 판 3개는 보이지 않습니다)
1번째 줄: 1번째 줄:
[[분류:데이터베이스]][[분류:기술사 기출]]
[[분류:데이터베이스]]
[[분류:기술사 기출]]
 
;DW; Data Warehouse
;DW; Data Warehouse
;기업의 정보분석 요구를 충족시키기 위해 분석, 가공된 데이터를 저장 및 관리하는 기술
;기업의 정보분석 요구를 충족시키기 위해 분석, 가공된 데이터를 저장 및 관리하는 기술


== DW의 특징 ==
==DW의 특징==
* 주제 중심: 분석하고자 하는 주제를 중심으로 데이터를 구성
{| class="wikitable"
* 시간 중심: 시간에 따른 변경 사항을 지속 기록
|-
* 비휘발성: 한번 적재된 데이터는 변경/삭제되지 않고 읽기전용으로 사용됨
!특징!!설명
|-
|'''주제 중심적'''
'''(Subject Oriented)'''
||
*분석하고자 하는 주제를 중심으로 데이터를 구성
*특정 업무 기능이나 응용 프로그램에 종속되지 않는 데이터 구조를 지원
|-
|'''통합 구조'''
'''(Integrated)'''
||
*업무 기능별로 관리되는 다수의 운영 데이터를 통합하여 전사적 관점에서 중복을 최소화
*데이터의 정합성과 물리적 통일성을 갖는 통합된 데이터 구조를 지원
*전사적인 [[데이터 표준화]]를 통해 데이터 통일성(속성 이름, 데이터 표현, 계산 단위 등) 확보
*데이터 획득 시 데이터 통합을 위한 일련의 변환 작업을 수행
|-
|'''시계열 데이터'''
'''(Time Variant)'''
||
*오랜 기간 축적된 데이터를 통해 과거와 현재의 경향 분석 가능
*일정 기간 동안의 업무 변화 내지는 발전의 추세 분석에 필요
*이력 데이터를 통해 시간 경과에 따른 데이터의 변화 과정 파악
*스냅샷 생성
**키 구조에 시간 요소를 추가하여 레코드 생성
**이벤트 발생 시점의 일자 또는 시간 저장
|-
|'''비휘발성'''
'''(Non Volatile)'''
||
*초기 데이터 적재 이후에는 데이터의 갱신·삭제 없이 검색·조회만 수행
*데이터 변경이 발생하더라도 변경을 직접 반영하지 않고 스냅샷 형태로 반영
*장애 발생 시 데이터의 복구, 트랜잭션과 데이터의 무결성 유지, 교착상태의 탐지·대응이 매우 단순
*데이터 갱신 이상에 대한 고려가 불필요하고, 정규화 및 반정규화에 대한 융통성의 증가
|}
 
==기반 기술==
 
;데이터 웨어하우스를 구현하기 위한 기술
 
*[[ETL]]: DW에 저장할 데이터를 추출, 전송, 저장하는 엔진
*[[ODS]]: 데이터가 DW에 저장되기 전에 가공을 위해 임시로 저장되는 저장소
*[[CEP]]: 복잡한 실시간 데이터로부터 필요한 데이터를 추출하기 위한 프로세싱 기술
*[[CDC]]: 변경된 데이터를 캡쳐해 타겟 시스템으로 전송하는 기술
 
==활용 기술==
 
;데이터 웨어하우스를 사용하는 기술
 
*[[OLAP]]: DW를 기반으로 데이터를 분석하고 활용하기 위한 프로세싱
*[[비즈니스 인텔리전스]]: 기업 내 데이터를 취합 및 분석하여 인사이트 도출
*[[데이터 마트]]: 주로 DW를 기반으로 DM이 만들어짐. 구현 형태에 따라 반대로 될 수도 있음
 
== 기술사 기출 ==
 
* [http://q.fran.kr/문제/6174 정보관리기술사 69회 1교시]
* [http://q.fran.kr/문제/6275 정보관리기술사 74회 2교시]
* [http://q.fran.kr/문제/5430 정보관리기술사 114회 3교시]
* [http://q.fran.kr/문제/9652 정보관리기술사 118회 3교시]
 
== 같이 보기 ==
 
* [[기업 데이터 웨어하우스]]
* [[논리적 데이터 웨어하우스]]
* [[데이터베이스 다차원 모델링]]
* [[데이터 레이크]]

2020년 5월 10일 (일) 20:41 기준 최신판


DW; Data Warehouse
기업의 정보분석 요구를 충족시키기 위해 분석, 가공된 데이터를 저장 및 관리하는 기술

DW의 특징[편집 | 원본 편집]

특징 설명
주제 중심적

(Subject Oriented)

  • 분석하고자 하는 주제를 중심으로 데이터를 구성
  • 특정 업무 기능이나 응용 프로그램에 종속되지 않는 데이터 구조를 지원
통합 구조

(Integrated)

  • 업무 기능별로 관리되는 다수의 운영 데이터를 통합하여 전사적 관점에서 중복을 최소화
  • 데이터의 정합성과 물리적 통일성을 갖는 통합된 데이터 구조를 지원
  • 전사적인 데이터 표준화를 통해 데이터 통일성(속성 이름, 데이터 표현, 계산 단위 등) 확보
  • 데이터 획득 시 데이터 통합을 위한 일련의 변환 작업을 수행
시계열 데이터

(Time Variant)

  • 오랜 기간 축적된 데이터를 통해 과거와 현재의 경향 분석 가능
  • 일정 기간 동안의 업무 변화 내지는 발전의 추세 분석에 필요
  • 이력 데이터를 통해 시간 경과에 따른 데이터의 변화 과정 파악
  • 스냅샷 생성
    • 키 구조에 시간 요소를 추가하여 레코드 생성
    • 이벤트 발생 시점의 일자 또는 시간 저장
비휘발성

(Non Volatile)

  • 초기 데이터 적재 이후에는 데이터의 갱신·삭제 없이 검색·조회만 수행
  • 데이터 변경이 발생하더라도 변경을 직접 반영하지 않고 스냅샷 형태로 반영
  • 장애 발생 시 데이터의 복구, 트랜잭션과 데이터의 무결성 유지, 교착상태의 탐지·대응이 매우 단순
  • 데이터 갱신 이상에 대한 고려가 불필요하고, 정규화 및 반정규화에 대한 융통성의 증가

기반 기술[편집 | 원본 편집]

데이터 웨어하우스를 구현하기 위한 기술
  • ETL: DW에 저장할 데이터를 추출, 전송, 저장하는 엔진
  • ODS: 데이터가 DW에 저장되기 전에 가공을 위해 임시로 저장되는 저장소
  • CEP: 복잡한 실시간 데이터로부터 필요한 데이터를 추출하기 위한 프로세싱 기술
  • CDC: 변경된 데이터를 캡쳐해 타겟 시스템으로 전송하는 기술

활용 기술[편집 | 원본 편집]

데이터 웨어하우스를 사용하는 기술
  • OLAP: DW를 기반으로 데이터를 분석하고 활용하기 위한 프로세싱
  • 비즈니스 인텔리전스: 기업 내 데이터를 취합 및 분석하여 인사이트 도출
  • 데이터 마트: 주로 DW를 기반으로 DM이 만들어짐. 구현 형태에 따라 반대로 될 수도 있음

기술사 기출[편집 | 원본 편집]

같이 보기[편집 | 원본 편집]