논리적 데이터 웨어하우스 편집하기

IT위키

경고: 로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다. 로그인하거나 계정을 생성하면 편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.

편집을 취소할 수 있습니다. 이 편집을 되돌리려면 아래의 바뀐 내용을 확인한 후 게시해주세요.

최신판 당신의 편집
1번째 줄: 1번째 줄:
[[분류:데이터 과학]]
[[분류:데이터 과학]][[분류:데이터베이스]][[분류:기술사 기출]]
[[분류:데이터베이스]]
[[분류:기술사 기출]]
 
;Logical Data Warehouse; LDW; 로지컬 데이터 웨어하우스
;Logical Data Warehouse; LDW; 로지컬 데이터 웨어하우스
;전사적인 데이터 통합과 정보 분석을 위해 기존의 [[데이터 웨어하우스]]와 [[데이터 마트]], [[데이터 레이크]] 등의 레파지토리와 빅데이터 핵심 기술인 [[하둡]]을 통합해 논리적으로 구성한 데이터 아키텍처
;기존의 [[데이터 웨어하우스]]와 빅데이터의 핵심 기술인 [[하둡]]을 통합해 추상화한 정보 분석 아키텍처
 
* [[가트너]]에서 제시한 개념
*[[가트너]]에서 제시한 개념
* 기존의 [[EDW]]를 포함하는 상위 개념
*기존의 [[EDW]]를 포함하는 상위 개념
* HDW(Hybrid Data Warehouse), HIA(Hybrid Information Architecture) 등으로도 불림
*HDW(Hybrid Data Warehouse), HIA(Hybrid Information Architecture) 등으로도 불림
 
[[파일:논리적 데이터 웨어하우스 개요도.png]]
 
==LDW 등장 배경==
 
*스마트 환경의 도래로 개인들이 생산하는 소셜 정보, 음성, 영상, 이미지 데이터의 폭증
*다양한 내·외부 IoT 데이터를 연계하여 분석할 필요성 대두
*운영 시스템의 기능이 복잡해지고, 활용이 증가함에 따라 IT시스템으로부터 생성되는 데이터 급증
*비용 문제로 기존에 저장하지 못했던 대량의 로그 데이터 등을 저렴하게 저장할 수 있게 됨으로써 이에 대한 활용 요구 증가
*[[공개 소프트웨어|OSS]]의 성숙도가 향상되고, 분산 병렬 처리를 지원하는 다양한 도구들이 출시되면서 손쉽게 대용량 처리를 할 수 있는 기반이 갖추어 짐
 
==LDW 특징==
 
*'''비용 절감''': [[DBMS]]에 저장하기에 비용이 과다한 데이터들은 [[하둡]]을 이용하여 상대적으로 저렴하게 관리
*'''분석의 적시성 확보''': 대용량 데이터의 신속한 분산 병렬 처리를 통한 장시간 소요되던 배치 작업 시간을 단축
*'''데이터 효용성 증대''': 데이터 웨어하우스에서 관리되는 고품질의 정형 데이터들과 비정형 데이터를 결합하여 분석
*'''유연한 인프라 구성''': [[스케일 아웃]]을 통한 선형적인 성능 향상이 가능한 하둡을 활용
 
==기존 DW와의 비교==
{| class="wikitable"
|+
!구분
![[데이터 웨어하우스]]
!논리적 데이터 웨어하우스
|-
|목적
|
* 구성원 분석 역량 강화
* 전사 통합 분석 관점 확보
|
* 정형 및 비정형 통합 분석
* 고급 분석 기반 예측 경영
|-
|데이터 활용
|
* 비즈니스 간 연계분석과 원인분석
* 전사 차원의 마스터 데이터 관리
* 데이터 품질 확보를 위한 관리 체계
|
* 전문 통계 분석 기반 예측 모형
* 비정형, 대규모 등 데이터 범위 확대
* AI분석, EDA 등을 위한 데이터 제공
|-
|사용자
|
* 전 임직원
* 파워 사용자 중심의 비정형 분석
|
* [[데이터 과학자]]
* 분석 과제별로 전문 조직의 출현
|-
|기술
|
* [[비즈니스 인텔리전스|BI]] 및 Analytics
* MPP기반 DW 애플리케이션
* [[데이터 품질 관리|데이터 품질 관리(DQM)]]
* Metadata 관리 도구
|
* [[하둡]] 기반의 빅데이터 처리 기술
* [[머신러닝]], [[딥 러닝]] 등 [[인공지능]]
* 실시간 지능형 관제
* [[데이터 마이닝]], [[소셜 네트워크 마이닝]]
|}
 
== LDW의 구성요소 ==


* '''레파지토리 관리''': 기존의 DB, 데이터 웨어하우스, 데이터 마트, 데이터 레이크 등을 통합 관리
== LDW 등장 배경 ==
* '''데이터 가상화''': 원천 데이터의 위치, 구조 등에 상관없이 가상의 Single View형태로 제공하는 기술
* 스마트 환경의 도래로 개인들이 생산하는 소셜 정보, 음성, 영상, 이미지 데이터의 폭증
* '''분산 처리''': 하둡을 기반으로 통합된 대량 데이터 분석
* 다양한 내·외부 IoT 데이터를 연계하여 분석할 필요성 대두
* '''[[메타데이터]] 관리''': 다양한 데이터 레파지토리 상의 수많은 데이터를 관리하기 위한 메타데이터 관리
* 운영 시스템의 기능이 복잡해지고, 활용이 증가함에 따라 IT시스템으로부터 생성되는 데이터 급증
* '''[[온톨로지]]''': 연관된 데이터들을 결합해서 분석하기 위해 필요한 데이터 간 연관 정보, 데이터 집합에 대한 분류 체계
* 각종 시스템으로부터 발생되는 대량의 로그성 데이터들을 저장하기에는 비용이 많이 필요하였으나, 저가의 디스크를 이용한 저장이 가능해지면서, 과거에는 활용하지 못하던 로그성 데이터들에 대한 활용 요구 증가
* '''감사 및 성능 관리''': 데이터 원천으로 부터 추출하여 최종 목적인 분석까지 하기 위한 과정 분석 및 성능 개선
* OSS(Open Source Software)의 성숙도가 향상되고, 분산 병렬 처리를 지원하는 다양한 소프트웨어들이 출시되면서 저렴한 비용으로 대용량 처리를 할 수 있는 기반이 갖추어짐
* '''[[SLA]] &''' '''[[SLM]]''': 실제 사용자들의 업무 만족도, 효율성을 기반으로 서비스 수준 유지 및 개선


==기술사 기출==
== LDW 특징 ==
* '''비용 절감''': DBMS에 저장하기에 비용이 과다한 데이터들은 오픈소스 기반의 Hadoop을 이용하여 상대적으로 저렴하게 관리가 가능하며, 하드웨어·소프트웨어 증설에 따른 비용 절감 가능
* '''분석의 적시성 확보''': 대용량 데이터의 신속한 분산 병렬 처리를 통한 장시간 소요되던 배치 작업 시간을 단축하여 분석에 필요한 데이터들의 적시 제공 가능
* '''데이터 효용성 증대''': 데이터 웨어하우스에서 관리되는 고품질의 정형 데이터들과 비정형 데이터를 결합하여 분석이 가능함에 따라 데이터의 효용성 증대
* '''Scale-Out이 가능한 인프라 구성''': 하둡 기반의 빅데이터 시스템들은 Scale-out을 통한 선형적인 성능 향상이 가능, LDW는 이런 오픈소스 기반의 기술을 활용하여 성능 확보 가능


*정보관리기술사 121회 2교시
== 기존 DW와의 비교 ==


==같이 보기==


*[[데이터 웨어하우스]]
== 기술사 기출 ==
*[[기업 데이터 웨어하우스]]
* 정보관리기술사 121회 2교시
*[[논리적 데이터 웨어하우스]]


==참고 문헌==
== 같이 보기 ==
* [[데이터 웨어하우스]]
* [[기업 데이터 웨어하우스]]
* [[논리적 데이터 웨어하우스]]


*[https://blog.lgcns.com/1775 LG CNS 기술 블로그]
== 참고 문헌 ==
* [https://blog.lgcns.com/1775 LG CNS 기술 블로그]
IT위키에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는 IT위키:저작권 문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다. 저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소 편집 도움말 (새 창에서 열림)