논리적 데이터 웨어하우스: 두 판 사이의 차이

IT위키
(새 문서: 분류:데이터 과학분류:데이터베이스분류:기술사 기출 ;Logical Data Warehouse; LDW; 로지컬 데이터 웨어하우스 ;기존의 데이터 웨어하...)
 
편집 요약 없음
2번째 줄: 2번째 줄:
;Logical Data Warehouse; LDW; 로지컬 데이터 웨어하우스
;Logical Data Warehouse; LDW; 로지컬 데이터 웨어하우스
;기존의 [[데이터 웨어하우스]]와 빅데이터의 핵심 기술인 [[하둡]]을 통합해 추상화한 정보 분석 아키텍처
;기존의 [[데이터 웨어하우스]]와 빅데이터의 핵심 기술인 [[하둡]]을 통합해 추상화한 정보 분석 아키텍처
* [[가트너]]에서 제시한 개념
* 기존의 [[EDW]]를 포함하는 상위 개념
* HDW(Hybrid Data Warehouse), HIA(Hybrid Information Architecture) 등으로도 불림
== LDW 등장 배경 ==
* 스마트 환경의 도래로 개인들이 생산하는 소셜 정보, 음성, 영상, 이미지 데이터의 폭증
* 다양한 내·외부 IoT 데이터를 연계하여 분석할 필요성 대두
* 운영 시스템의 기능이 복잡해지고, 활용이 증가함에 따라 IT시스템으로부터 생성되는 데이터 급증
* 각종 시스템으로부터 발생되는 대량의 로그성 데이터들을 저장하기에는 비용이 많이 필요하였으나, 저가의 디스크를 이용한 저장이 가능해지면서, 과거에는 활용하지 못하던 로그성 데이터들에 대한 활용 요구 증가
* OSS(Open Source Software)의 성숙도가 향상되고, 분산 병렬 처리를 지원하는 다양한 소프트웨어들이 출시되면서 저렴한 비용으로 대용량 처리를 할 수 있는 기반이 갖추어짐
== LDW 특징 ==
* '''비용 절감''': DBMS에 저장하기에 비용이 과다한 데이터들은 오픈소스 기반의 Hadoop을 이용하여 상대적으로 저렴하게 관리가 가능하며, 하드웨어·소프트웨어 증설에 따른 비용 절감 가능
* '''분석의 적시성 확보''': 대용량 데이터의 신속한 분산 병렬 처리를 통한 장시간 소요되던 배치 작업 시간을 단축하여 분석에 필요한 데이터들의 적시 제공 가능
* '''데이터 효용성 증대''': 데이터 웨어하우스에서 관리되는 고품질의 정형 데이터들과 비정형 데이터를 결합하여 분석이 가능함에 따라 데이터의 효용성 증대
* '''Scale-Out이 가능한 인프라 구성''': 하둡 기반의 빅데이터 시스템들은 Scale-out을 통한 선형적인 성능 향상이 가능, LDW는 이런 오픈소스 기반의 기술을 활용하여 성능 확보 가능
== 기존 DW와의 비교 ==


== 기술사 기출 ==
== 기술사 기출 ==
* 정보관리기술사 121회
* 정보관리기술사 121회 2교시


== 같이 보기 ==
== 같이 보기 ==
10번째 줄: 29번째 줄:
* [[기업 데이터 웨어하우스]]
* [[기업 데이터 웨어하우스]]
* [[논리적 데이터 웨어하우스]]
* [[논리적 데이터 웨어하우스]]
== 참고 문헌 ==
* [https://blog.lgcns.com/1775 LG CNS 기술 블로그]

2020년 5월 10일 (일) 23:01 판

Logical Data Warehouse; LDW; 로지컬 데이터 웨어하우스
기존의 데이터 웨어하우스와 빅데이터의 핵심 기술인 하둡을 통합해 추상화한 정보 분석 아키텍처
  • 가트너에서 제시한 개념
  • 기존의 EDW를 포함하는 상위 개념
  • HDW(Hybrid Data Warehouse), HIA(Hybrid Information Architecture) 등으로도 불림

LDW 등장 배경

  • 스마트 환경의 도래로 개인들이 생산하는 소셜 정보, 음성, 영상, 이미지 데이터의 폭증
  • 다양한 내·외부 IoT 데이터를 연계하여 분석할 필요성 대두
  • 운영 시스템의 기능이 복잡해지고, 활용이 증가함에 따라 IT시스템으로부터 생성되는 데이터 급증
  • 각종 시스템으로부터 발생되는 대량의 로그성 데이터들을 저장하기에는 비용이 많이 필요하였으나, 저가의 디스크를 이용한 저장이 가능해지면서, 과거에는 활용하지 못하던 로그성 데이터들에 대한 활용 요구 증가
  • OSS(Open Source Software)의 성숙도가 향상되고, 분산 병렬 처리를 지원하는 다양한 소프트웨어들이 출시되면서 저렴한 비용으로 대용량 처리를 할 수 있는 기반이 갖추어짐

LDW 특징

  • 비용 절감: DBMS에 저장하기에 비용이 과다한 데이터들은 오픈소스 기반의 Hadoop을 이용하여 상대적으로 저렴하게 관리가 가능하며, 하드웨어·소프트웨어 증설에 따른 비용 절감 가능
  • 분석의 적시성 확보: 대용량 데이터의 신속한 분산 병렬 처리를 통한 장시간 소요되던 배치 작업 시간을 단축하여 분석에 필요한 데이터들의 적시 제공 가능
  • 데이터 효용성 증대: 데이터 웨어하우스에서 관리되는 고품질의 정형 데이터들과 비정형 데이터를 결합하여 분석이 가능함에 따라 데이터의 효용성 증대
  • Scale-Out이 가능한 인프라 구성: 하둡 기반의 빅데이터 시스템들은 Scale-out을 통한 선형적인 성능 향상이 가능, LDW는 이런 오픈소스 기반의 기술을 활용하여 성능 확보 가능

기존 DW와의 비교

기술사 기출

  • 정보관리기술사 121회 2교시

같이 보기

참고 문헌