하둡 분산 파일 시스템: 두 판 사이의 차이

2020년 5월 7일 (목) 00:15 판

Hadoop Distributed File System

동작 절차

클라이언트로부터 특정 파일에 대한 요구 전달
네임노드에서 해당 파일을 보관하고 있는 블록 정보 탐색
실제 데이터가 보관되어 있는 데이터노드 위치 파악
데이터노드에서 파일 처리

구성요소

네임노드

Namenode; 마스터 노드

메타 데이터만 보관하고, 실제 데이터는 저장하지 않음

데이터노드

Datanode; 슬레이브 노드

실제 데이터를 보관하는 노드
64MB, 128MB 등의 블록 단위로 데이터 저장

고가용성

결함 허용, 성능 향상을 위해 데이터와 노드 다중 구성

네임노드 이중화

클러스터에 2개의 네임노드 구축
Active-Standby로 운영
무중단 시스템 보장

데이터 복제

데이터를 기본 3 Copy Replication 형성
신뢰성 보장: 하나의 노드, 데이터가 손실되어도 무중단 동작 보장
성능 향상: 데이터의 지역성을 향상시켜 빠른 처리 도모

2020년 3월 8일 (일) 16:26 판 (편집) Itwiki (토론 \| 기여) 잔글 (문자열 찾아 바꾸기 - "분류:데이터 분석" 문자열을 "분류:데이터/통계학" 문자열로) ← 이전 편집		2020년 5월 7일 (목) 00:15 판 (편집) (편집 취소) Itwiki (토론 \| 기여) 잔글 (문자열 찾아 바꾸기 - "분류:데이터/통계학" 문자열을 "분류:데이터 과학" 문자열로) 다음 편집 →
1번째 줄:		1번째 줄:
	[[분류:데이터베이스]][[분류:데이터~~/통계학~~]]		[[분류:데이터베이스]][[분류:데이터 과학]]
	;Hadoop Distributed File System		;Hadoop Distributed File System

익명 사용자

검색

하둡 분산 파일 시스템: 두 판 사이의 차이

이름공간

더 보기

문서 행위

2020년 5월 7일 (목) 00:15 판

목차

동작 절차

구성요소

네임노드

데이터노드

고가용성

네임노드 이중화

데이터 복제

둘러보기

둘러보기

분류별 보기

광고

위키 도구

위키 도구

익명 사용자

검색

하둡 분산 파일 시스템: 두 판 사이의 차이

2020년 5월 7일 (목) 00:15 판

동작 절차

구성요소

네임노드

데이터노드

고가용성

네임노드 이중화

데이터 복제

둘러보기

위키 도구

문서 도구

분류 목록