맵리듀스: 두 판 사이의 차이
IT위키
(차이 없음)
|
2020년 1월 2일 (목) 20:50 판
- MapReduce
- 다수의 머신들로 구성한 분산 데이터베이스를 병렬로 처리하기 위한 프로그래밍 모델
- 구글에서 처음으로 개념 소개
- 하둡 프레임워크에서 활용
구성/절차
- 맵(Map) 작업과 리듀스(Reduce) 작업으로 구성
맵
- 분산된 데이터를 Key-Value로 모은다
셔플
- 중간 결과를 리듀스로 전달한다.
리듀스
- 리스트에서 원하는 데이터를 찾아서 집계