[자격증]/정보처리기사 필기

MapReduce

Ben의 프로그램 2023. 7. 7. 09:04
728x90

- 대용량 데이터를 분산 처리하기 위한 목적으로 개발된 프로그래밍 모델이다.

- Google 에 의해 고안된 기술로써 대표적인 대용량 데이터 처리를 위한 병렬 처리 기법을 제공한다

- 임의의 순서로 정렬된 데이터를 분산 처리하고 이를 다시 합치는 과정을 거친다.  

- 데이터가 텍스트 형태로 입력되면 64KB 분할한다. 텍스트 안에 단어를 분류하여 카운트한다.