이 프로젝트는 빅데이터를 시작하는 개발자를 위한 저장소 입니다. 하둡(Hadoop, 하이브(Hive, 스파크(Spark)를 이용한 기본적인 작업예제를 등록하겠습니다. 하둡, 하이브, 스파크에 대한 기본적인 내용은 다음의 문서를 확인바랍니다.
하둡 맵리듀스 예제를 등록합니다. 기본적인 워드카운트 에제부터 맵리듀스 API를 활용한 예제를 다루어 보겠습니다.
하이브(hive) 쿼리와 UDF 예제를 등록합니다. 하이브를 이용하여 처리할 수 있는 다양한 예제를 다루어 보겠습니다.
스파크 작업 예제를 등록합니다. 스칼라를 이용한 RDD, 데이터셋, 데이터 프레임 작업 예제를 다루어 보겠습니다.