하둡 wordcount

#하둡켜기

hadoop namenode -format

start-all.sh

#하둡 폴더로 이동하기

cd hadoop

#하둡 파일 시스템의 목록보기

hadoop fs -lsr /

#하둡에서 wordcount를 수행한 파일을 저장할 폴더를 생성한다.

hadoop fs -mkdir input

#input폴더에 wordcount할 txt파일을 넣는다

hadoop fs -put CHANGES.txt /user/root/input

#wordcount를 할 때 사용할 jar파일을 확인한다.

#hadoop-examples-1.0.4.jar파일을 이용해서 wordcount를 수행한 결과물을 out1이라는 폴더에 저장한다.

hadoop jar hadoop-examples-1.0.4.jar wordcount /user/root/input/CHANGES.txt out1

#하둡파일시스템에 폴더를 확인한다.

hadoop fs -lsr /

#여기에 part-r-00000파일이 wordcount의 결과물이다.

#이를 가상서버와 윈도우 사이의 공유폴더에 저장한다. kk.txt파일로

hadoop fs -cat /user/root/out1/part-r-00000>>/mnt/hgfs/temp/kk.txt

#윈도우의 temp폴더에 들어가면 kk.txt파일이 존재한다.

가상 서버 안의 Hive에서 검색한 테이블을 외부로 가져오기 (0)	2022.11.23
hive 설치 및 구동 (0)	2022.11.22
리눅스 설치 (0)	2022.11.22
하둡 설치 (0)	2022.11.21
리눅스에서 SSH설정 (0)	2022.11.21

개발자가 되어주마!