본문 바로가기

Hadoop

hive 설치 및 구동

 

 

####

## hive설치

# 공유폴더로 이동

sf

 

# 미리 다운 받아놓은 hive압축을 풀어준다.

tar xzvfp hive.tar.gz

 

# 압축을 푼 hive폴더를 /usr/local 로 옮긴다

# 나는 여태까지 java와 hadoop폴더는 local에 vmwaretool은 /usr/local/src에 두었다.

mv hive /usr/local

 

# local폴더로 이동

loc

 

# 하이브 폴더의 링크설정을 한다.

ln -s hive hive

 

#hive의 환경변수 설정을 한다.

vi /etc/profile

export HIVE_HOME=/usr/local/hive

export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HIVE_HOME/src/bin:$PATH

 

# 설정한 환경변수를 알수 있게끔 실행한다.

source /etc/profile

 

# hive폴더로 이동해서 hive아래에 src폴더 밑에 conf폴더로 들어가면 

#hive-env.sh.template 파일과 hive-default.xml.template파일에 template라는 말을 뗀다

mv hive-env.sh.template hive-env.sh

mv hive-default.xml.template hive-default.xml

 

##data 가 있는 폴더안에서 hive라는 명령어로  hive 실행

##나는 여태까지의 data를 공유폴더안에 Data라는 폴더 안에 저장해 두었다

sf

cd Data

####이제 hive실행

hive

### 명령 프롬프트가 hive>로 변함

##비행기 정보를 담을 테이블 airdelay테이블 생성

###붙여넣기~

create table airdelay(
Year INT,
Month INT,
DayofMonth INT,
DayOfWeek INT,
DepTime INT,
CRSDepTime INT,
ArrTime INT,
CRSArrTime INT,
UniqueCarrier STRING,
FlightNum INT,
TailNum STRING,
ActualElapsedTime INT,
CRSElapsedTime INT,
AirTime INT,
ArrDelay INT,
DepDelay  INT,
Origin STRING,
Dest STRING,
Distance INT,
TaxiIn INT,
TaxiOut INT,
Cancelled  INT,
CancellationCode STRING COMMENT 'A=carrier, B=weather,C=NAS,D=security',
Diverted INT COMMENT '1=yes,0=no',
CarrierDelay STRING,
WeatherDelay STRING,
LateAircraftDelay STRING)
Partitioned by (DelayYear INT)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

#테이블에  데이터를 로드시킨다.

load data local inpath '1999.csv'

overwrite into table airdelay

partition(delayYear=1999);

 

 

##이제 테이블에서 데이터를 검색하여 사용하기 가능

## sql문으로 데이터를 뽑아 원하는 시나리오에서 사용할 수 있다.

select

from

where

group by

order by

 

##having 못쓰지만 쓸수 있음

 

'Hadoop' 카테고리의 다른 글

가상 서버 안의 Hive에서 검색한 테이블을 외부로 가져오기  (0) 2022.11.23
하둡 wordcount  (0) 2022.11.23
리눅스 설치  (0) 2022.11.22
하둡 설치  (0) 2022.11.21
리눅스에서 SSH설정  (0) 2022.11.21