HiveQL 명령어(feat. Hive shell)

Hadoop

집못가는프로그래머 2021. 9. 9. 14:46

*Hive로 접속하는 법은 간단하게 터미널에 hive 입력

1. show databases;

데이터베이스 출력

2. create database userdb;

userdb라는 데이터베이스 생성

3. use userdb;

위에서 만든 userdb 데이터베이스를 사용 선언

테이블 안의 컬럼 : eid(int), name(str), salary(string), destination(string)

'no_auto_compaction' = 'true' 안해주면 입출력할때 에러가 생김

5. show tables;

테이블 리스트를 보여준다

6. LOAD DATA LOCAL INPATH 'employee.csv' OVERWRITE INTO TABLE employee;

employee테이블에 로컬 파일의 employee.csv 내용을 읽어온다

7. select * from employee;

employee 테이블의 모든 내용을 출력한다

8. exit;

Hive 종료

9. 읽어온 데이터가 어디에 저장되어있는지 확인해보자

hdfs dfs -ls -R /user/hive/

10.

다시 hive로 들어간다

use userdb; 로 데이터 베이스를 선택하고

아까 만들었던 테이블에 대한 간단한 작업을 실행해보자

select avg(salary) from employee; < employee 테이블의 salary 컬럼에 대한 평균(avg)를 구해서 출력한다.

위의 작업으로 Hive가 Mapper와 Reducer를 자동으로 만들고 원하는 결과를 출력해준다.