익명 사용자
로그인하지 않음
토론
기여
계정 만들기
로그인
IT 위키
검색
아파치 하이브 테이블
편집하기
IT 위키
이름공간
문서
토론
더 보기
더 보기
문서 행위
읽기
편집
원본 편집
역사
경고:
로그인하지 않았습니다. 편집을 하면 IP 주소가 공개되게 됩니다.
로그인
하거나
계정을 생성하면
편집자가 사용자 이름으로 기록되고, 다른 장점도 있습니다.
스팸 방지 검사입니다. 이것을 입력하지
마세요
!
고급
특수 문자
도움말
문단 제목
2단계
3단계
4단계
5단계
형식
넣기
라틴 문자
확장 라틴 문자
IPA 문자
기호
그리스 문자
그리스어 확장
키릴 문자
아랍 문자
아랍어 확장
히브리 문자
뱅골어
타밀어
텔루구어 문자
싱할라 문자
데바나가리어
구자라트 문자
태국어
라오어
크메르어
캐나다 원주민 언어
룬 문자
Á
á
À
à
Â
â
Ä
ä
Ã
ã
Ǎ
ǎ
Ā
ā
Ă
ă
Ą
ą
Å
å
Ć
ć
Ĉ
ĉ
Ç
ç
Č
č
Ċ
ċ
Đ
đ
Ď
ď
É
é
È
è
Ê
ê
Ë
ë
Ě
ě
Ē
ē
Ĕ
ĕ
Ė
ė
Ę
ę
Ĝ
ĝ
Ģ
ģ
Ğ
ğ
Ġ
ġ
Ĥ
ĥ
Ħ
ħ
Í
í
Ì
ì
Î
î
Ï
ï
Ĩ
ĩ
Ǐ
ǐ
Ī
ī
Ĭ
ĭ
İ
ı
Į
į
Ĵ
ĵ
Ķ
ķ
Ĺ
ĺ
Ļ
ļ
Ľ
ľ
Ł
ł
Ń
ń
Ñ
ñ
Ņ
ņ
Ň
ň
Ó
ó
Ò
ò
Ô
ô
Ö
ö
Õ
õ
Ǒ
ǒ
Ō
ō
Ŏ
ŏ
Ǫ
ǫ
Ő
ő
Ŕ
ŕ
Ŗ
ŗ
Ř
ř
Ś
ś
Ŝ
ŝ
Ş
ş
Š
š
Ș
ș
Ț
ț
Ť
ť
Ú
ú
Ù
ù
Û
û
Ü
ü
Ũ
ũ
Ů
ů
Ǔ
ǔ
Ū
ū
ǖ
ǘ
ǚ
ǜ
Ŭ
ŭ
Ų
ų
Ű
ű
Ŵ
ŵ
Ý
ý
Ŷ
ŷ
Ÿ
ÿ
Ȳ
ȳ
Ź
ź
Ž
ž
Ż
ż
Æ
æ
Ǣ
ǣ
Ø
ø
Œ
œ
ß
Ð
ð
Þ
þ
Ə
ə
서식 지정
링크
문단 제목
목록
파일
각주
토론
설명
입력하는 내용
문서에 나오는 결과
기울임꼴
''기울인 글씨''
기울인 글씨
굵게
'''굵은 글씨'''
굵은 글씨
굵고 기울인 글씨
'''''굵고 기울인 글씨'''''
굵고 기울인 글씨
Apache Hive의 테이블(Table)은 데이터 웨어하우스 내에서 데이터를 저장하고 관리하는 기본 단위이다. Hive는 관계형 데이터베이스처럼 테이블을 지원하며, 다양한 저장 형식과 파티션 기능을 제공하여 대규모 데이터를 효율적으로 관리할 수 있다. ==개요== Hive 테이블은 HDFS(Hadoop Distributed File System)에 저장된 데이터를 논리적으로 표현하며, 사용자는 HiveQL을 사용하여 데이터를 질의하고 조작할 수 있다. Hive는 테이블을 관리형(Managed)과 외부(External) 테이블로 구분하며, 데이터 저장 형식과 파티션, 버킷 기능 등을 활용할 수 있다. ==Hive 테이블의 종류== Hive는 데이터 저장 방식에 따라 두 가지 유형의 테이블을 제공한다. *'''관리형 테이블(Managed Table)''' **Hive가 데이터 파일을 직접 관리하며, 테이블 삭제 시 데이터도 삭제됨. *'''외부 테이블(External Table)''' **데이터는 외부 저장소에 존재하며, 테이블 삭제 시 데이터는 유지됨. ===관리형 테이블=== <syntaxhighlight lang="sql"> CREATE TABLE employees ( id INT, name STRING, department STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ',' STORED AS TEXTFILE; </syntaxhighlight> *데이터는 Hive의 기본 데이터 저장소(HDFS) 내부에 저장됨. *테이블을 삭제(DROP)하면 데이터도 함께 삭제됨. ===외부 테이블=== <syntaxhighlight lang="sql"> CREATE EXTERNAL TABLE sales ( order_id INT, amount DOUBLE, date STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS TEXTFILE LOCATION '/user/hive/external/sales_data'; </syntaxhighlight> *데이터는 지정된 외부 경로(HDFS, S3 등)에 저장됨. *테이블을 삭제해도 데이터는 유지됨. ==Hive 메타데이터(Metadata)== Hive는 테이블 및 데이터의 구조 정보를 메타스토어(Metastore)에 저장하며, 이 메타데이터는 테이블의 구조와 속성을 관리하는 역할을 한다. *'''테이블 스키마''' - 테이블의 컬럼명, 데이터 타입, 파티션 정보 저장. *'''스토리지 위치''' - 데이터 파일이 저장된 HDFS 경로. *'''파티션 정보''' - 테이블이 파티션을 포함할 경우 파티션별 메타데이터 저장. *'''버킷 정보''' - 데이터가 특정 컬럼 기준으로 버킷화된 경우 버킷 개수 저장. *'''파일 형식''' - TEXTFILE, ORC, PARQUET 등 저장 형식 정보. Hive 메타데이터는 일반적으로 관계형 데이터베이스(MySQL, PostgreSQL)에서 관리되며, Hive의 성능 최적화 및 테이블 관리를 담당한다. ==파티션 테이블(Partitioned Table)== Hive는 데이터를 특정 컬럼을 기준으로 나누어 저장하는 파티션(Partition) 기능을 제공하여 성능을 최적화한다.<syntaxhighlight lang="sql"> CREATE TABLE logs ( event STRING, timestamp STRING ) PARTITIONED BY (date STRING) STORED AS PARQUET; </syntaxhighlight> *'''파티션 생성 및 데이터 추가''' <syntaxhighlight lang="sql"> ALTER TABLE logs ADD PARTITION (date='2023-01-01') LOCATION '/data/logs/2023-01-01'; </syntaxhighlight> ==버킷 테이블(Bucketed Table)== 버킷(Bucket)은 테이블 데이터를 해시 함수 기반으로 나누어 저장하여 성능을 향상시키는 기법이다.<syntaxhighlight lang="sql"> CREATE TABLE users ( id INT, name STRING ) CLUSTERED BY (id) INTO 4 BUCKETS; </syntaxhighlight> *버킷을 사용하면 특정 컬럼(id)에 따라 데이터를 4개의 파일로 나눠 저장하여 성능을 향상시킴. ==테이블 데이터 조작== ===데이터 삽입=== <syntaxhighlight lang="sql"> INSERT INTO TABLE employees VALUES (1, 'Alice', 'HR'), (2, 'Bob', 'IT'); </syntaxhighlight> ===데이터 조회=== <syntaxhighlight lang="sql"> SELECT * FROM employees WHERE department = 'IT'; </syntaxhighlight> ===테이블 삭제=== <syntaxhighlight lang="sql"> DROP TABLE employees; -- 관리형 테이블은 데이터까지 삭제됨. DROP TABLE IF EXISTS sales; -- 외부 테이블의 경우 메타데이터만 삭제됨. </syntaxhighlight> ==Hive 테이블의 특징== *HDFS 기반으로 대용량 데이터를 저장 및 관리. *스키마 온 리드(Schema-on-Read) 방식으로 데이터를 읽을 때 스키마 적용. *다양한 저장 형식 지원(TEXTFILE, ORC, PARQUET, AVRO 등). *파티션과 버킷 기능을 사용하여 성능 최적화 가능. *테이블 정보는 메타스토어(Metastore)에 저장되어 빠른 데이터 탐색이 가능. ==같이 보기== *[[아파치 하이브]] *[[아파치 하둡]] *[[SQL]] *[[빅데이터 저장소]]
요약:
IT 위키에서의 모든 기여는 크리에이티브 커먼즈 저작자표시-비영리-동일조건변경허락 라이선스로 배포된다는 점을 유의해 주세요(자세한 내용에 대해서는
IT 위키:저작권
문서를 읽어주세요). 만약 여기에 동의하지 않는다면 문서를 저장하지 말아 주세요.
또한, 직접 작성했거나 퍼블릭 도메인과 같은 자유 문서에서 가져왔다는 것을 보증해야 합니다.
저작권이 있는 내용을 허가 없이 저장하지 마세요!
취소
편집 도움말
(새 창에서 열림)
둘러보기
둘러보기
대문
최근 바뀜
광고
위키 도구
위키 도구
특수 문서 목록
문서 도구
문서 도구
사용자 문서 도구
더 보기
여기를 가리키는 문서
가리키는 글의 최근 바뀜
문서 정보
문서 기록