테이블 인덱스
From IT Wiki
데이터베이스에 저장된 자료를 더욱 빠르게 조회하기 위해 사용
- 일반적으로 인덱스는 테이블 전체 데이터 중 10~15%의 데이터를 처리하는 경우 효율적
- 그 이상의 데이터를 처리할 땐 성능상 오히려 불이익이 있을 수 있음
인덱스 적용
인덱스를 사용하는 경우
- 고유(Unique) 인덱스 일치(Equal) 스캔
- 고유(Unique) 인덱스 범위(Range) 스캔
- 중복(Non-Unique) 인덱스 범위(Range) 스캔
- OR / IN
- NOT BETWEEN
인덱스가 사용되지 않는 경우
- NOT 연산자 사용
- IS NULL, IS NOT NULL
- 옵티마이저 취사 선택
- 인덱스 칼럼의 변형(Suppressing)
- 외부 변형(External Suppressing): 코딩상 적용된 서프레싱
- WHERE SUBSTR(col, 1, 1) = 'C' -- SUBSTR 대신 LIKE를 사용하면 인덱스 사용 가능
- WHERE col1||col2 = 'COL1COL2'
- WHERE TO_CHAR(date, 'YYYYMMDD') -- DATE 타입 칼럼인 경우 TO_DATE 등으로 통일
- WHERE num * 12 > 100000 -- num > 100000/12 로 사용하면 인덱스 사용 가능
- 내부 변형(Internal Suppressing): 데이터베이스 내부에서 이루어지는 서프레싱
- WHERE num1 > num2 + '100' -- 타입 혼합
- WHERE regdate = '20210809'
- 외부 변형(External Suppressing): 코딩상 적용된 서프레싱
인덱스 머지와 결합인덱스
- 인덱스 머지: A칼럼 인덱스와, B칼럼 인덱스가 각각 존재
- A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 두 인덱스를 모두 활용하여 검색
- 결합 인덱스: A칼럼+B칼럼 인덱스
- A칼럼과 B칼럼이 모두 조건으로 사용되는 경우 더 높은 성능을 발휘
- 결합 인덱스를 구성하는 모든 칼럼이 사용되지 않고 첫번째 칼럼만 사용되어도 사용 가능
옵티마이저에 의한 인덱스 선택
- (1단계) 매칭률 = WHERE절 첫번째 칼럼부터 연속하여 값을 '='로 비교하는 칼럼 수 / 인덱스를 구성하는 칼럼 총 개수
- (2단계) 1단계의 매칭률이 같은 경우 인덱스를 구성하는 칼럼의 개수가 많은 경우 선택
- (3단계) 1~2단계가 모두 같은 경우 가장 최근에 선택된 것을 우선 선택
인덱스 선정 고려사항
- 기존 프로그램의 영향도
- 모든 테이블에 대한 Access Path
- 인덱스 칼럼 분포도
- Critical Access Path 및 우선순위
- 인덱스 칼럼의 조합 및 순서
- 인덱스 추가에 대한 DML 속도 저하
- 개별 칼럼의 분포가 좋지 않은 경우에도 결합 인덱스 검토
변경 절차
규모가 있는 기업에서 DBA가 인덱스 변경을 맡아서 수행하는 경우를 상정
- 수요 발생
- 데이터 증가, 조인 조건 변경에 다른 속도 저하
- 개발자의 요청 등
- 인덱스 변경
- 기존 프로그램 동작 영향성 검토
- 인덱스 변경 공지
- 기존 프로그램 변경