범퍼카 토토 PostgreSQL : Documentation→젠 토토 : 문서 : 8

지원되는 버전:메이저 토토 사이트 PostgreSQL : 문서 : 17 : 5.12. 테이블 파티셔닝 (토토 핫 PostgreSQL : 문서 : 18 : 5.12. 테이블 파티셔닝) / 토토 꽁 머니 PostgreSQL : 문서 : 17 : 5.12. 테이블 파티셔닝 / 배트맨 토토 PostgreSQL : 문서 : 16 : 5.11. 테이블 파티셔닝 / 범퍼카 토토 PostgreSQL : 문서 : 15 : 5.11. 테이블 파티셔닝 / 토토 PostgreSQL : 문서 : 14 : 5.11. 테이블 파티셔닝 / 사설 토토 사이트 PostgreSQL : 문서 : 13 : 5.11. 테이블 파티셔닝

개발 버전:개발

지원되지 않는 버전:12 / 11 / 10 / 9.6 / 9.5 / 9.4 / 9.3 / 9.2 / 9.1 / 9.0 / 8.4 / 8.3 / 8.2 / 8.1

이 문서는 지원되지 않는 PostgreSQL 버전에 대한 것입니다.
당신은 다음과 같은 페이지를 보고 싶을 수도 있습니다.메이저 토토 사이트 PostgreSQL : 문서 : 17 : 5.12. 테이블 파티셔닝버전 또는 위에 나열된 다른 지원 버전 중 하나를 사용하세요.

포스트그레SQL 8.2.23 문서
이전	빠르게 뒤로	5장. 데이터 정의	빨리 감기	다음

5.9. 토토 핫셔닝

포스트그레SQL기본 지원 테이블 파티셔닝. 이 섹션에서는 이유와 방법을 설명합니다. 데이터베이스 설계의 일부로 분할을 구현합니다.

5.9.1. 개요

파티셔닝은 논리적으로 하나의 큰 것을 분할하는 것을 의미합니다. 테이블을 더 작은 물리적 조각으로 나눕니다. 파티셔닝은 다음을 제공할 수 있습니다. 여러 가지 이점:

쿼리 성능은 다음에서 크게 향상될 수 있습니다. 특정 상황, 특히 대부분의 경우 테이블의 액세스된 행이 단일 파티션에 있거나 파티션 수가 적습니다. 파티셔닝 대체물 인덱스의 선행 열에 대해 인덱스 크기를 줄이고 많이 사용되는 부분이 인덱스는 메모리에 맞습니다.
쿼리 또는 업데이트가 많은 부분에 액세스할 때 단일 토토 핫션을 사용하면 성능이 향상될 수 있습니다. 대신 해당 토토 핫션의 순차적 스캔 이점 인덱스와 분산된 랜덤 액세스 읽기를 사용하여 테이블 전체.
대량 로드 및 삭제는 다음을 추가하여 수행할 수 있습니다. 해당 요구 사항이 계획된 경우 파티션 제거 파티션 디자인.변경 표대량 작업보다 훨씬 빠릅니다. 그것은 또한 완전히 피합니다진공대량으로 인한 오버헤드삭제.
자주 사용하지 않는 데이터를 더 저렴하고 느린 데이터로 마이그레이션할 수 있습니다. 저장 매체.

이 혜택은 일반적으로 테이블이 있을 때만 가치가 있습니다. 그렇지 않으면 매우 클 것입니다. 테이블이 있는 정확한 지점 애플리케이션에 따라 토토 핫셔닝의 이점을 누릴 수 있습니다. 경험상 테이블의 크기는 데이터베이스 서버의 물리적 메모리를 초과합니다.

현재,PostgreSQL테이블 상속을 통한 파티셔닝을 지원합니다. 각 파티션 단일 상위 테이블의 하위 테이블로 생성되어야 합니다. 는 상위 테이블 자체는 일반적으로 비어 있습니다. 그것은 단지 존재한다 전체 데이터 세트를 나타냅니다. 당신은 익숙해야합니다 상속(참조범퍼카 토토 PostgreSQL : 문서 : 8.2 : 상속) 토토 핫션 설정을 시도하기 전에.

다음 형태의 파티셔닝을 구현할 수 있습니다.PostgreSQL:

범위 분할: 테이블은 다음과 같이 분할되어 있습니다."범위"키 열 또는 집합으로 정의됨 값 범위 간에 겹치지 않는 열 다른 토토 핫션에 할당됩니다. 예를 들어 날짜 범위 또는 식별자 범위별로 분할 특정 비즈니스 개체.
목록 분할: 테이블은 다음을 명시적으로 나열하여 분할되었습니다. 키 값은 각 파티션에 나타납니다.

5.9.2. 구현 파티셔닝

분할된 테이블을 설정하려면 다음을 수행하십시오:

생성"마스터"테이블, 모든 토토 핫션이 상속됩니다.

이 테이블에는 데이터가 포함되지 않습니다. 검사를 정의하지 마세요. 당신이 의도하지 않는 이상 이 테이블에 대한 제약 조건이 적용됩니다. 모든 토토 핫션에 동일하게 적용됩니다. 아무 의미가 없습니다 이에 대한 인덱스 또는 고유 제약 조건을 정의하고, 어느 쪽이든.
여러 개 생성"아이"테이블 각각은 마스터 테이블에서 상속됩니다. 일반적으로 이러한 테이블은 상속된 집합에 어떤 열도 추가하지 않습니다. 주인님.

우리는 하위 테이블을 토토 핫션으로 참조할 것입니다. 그들은 모든 면에서 정상입니다PostgreSQL테이블.
정의할 토토 핫션 테이블에 테이블 제약조건을 추가하세요. 각 토토 핫션에 허용되는 키 값입니다.

전형적인 예는 다음과 같습니다:
```
확인( x = 1 )
CHECK( 카운티 IN( '옥스퍼드셔', '버킹엄셔', '워릭셔' ))
확인( 콘센트 ID = 100 AND 콘센트 ID < 200 )
```
제약조건이 다음이 없음을 보장하는지 확인하세요. 서로 다른 키 값 사이의 중복이 허용됩니다. 파티션. 흔히 저지르는 실수는 범위 제한을 설정하는 것입니다. 이렇게:
```
확인( 콘센트 ID 100~200 사이)
확인(200~300 사이의 콘센트 ID)
```
이것은 어느 토토 핫션이 명확하지 않기 때문에 잘못된 것입니다. 키 값 200이 속해 있습니다.

범위 간 구문에는 차이가 없습니다. 그리고 목록 분할; 그 용어는 설명적이다 만.
각 파티션에 대해 키에 대한 인덱스를 생성하십시오 열뿐만 아니라 원하는 기타 인덱스도 포함됩니다. (키 인덱스는 꼭 필요한 것은 아니지만 대부분의 경우 시나리오가 도움이 됩니다. 핵심 가치를 다음과 같이 설정하려는 경우 고유한 경우 항상 고유한 또는 각 파티션에 대한 기본 키 제약 조건입니다.)
선택적으로 리디렉션할 규칙 또는 트리거를 정의하세요. 마스터 테이블을 적절하게 수정 토토 핫션.
다음을 확인하세요.constraint_exclusion구성 매개변수가 활성화되었습니다postgresql.conf. 이것이 없으면 쿼리는 원하는 대로 최적화되지 않습니다.

예를 들어, 우리가 다음을 위한 데이터베이스를 구축한다고 가정해 보겠습니다. 대형 아이스크림 회사. 회사는 최고 기온을 측정합니다. 매일매일, 지역별 아이스크림 판매도 함께 진행됩니다. 개념적으로 우리는 다음과 같은 테이블을 원합니다.

테이블 측정 생성(
    city_id int는 null이 아닙니다.
    logdate 날짜가 null이 아닙니다.
    피크 온도 정수,
    단위 판매 정수
);

우리는 대부분의 쿼리가 지난 주에만 액세스한다는 것을 알고 있습니다. 이 테이블의 주요 사용 이후 월별 또는 분기별 데이터 관리를 위한 온라인 보고서를 준비하는 것입니다. 줄이기 위해 저장해야 하는 오래된 데이터의 양에 따라 최근 3년간의 데이터를 보관합니다. 시작 부분에 매달 가장 오래된 달의 데이터가 삭제됩니다.

이 상황에서 우리는 분할을 사용하여 다음을 충족할 수 있습니다. 측정 테이블에 대한 우리의 다양한 요구 사항을 모두 충족합니다. 위에 설명된 단계에 따라 파티셔닝을 설정할 수 있습니다. 다음과 같이:

마스터 테이블은 다음과 같습니다.측정테이블, 다음과 같이 정확하게 선언됨 위.
다음으로 각 활성 월에 대해 하나의 파티션을 생성합니다:
```
CREATE TABLE Measurement_y2004m02 ( ) 상속(측정);
CREATE TABLE Measurement_y2004m03 ( ) INHERITS (측정값);
...
CREATE TABLE Measurement_y2005m11 ( ) INHERITS (측정값);
CREATE TABLE Measurement_y2005m12 ( ) INHERITS (측정값);
CREATE TABLE Measurement_y2006m01 ( ) INHERITS (측정값);
```
각 토토 핫션은 그 자체로 완전한 테이블입니다. 맞습니다. 하지만 그들은에서 정의를 상속받습니다.측정테이블.

이것은 우리의 문제 중 하나인 오래된 데이터 삭제를 해결합니다. 각각 이번 달에 우리가 해야 할 일은 다음을 수행하는 것뿐입니다.드롭 테이블가장 오래된 하위 테이블에 그리고 새 달의 데이터에 대한 새 하위 테이블을 만듭니다.

우리는 겹치지 않는 테이블 제약 조건을 추가해야 합니다. 테이블 생성 스크립트는 다음과 같습니다.

CREATE TABLE 측정_y2004m02(
    CHECK( logdate = DATE '2004-02-01' AND logdate < DATE '2004-03-01' )
) 상속(측정);
CREATE TABLE 측정_y2004m03(
    CHECK ( logdate = DATE '2004-03-01' AND logdate < DATE '2004-04-01' )
) 상속(측정);
...
CREATE TABLE 측정_y2005m11(
    CHECK( logdate = DATE '2005-11-01' AND logdate < DATE '2005-12-01' )
) 상속(측정);
CREATE TABLE 측정_y2005m12(
    CHECK( logdate = DATE '2005-12-01' AND logdate < DATE '2006-01-01' )
) 상속(측정);
CREATE TABLE 측정_y2006m01(
    CHECK( logdate = DATE '2006-01-01' AND logdate < DATE '2006-02-01' )
) 상속(측정);

아마도 키 열에도 색인이 필요할 것입니다.

CREATE INDEX 측정_y2004m02_logdate ON 측정_y2004m02(로그날짜);
CREATE INDEX 측정_y2004m03_logdate ON 측정_y2004m03(logdate);
...
CREATE INDEX 측정_y2005m11_logdate ON 측정_y2005m11(logdate);
CREATE INDEX 측정_y2005m12_logdate ON 측정_y2005m12(logdate);
측정_y2006m01_logdate ON 측정 INDEX 생성_y2006m01(로그 날짜);

현재로서는 더 이상 색인을 추가하지 않기로 결정했습니다.

데이터가 최신 파티션에만 추가된다면, 데이터를 삽입하는 매우 간단한 규칙을 설정할 수 있습니다. 우리는 항상 다음을 가리키도록 매달 이를 재정의합니다. 현재 파티션.

measurement_current_partition AS 규칙 생성 또는 교체
측정에 삽입 시
대신에
    측정_y2006m01 값에 삽입( NEW.city_id,
                                              NEW.logdate,
                                              NEW.피크온도,
                                              NEW.unitsales );

우리는 데이터를 삽입하고 서버를 갖고 싶을 수도 있습니다 행이 있는 토토 핫션을 자동으로 찾습니다. 추가되어야 합니다. 우리는 더 복잡한 세트로 이것을 할 수 있습니다 아래와 같은 규칙이 적용됩니다.

규칙 만들기 Measurement_insert_y2004m02 AS
측정 위치에 삽입 중
    ( logdate = DATE '2004-02-01' AND logdate < DATE '2004-03-01' )
대신에
    측정_y2004m02 값에 삽입( NEW.city_id,
                                              NEW.logdate,
                                              NEW.피크온도,
                                              NEW.unitsales );
...
측정 규칙 만들기_insert_y2005m12 AS
측정 위치에 삽입 중
    ( logdate = DATE '2005-12-01' AND logdate < DATE '2006-01-01' )
대신에
    측정_y2005m12 값에 삽입( NEW.city_id,
                                              NEW.logdate,
                                              NEW.피크온도,
                                              NEW.unitsales );
측정 규칙 만들기_insert_y2006m01 AS
측정 위치에 삽입 중
    ( logdate = DATE '2006-01-01' AND logdate < DATE '2006-02-01' )
대신에
    측정_y2006m01 값에 삽입( NEW.city_id,
                                              NEW.logdate,
                                              NEW.피크온도,
                                              NEW.unitsales );

참고하세요어디에서절 각 규칙은 정확히와 일치합니다.확인토토 핫션에 대한 제약 조건.

우리가 볼 수 있듯이 복잡한 파티션 구성에는 상당한 양의 DDL. 위의 예에서 우리는 매달 새로운 파티션을 생성하므로 다음과 같이 작성하는 것이 현명할 수 있습니다. 필요한 DDL을 자동으로 생성하는 스크립트입니다.

파티션은 다음을 사용하여 정렬할 수도 있습니다.유니온 전체보기:

다음으로 측정 보기 생성
          SELECT * FROM 측정_y2004m02
UNION ALL SELECT * FROM 측정_y2004m03
...
UNION ALL SELECT * FROM 측정_y2005m11
UNION ALL SELECT * FROM 측정_y2005m12
UNION ALL SELECT * FROM 측정_y2006m01;

그러나 보기를 다시 생성해야 하는 필요성은 추가 단계를 추가합니다. 데이터 세트의 개별 파티션을 추가하고 삭제합니다.

5.9.3. 관리 파티션

일반적으로 처음에 설정된 파티션 세트 테이블을 정의하는 것은 정적으로 유지되지 않습니다. 그것은 일반적으로 데이터의 오래된 파티션을 제거하고 새 데이터에 대해 주기적으로 새 파티션을 추가합니다. 가장 많은 것 중 하나 파티셔닝의 중요한 이점은 바로 다음과 같습니다. 그렇지 않으면 고통스러운 작업이 거의 실행될 수 있습니다. 파티션 구조를 조작하여 즉시 대량의 데이터를 물리적으로 이동하는 것보다.

오래된 데이터를 제거하는 가장 간단한 옵션은 단순히 삭제하는 것입니다 더 이상 필요하지 않은 파티션:

드롭 테이블 측정_y2003m02;

이것은 수백만 개의 기록을 매우 빠르게 삭제할 수 있습니다. 모든 기록을 개별적으로 삭제할 필요는 없습니다.

종종 선호되는 또 다른 옵션은 다음을 제거하는 것입니다. 파티션을 나눈 테이블에서 파티션을 나누지만 다음과 같이 액세스 권한을 유지합니다. 그 자체로 테이블이 됩니다:

ALTER TABLE Measurement_y2003m02 NO INHERIT 측정;

이를 통해 데이터에 대한 추가 작업을 수행할 수 있습니다. 떨어지기 전에. 예를 들어, 이것은 종종 유용한 시간입니다 다음을 사용하여 데이터를 백업합니다.복사, pg_dump또는 유사한 도구. 그것 또한 데이터를 더 작은 단위로 집계하는 데 유용한 시간이 될 수 있습니다. 형식을 지정하거나, 기타 데이터 조작을 수행하거나, 보고서를 실행합니다.

마찬가지로 우리는 새로운 데이터를 처리하기 위해 새로운 파티션을 추가할 수 있습니다. 우리 다음과 같이 분할된 테이블에 빈 파티션을 생성할 수 있습니다. 원래 파티션은 위에서 생성되었습니다.

CREATE TABLE 측정_y2006m02(
    CHECK( logdate = DATE '2006-02-01' AND logdate < DATE '2006-03-01' )
) 상속(측정);

대안으로 때로는 다음을 생성하는 것이 더 편리합니다. 파티션 구조 외부에 새 테이블을 만들고 나중에 적절한 파티션을 설정하세요. 이를 통해 데이터를 로드할 수 있습니다. 확인하고 표시되기 전에 변환했습니다. 파티션을 나눈 테이블입니다.

테이블 생성 측정_y2006m02
  (제약 조건을 포함하는 기본값을 포함하는 측정과 유사);
ALTER TABLE 측정_y2006m02 제약조건 추가 y2006m02
   CHECK ( logdate = DATE '2006-02-01' AND logdate < DATE '2006-03-01' );
\ 'measurement_y2006m02'에서 측정_y2006m02 복사
-- 아마도 다른 데이터 준비 작업
ALTER TABLE Measurement_y2006m02 INHERIT 측정;

5.9.4. 파티셔닝 및 제약조건 제외

제약조건 제외쿼리입니다 성능을 향상시키는 최적화 기술 위에서 설명한 방식으로 정의된 파티션된 테이블입니다. 다음과 같이 예:

SET Constraint_exclusion = 켜기;
SELECT 개수(*) FROM 측정 WHERE logdate = DATE '2006-01-01';

제약조건 제외가 없으면 위 쿼리는 스캔합니다. 의 각 파티션측정테이블. 제약조건 제외 포함 활성화되면 플래너는 각 제약 조건을 검사합니다. 분할하고 분할이 필요하지 않다는 것을 증명하려고 노력하십시오. 조건을 충족하는 행을 포함할 수 없기 때문에 스캔되었습니다. 쿼리어디절. 기획자는 언제 이를 증명할 수 있으면 쿼리에서 토토 핫션을 제외합니다. 계획.

당신은 다음을 사용할 수 있습니다설명명령을 내리다 다음 계획의 차이점을 보여주세요.constraint_exclusion켜져 있고 꺼진 계획도 있습니다. 이러한 유형의 테이블 설정에 대한 일반적인 기본 계획은 다음과 같습니다.

SET Constraint_exclusion = 꺼짐;
EXPLAIN SELECT count(*) FROM 측정 WHERE logdate = DATE '2006-01-01';

                                          쿼리 계획
---------------------------------------------------------------------
 집계(비용=158.66..158.68행=1 너비=0)
   - 추가(비용=0.00..151.88행=2715너비=0)
         - 측정 시 Seq 스캔(비용=0.00..30.38행=543너비=0)
               필터: (logdate = '2006-01-01'::date)
         - 측정 시 Seq 스캔_y2004m02 측정(비용=0.00..30.38행=543너비=0)
               필터: (logdate = '2006-01-01'::date)
         - 측정 시 Seq 스캔_y2004m03 측정(비용=0.00..30.38행=543너비=0)
               필터: (logdate = '2006-01-01'::date)
...
         - 측정 시 Seq 스캔_y2005m12 측정(비용=0.00..30.38행=543너비=0)
               필터: (logdate = '2006-01-01'::date)
         - 측정 시 Seq 스캔_y2006m01 측정(비용=0.00..30.38행=543너비=0)
               필터: (로그 날짜 = '2006-01-01'::날짜)

파티션의 일부 또는 전체가 인덱스 스캔을 대신 사용할 수 있습니다. 전체 테이블 순차 스캔이 있지만 여기서 중요한 점은 응답하기 위해 이전 파티션을 전혀 스캔할 필요가 없습니다. 이 쿼리. 제약 조건 제외를 활성화하면 다음과 같은 결과를 얻습니다. 동일한 서비스를 제공하는 대폭 축소된 계획 대답:

SET Constraint_exclusion = 켜짐;
EXPLAIN SELECT count(*) FROM 측정 WHERE logdate = DATE '2006-01-01';
                                          쿼리 계획
---------------------------------------------------------------------
 집계(비용=63.47..63.48행=1너비=0)
   - 추가(비용=0.00..60.75행=1086너비=0)
         - 측정 시 Seq 스캔(비용=0.00..30.38행=543너비=0)
               필터: (logdate = '2006-01-01'::date)
         - 측정 시 Seq 스캔_y2006m01 측정(비용=0.00..30.38행=543너비=0)
               필터: (로그 날짜 = '2006-01-01'::날짜)

제약조건 제외는 다음에 의해서만 구동된다는 점에 유의하세요.확인제약조건이 존재하지 않음 인덱스. 따라서 인덱스를 정의할 필요가 없습니다. 키 열. 특정 인덱스에 대해 인덱스를 생성해야 하는지 여부 파티션은 스캔하는 쿼리를 예상하는지 여부에 따라 달라집니다. 파티션은 일반적으로 파티션의 많은 부분을 스캔합니다. 아니면 단지 작은 부분일 뿐이죠. 색인은 후자에 도움이 될 것입니다 경우는 있지만 전자는 아닙니다.

5.9.5. 주의사항

분할된 테이블에는 다음 주의사항이 적용됩니다:

현재 모든 내용을 확인할 수 있는 방법은 없습니다.확인제약조건은 상호적입니다. 독점. 데이터베이스 디자이너의 주의가 필요합니다.
현재 해당 행을 지정하는 간단한 방법은 없습니다. 마스터 테이블에 삽입하면 안 됩니다. 갑확인(거짓)마스터 테이블의 제약 조건 모든 하위 테이블에 상속되므로 이 목적으로 사용됩니다. 한 가지 가능성은 다음을 설정하는 것입니다.삽입 중마스터에서 트리거 항상 오류가 발생하는 테이블입니다. (또는 이러한 트리거를 사용하여 데이터를 적절한 위치로 리디렉션할 수 있습니다. 제안된 대로 일련의 규칙을 사용하는 대신 하위 테이블 위.)

제약조건 제외에는 다음 주의사항이 적용됩니다:

제약조건 제외는 쿼리가 다음과 같은 경우에만 작동합니다.어디에서절에 상수가 포함되어 있습니다. 에이 매개변수화된 쿼리는 최적화되지 않습니다. 플래너는 매개변수 값이 어떤 토토 핫션인지 알 수 없습니다. 런타임 시 선택할 수 있습니다. 같은 이유로,"안정적"다음과 같은 함수CURRENT_DATE피해야 합니다.
다음에서 교차 데이터 유형 비교를 피하세요.확인제약조건, 계획자가 원하는대로 현재 그러한 조건이 거짓임을 증명하는 데 실패했습니다. 예를 들어, 다음 제약 조건은 다음과 같은 경우에 작동합니다.x은정수열, 그러나 if는 아님x은비긴트:
```
확인( x = 1 )
```
에 대한비긴트열을 사용해야 합니다. 다음과 같은 제약 조건:
```
확인( x = 1::bigint )
```
문제는 다음에 국한되지 않습니다.bigint데이터 유형 — 이는 다음과 같은 경우에 발생할 수 있습니다. 상수의 기본 데이터 유형이 데이터와 일치하지 않습니다. 비교되는 열의 유형입니다. 제공된 쿼리의 교차 데이터 유형 비교는 다음과 같습니다. 일반적으로 괜찮습니다. 하지만 해당 지역에는 없습니다.확인조건.
마스터 테이블의 모든 파티션에 대한 모든 제약 조건 제약 조건 제외를 위해 고려되므로 숫자가 큽니다. 파티션으로 인해 쿼리 계획 시간이 늘어날 가능성이 높습니다. 상당히.
아직도 달려야 한다는 것을 잊지 마세요분석각 파티션에 개별적으로. 에이 다음과 같은 명령
```
측정 분석;
```
마스터 테이블만 처리합니다.

이전	집	다음
상속	위로	기타 데이터베이스 객체