기본 서버가 실패하면 대기 서버가 장애 조치 절차를 시작해야합니다.
대기 서버가 실패하면 장애 조치가 발생할 필요가 없습니다. 대기 서버를 다시 시작할 수있는 경우, 얼마 후에도 복구 프로세스를 즉시 다시 시작하여 다시 시작 가능한 복구를 활용할 수 있습니다. 대기 서버를 다시 시작할 수없는 경우 전체 새 대기 서버 인스턴스를 생성해야합니다.
기본 서버에 실패하고 대기 서버가 새 기본이되고 이전 기본 재시작이되면 이전 기본에 더 이상 기본이 아님을 알리는 메커니즘이 있어야합니다. 이것은 때때로로 알려져 있습니다.Stonith(헤드에서 다른 노드를 쏴), 두 시스템이 모두 기본이라고 생각하는 상황을 피하기 위해 필요하며, 이는 혼란과 궁극적으로 데이터 손실로 이어질 것입니다..
많은 장애 조치 시스템은 어떤 종류의 심장 박동 메커니즘으로 연결된 1 차 및 대기 시스템의 두 시스템을 사용하여 둘 사이의 연결성과 1 차의 생존력을 지속적으로 검증합니다. 부적절한 장애 조치를 방지하기 위해 세 번째 시스템 (증인 서버라고 함)을 사용하는 것도 가능하지만, 충분한 치료와 엄격한 테스트로 설정되지 않으면 추가 복잡성이 가치가 없을 수도 있습니다..
토토기본의 고장을 식별하고 대기 데이터베이스 서버에 알리는 데 필요한 시스템 소프트웨어를 제공하지 않습니다. 이러한 많은 도구가 존재하며 IP 주소 마이그레이션과 같은 성공적인 장애 조치에 필요한 운영 체제 시설과 잘 통합되어 있습니다.
일단 대기에 대한 장애 조치가 발생하면 단일 서버 만 작동합니다. 이것은 퇴화 상태로 알려져 있습니다. 전자 대기는 이제 기본이지만 이전의 1 차는 다운되어 머물 수 있습니다. 정상 작동으로 돌아 가기 위해서는 대기 서버를 이전 기본 시스템이 올 때 또는 세 번째, 아마도 새로운 시스템에서 재현해야합니다. 그만큼pg_rewind유틸리티를 사용하여 큰 클러스터 에서이 프로세스 속도를 높일 수 있습니다. 완료되면 기본 및 대기는 역할을 전환 한 것으로 간주 될 수 있습니다. 일부 사람들은 새 대기 서버가 재현 될 때까지 새 기본에 대한 백업을 제공하기 위해 세 번째 서버를 사용하기로 선택하지만, 이는 시스템 구성 및 운영 프로세스를 복잡하게 만듭니다..
따라서 기본에서 대기 서버로 전환하는 것은 빠르지 만 장애 조치 클러스터를 다시 준비하는 데 약간의 시간이 필요합니다. 기본에서 대기로 정기적으로 전환하는 것은 각 시스템에서 유지 보수를 위해 정기적으로 가동 중지 시간을 허용하므로 유용합니다. 이것은 또한 실패 메커니즘의 테스트 역할을하여 필요할 때 실제로 작동 할 수 있도록합니다. 서면 관리 절차가 권장됩니다.
논리적 복제 슬롯 동기화를 선택한 경우 (참조섹션 47.2.3), 대기 서버로 전환하기 전에 대기 서버에서 동기화 된 논리 슬롯이 장애 조치에 맞게 준비되어 있는지 확인하는 것이 좋습니다. 이것은에 설명 된 단계를 따르면 수행 할 수 있습니다.PostgreSQL : 문서 : 17 : 29.3. 논리적 롤 토토 장애 조치.
로그 선집 대기 서버의 장애 조치를 트리거하려면 runPG_CTL PROMOTE
또는 전화pg_promote ()
. 고 가용성 목적이 아닌 기본에서 읽기 전용 쿼리를 오프로드하는 데만 사용되는보고 서버를 설정하는 경우 홍보 할 필요가 없습니다.
문서에 올바르지 않은 내용이 있으면 일치하지 않습니다. 특정 기능에 대한 귀하의 경험 또는 추가 설명이 필요합니다. 사용이 양식문서 문제를보고하려면