QQGoblin/configure_spilo.py

## configure_spilo.py
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import argparse
import json
import logging
import re
import os
from json.decoder import JSONDecodeError

import psutil
import socket
import subprocess
import sys
import pwd

from copy import deepcopy
from six.moves.urllib_parse import urlparse
from collections import defaultdict

import yaml
import pystache
import requests

from spilo_commons import RW_DIR, PATRONI_CONFIG_FILE, append_extensions, \
    get_binary_version, get_bin_dir, is_valid_pg_version, write_file, write_patroni_config

PROVIDER_AWS = "aws"
PROVIDER_GOOGLE = "google"
PROVIDER_OPENSTACK = "openstack"
PROVIDER_LOCAL = "local"
PROVIDER_UNSUPPORTED = "unsupported"
USE_KUBERNETES = os.environ.get('KUBERNETES_SERVICE_HOST') is not None
KUBERNETES_DEFAULT_LABELS = '{"application": "spilo"}'
MEMORY_LIMIT_IN_BYTES_PATH = '/sys/fs/cgroup/memory/memory.limit_in_bytes'
PATRONI_DCS = ('zookeeper', 'exhibitor', 'consul', 'etcd3', 'etcd')
AUTO_ENABLE_WALG_RESTORE = ('WAL_S3_BUCKET', 'WALE_S3_PREFIX', 'WALG_S3_PREFIX', 'WALG_AZ_PREFIX', 'WALG_SSH_PREFIX')
WALG_SSH_NAMES = ['WALG_SSH_PREFIX', 'SSH_PRIVATE_KEY_PATH', 'SSH_USERNAME']


def parse_args():
    """
    脚本的参数：
        --loglevel：调整脚本的日志级别，需要注意这个参数只有注入DEBUG环境变量的时候才会生效，否则日志固定为INFO级别
        --force：是否覆盖配置文件
        sections：需要生成配置的模块，all表示所有模块
    """
    sections = ['all', 'patroni', 'pgqd', 'certificate', 'wal-e', 'crontab',
                'pam-oauth2', 'pgbouncer', 'bootstrap', 'standby-cluster', 'log']
    argp = argparse.ArgumentParser(description='Configures Spilo',
                                   epilog="Choose from the following sections:\n\t{}".format('\n\t'.join(sections)),
                                   formatter_class=argparse.RawDescriptionHelpFormatter)

    argp.add_argument('sections', metavar='sections', type=str, nargs='+', choices=sections,
                      help='Which section to (re)configure')
    argp.add_argument('-l', '--loglevel', type=str, help='Explicitly set loglevel')
    argp.add_argument('-f', '--force', help='Overwrite files if they exist', default=False, action='store_true')

    args = vars(argp.parse_args())

    if 'all' in args['sections']:
        args['sections'] = sections
        args['sections'].remove('all')
    args['sections'] = set(args['sections'])

    return args


def adjust_owner(resource, uid=None, gid=None):
    if uid is None:
        uid = pwd.getpwnam('postgres').pw_uid
    if gid is None:
        gid = pwd.getpwnam('postgres').pw_gid
    os.chown(resource, uid, gid)


def link_runit_service(placeholders, name):
    """
    将/etc/runit/runsvdir/default目录下指定的文件夹，软连接到/run/service！
    PS：这里只会连接run和finish文件
    """
    service_dir = os.path.join(placeholders['RW_DIR'], 'service', name)
    if not os.path.exists(service_dir):
        os.makedirs(service_dir)
        for f in ('run', 'finish'):
            src_file = os.path.join('/etc/runit/runsvdir/default', name, f)
            dst_file = os.path.join(service_dir, f)
            if os.path.exists(src_file) and not os.path.exists(dst_file):
                os.symlink(src_file, dst_file)


def write_certificates(environment, overwrite):
    """Write SSL certificate to files

    If certificates are specified, they are written, otherwise
    dummy certificates are generated and written"""

    ssl_keys = ['SSL_CERTIFICATE', 'SSL_PRIVATE_KEY']
    # environment中同时包含：'SSL_CERTIFICATE'和'SSL_PRIVATE_KEY'
    if set(ssl_keys) <= set(environment):
        logging.info('Writing custom ssl certificate')
        for k in ssl_keys:
            write_file(environment[k], environment[k + '_FILE'], overwrite)
        if 'SSL_CA' in environment:
            logging.info('Writing ssl ca certificate')
            write_file(environment['SSL_CA'], environment['SSL_CA_FILE'], overwrite)
        else:
            logging.info('No ca certificate to write')
        if 'SSL_CRL' in environment:
            logging.info('Writing ssl certificate revocation list')
            write_file(environment['SSL_CRL'], environment['SSL_CRL_FILE'], overwrite)
        else:
            logging.info('No certificate revocation list to write')
    else:
        if os.path.exists(environment['SSL_PRIVATE_KEY_FILE']) and not overwrite:
            logging.warning('Private key already exists, not overwriting. (Use option --force if necessary)')
            return
        openssl_cmd = [
            '/usr/bin/openssl',
            'req',
            '-nodes',
            '-new',
            '-x509',
            '-subj',
            '/CN=spilo.example.org',
            '-keyout',
            environment['SSL_PRIVATE_KEY_FILE'],
            '-out',
            environment['SSL_CERTIFICATE_FILE'],
        ]
        logging.info('Generating ssl self-signed certificate')
        p = subprocess.Popen(openssl_cmd, shell=False, stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
        output, _ = p.communicate()
        logging.debug(output)

    os.chmod(environment['SSL_PRIVATE_KEY_FILE'], 0o600)
    adjust_owner(environment['SSL_PRIVATE_KEY_FILE'], gid=-1)


def write_restapi_certificates(environment, overwrite):
    """Write REST Api SSL certificate to files

    If certificates are specified, they are written, otherwise
    dummy certificates are generated and written"""

    ssl_keys = ['SSL_RESTAPI_CERTIFICATE', 'SSL_RESTAPI_PRIVATE_KEY']
    if set(ssl_keys) <= set(environment):
        logging.info('Writing REST Api custom ssl certificate')
        for k in ssl_keys:
            write_file(environment[k], environment[k + '_FILE'], overwrite)
        if 'SSL_RESTAPI_CA' in environment:
            logging.info('Writing REST Api ssl ca certificate')
            write_file(environment['SSL_RESTAPI_CA'], environment['SSL_RESTAPI_CA_FILE'], overwrite)
        else:
            logging.info('No REST Api ca certificate to write')

        os.chmod(environment['SSL_RESTAPI_PRIVATE_KEY_FILE'], 0o600)
        adjust_owner(environment['SSL_RESTAPI_PRIVATE_KEY_FILE'], gid=-1)


def deep_update(a, b):
    """Updates data structures

    Dicts are merged, recursively
    If "a" and "b" are lists, list "a" is used
    For anything else, the value of a is returned"""

    if type(a) is dict and type(b) is dict:
        for key in b:
            if key in a:
                a[key] = deep_update(a[key], b[key])
            else:
                a[key] = b[key]
        return a
    if type(a) is list and type(b) is list:
        return a

    return a if a is not None else b


TEMPLATE = \
    '''
bootstrap:
  post_init: /scripts/post_init.sh "{{HUMAN_ROLE}}"
  dcs:
    {{#STANDBY_CLUSTER}}
    standby_cluster:
      create_replica_methods:
      {{#STANDBY_WITH_WALE}}
      - bootstrap_standby_with_wale
      {{/STANDBY_WITH_WALE}}
      - basebackup_fast_xlog
      {{#STANDBY_WITH_WALE}}
      restore_command: envdir "{{STANDBY_WALE_ENV_DIR}}" /scripts/restore_command.sh "%f" "%p"
      {{/STANDBY_WITH_WALE}}
      {{#STANDBY_HOST}}
      host: {{STANDBY_HOST}}
      {{/STANDBY_HOST}}
      {{#STANDBY_PORT}}
      port: {{STANDBY_PORT}}
      {{/STANDBY_PORT}}
    {{/STANDBY_CLUSTER}}
    ttl: 30
    loop_wait: &loop_wait 10
    retry_timeout: 10
    maximum_lag_on_failover: 33554432
    postgresql:
      use_pg_rewind: true
      use_slots: true
      parameters:
        archive_mode: "on"
        archive_timeout: 1800s
        wal_level: hot_standby
        wal_log_hints: 'on'
        wal_compression: 'on'
        max_wal_senders: 10
        max_connections: {{postgresql.parameters.max_connections}}
        max_replication_slots: 10
        hot_standby: 'on'
        tcp_keepalives_idle: 900
        tcp_keepalives_interval: 100
        log_line_prefix: '%t [%p]: [%l-1] %c %x %d %u %a %h '
        log_checkpoints: 'on'
        log_lock_waits: 'on'
        log_min_duration_statement: 500
        log_autovacuum_min_duration: 0
        log_connections: 'on'
        log_disconnections: 'on'
        log_statement: 'ddl'
        log_temp_files: 0
        track_functions: all
        checkpoint_completion_target: 0.9
        autovacuum_max_workers: 5
        autovacuum_vacuum_scale_factor: 0.05
        autovacuum_analyze_scale_factor: 0.02
  {{#CLONE_WITH_WALE}}
  method: clone_with_wale
  clone_with_wale:
    command: envdir "{{CLONE_WALE_ENV_DIR}}" python3 /scripts/clone_with_wale.py
      --recovery-target-time="{{CLONE_TARGET_TIME}}"
    recovery_conf:
        restore_command: envdir "{{CLONE_WALE_ENV_DIR}}" /scripts/restore_command.sh "%f" "%p"
        recovery_target_timeline: latest
        {{#USE_PAUSE_AT_RECOVERY_TARGET}}
        recovery_target_action: pause
        {{/USE_PAUSE_AT_RECOVERY_TARGET}}
        {{^USE_PAUSE_AT_RECOVERY_TARGET}}
        recovery_target_action: promote
        {{/USE_PAUSE_AT_RECOVERY_TARGET}}
        {{#CLONE_TARGET_TIME}}
        recovery_target_time: "{{CLONE_TARGET_TIME}}"
        {{/CLONE_TARGET_TIME}}
        {{^CLONE_TARGET_INCLUSIVE}}
        recovery_target_inclusive: false
        {{/CLONE_TARGET_INCLUSIVE}}
  {{/CLONE_WITH_WALE}}
  {{#CLONE_WITH_BASEBACKUP}}
  method: clone_with_basebackup
  clone_with_basebackup:
    command: python3 /scripts/clone_with_basebackup.py --pgpass={{CLONE_PGPASS}} --host={{CLONE_HOST}}
      --port={{CLONE_PORT}} --user="{{CLONE_USER}}"
  {{/CLONE_WITH_BASEBACKUP}}
  initdb:
    - encoding: UTF8
    - locale: {{INITDB_LOCALE}}.UTF-8
    - data-checksums
  {{#USE_ADMIN}}
  users:
    {{PGUSER_ADMIN}}:
      password: {{PGPASSWORD_ADMIN}}
      options:
        - createrole
        - createdb
  {{/USE_ADMIN}}
scope: &scope '{{SCOPE}}'
restapi:
  listen: ':{{APIPORT}}'
  connect_address: {{RESTAPI_CONNECT_ADDRESS}}:{{APIPORT}}
  {{#SSL_RESTAPI_CA_FILE}}
  cafile: {{SSL_RESTAPI_CA_FILE}}
  {{/SSL_RESTAPI_CA_FILE}}
  {{#SSL_RESTAPI_CERTIFICATE_FILE}}
  certfile: {{SSL_RESTAPI_CERTIFICATE_FILE}}
  {{/SSL_RESTAPI_CERTIFICATE_FILE}}
  {{#SSL_RESTAPI_PRIVATE_KEY_FILE}}
  keyfile: {{SSL_RESTAPI_PRIVATE_KEY_FILE}}
  {{/SSL_RESTAPI_PRIVATE_KEY_FILE}}
postgresql:
  pgpass: /run/postgresql/pgpass
  use_unix_socket: true
  use_unix_socket_repl: true
  name: '{{instance_data.id}}'
  listen: '*:{{PGPORT}}'
  connect_address: {{instance_data.ip}}:{{PGPORT}}
  data_dir: {{PGDATA}}
  parameters:
    archive_command: {{{postgresql.parameters.archive_command}}}
    shared_buffers: {{postgresql.parameters.shared_buffers}}
    logging_collector: 'on'
    log_destination: csvlog
    log_directory: ../pg_log
    log_filename: 'postgresql-%u.log'
    log_file_mode: '0644'
    log_rotation_age: '1d'
    log_truncate_on_rotation: 'on'
    ssl: 'on'
    {{#SSL_CA_FILE}}
    ssl_ca_file: {{SSL_CA_FILE}}
    {{/SSL_CA_FILE}}
    {{#SSL_CRL_FILE}}
    ssl_crl_file: {{SSL_CRL_FILE}}
    {{/SSL_CRL_FILE}}
    ssl_cert_file: {{SSL_CERTIFICATE_FILE}}
    ssl_key_file: {{SSL_PRIVATE_KEY_FILE}}
    shared_preload_libraries: 'bg_mon,pg_stat_statements,pgextwlist,pg_auth_mon,set_user'
    bg_mon.listen_address: '{{BGMON_LISTEN_IP}}'
    bg_mon.history_buckets: 120
    pg_stat_statements.track_utility: 'off'
    extwlist.extensions: 'btree_gin,btree_gist,citext,hstore,intarray,\
ltree,pgcrypto,pgq,pg_trgm,postgres_fdw,tablefunc,uuid-ossp,hypopg'
    extwlist.custom_path: /scripts
  pg_hba:
    - local   all             all                                   trust
    {{#PAM_OAUTH2}}
    - hostssl all             +{{HUMAN_ROLE}}    127.0.0.1/32       pam
    {{/PAM_OAUTH2}}
    - host    all             all                127.0.0.1/32       md5
    {{#PAM_OAUTH2}}
    - hostssl all             +{{HUMAN_ROLE}}    ::1/128            pam
    {{/PAM_OAUTH2}}
    - host    all             all                ::1/128            md5
    - local   replication     {{PGUSER_STANDBY}}                    trust
    - hostssl replication     {{PGUSER_STANDBY}} all                md5
    {{^ALLOW_NOSSL}}
    - hostnossl all           all                all                reject
    {{/ALLOW_NOSSL}}
    {{#PAM_OAUTH2}}
    - hostssl all             +{{HUMAN_ROLE}}    all                pam
    {{/PAM_OAUTH2}}
    {{#ALLOW_NOSSL}}
    - host    all             all                all                md5
    {{/ALLOW_NOSSL}}
    {{^ALLOW_NOSSL}}
    - hostssl all             all                all                md5
    {{/ALLOW_NOSSL}}

  {{#USE_WALE}}
  recovery_conf:
    restore_command: envdir "{{WALE_ENV_DIR}}" /scripts/restore_command.sh "%f" "%p"
  {{/USE_WALE}}
  authentication:
    superuser:
      username: {{PGUSER_SUPERUSER}}
      password: '{{PGPASSWORD_SUPERUSER}}'
    replication:
      username: {{PGUSER_STANDBY}}
      password: '{{PGPASSWORD_STANDBY}}'
  callbacks:
  {{#CALLBACK_SCRIPT}}
    on_start: {{CALLBACK_SCRIPT}}
    on_stop: {{CALLBACK_SCRIPT}}
    on_role_change: '/scripts/on_role_change.sh {{HUMAN_ROLE}} {{CALLBACK_SCRIPT}}'
 {{/CALLBACK_SCRIPT}}
 {{^CALLBACK_SCRIPT}}
    on_role_change: '/scripts/on_role_change.sh {{HUMAN_ROLE}} true'
 {{/CALLBACK_SCRIPT}}
  create_replica_method:
  {{#USE_WALE}}
    - wal_e
  {{/USE_WALE}}
    - basebackup_fast_xlog
  {{#USE_WALE}}
  wal_e:
    command: envdir {{WALE_ENV_DIR}} bash /scripts/wale_restore.sh
    threshold_megabytes: {{WALE_BACKUP_THRESHOLD_MEGABYTES}}
    threshold_backup_size_percentage: {{WALE_BACKUP_THRESHOLD_PERCENTAGE}}
    retries: 2
    no_master: 1
  {{/USE_WALE}}
  basebackup_fast_xlog:
    command: /scripts/basebackup.sh
    retries: 2
{{#STANDBY_WITH_WALE}}
  bootstrap_standby_with_wale:
    command: envdir "{{STANDBY_WALE_ENV_DIR}}" bash /scripts/wale_restore.sh
    threshold_megabytes: {{WALE_BACKUP_THRESHOLD_MEGABYTES}}
    threshold_backup_size_percentage: {{WALE_BACKUP_THRESHOLD_PERCENTAGE}}
    retries: 2
    no_master: 1
{{/STANDBY_WITH_WALE}}
'''


def get_provider():
    """
        该函数获取当前Spilo运行的环境类型，包括以下几种: "aws"、"google"、"openstack"、"local"、"unsupported"
        用户可以通过SPILO_PROVIDER主动指定。如果注入了DEVELOP环境变量，类型默认为local。
        需要注意spilo通过169.254.169.254自动判断环境类型，因为该IP是一个非常特殊的IP。
        根据RFC-1918规定169.254.169.254和10.0.0.0/8等地址一样，被保留为内网使用，因此aws、openstack等云服务商将它作为虚拟机获取metadata的一种手段。
        当从169.254.169.254获取信息失败时，默认认为运行环境为local。
    """
    provider = os.environ.get('SPILO_PROVIDER')
    if provider:
        if provider in {PROVIDER_AWS, PROVIDER_GOOGLE, PROVIDER_OPENSTACK, PROVIDER_LOCAL}:
            return provider
        else:
            logging.error('Unknown SPILO_PROVIDER: %s', provider)
            return PROVIDER_UNSUPPORTED

    if os.environ.get('DEVELOP', '').lower() in ['1', 'true', 'on']:
        return PROVIDER_LOCAL

    try:
        logging.info("Figuring out my environment (Google? AWS? Openstack? Local?)")
        r = requests.get('http://169.254.169.254', timeout=2)
        if r.headers.get('Metadata-Flavor', '') == 'Google':
            return PROVIDER_GOOGLE
        else:
            # accessible on Openstack, will fail on AWS
            r = requests.get('http://169.254.169.254/openstack/latest/meta_data.json')
            if r.ok:
                # make sure the response is parsable - https://github.com/Azure/aad-pod-identity/issues/943 and
                # https://github.com/zalando/spilo/issues/542
                r.json()
                return PROVIDER_OPENSTACK

            # is accessible from both AWS and Openstack, Possiblity of misidentification if previous try fails
            r = requests.get('http://169.254.169.254/latest/meta-data/ami-id')
            return PROVIDER_AWS if r.ok else PROVIDER_UNSUPPORTED
    except (requests.exceptions.ConnectTimeout, requests.exceptions.ConnectionError, requests.exceptions.ReadTimeout):
        logging.info("Could not connect to 169.254.169.254, assuming local Docker setup")
        return PROVIDER_LOCAL
    except JSONDecodeError:
        logging.info("Could not parse response from 169.254.169.254, assuming local Docker setup")
        return PROVIDER_LOCAL


def get_instance_metadata(provider):
    metadata = {'ip': socket.getaddrinfo(socket.gethostname(), 0, socket.AF_UNSPEC, socket.SOCK_STREAM, 0)[0][4][0],
                'id': socket.gethostname(),
                'zone': 'local'}

    if USE_KUBERNETES:
        metadata['ip'] = os.environ.get('POD_IP', metadata['ip'])

    headers = {}
    if provider == PROVIDER_GOOGLE:
        headers['Metadata-Flavor'] = 'Google'
        url = 'http://169.254.169.254/computeMetadata/v1/instance'  # metadata.google.internal
        mapping = {'zone': 'zone'}
        if not USE_KUBERNETES:
            mapping.update({'id': 'id'})
    elif provider == PROVIDER_AWS:
        url = 'http://169.254.169.254/latest/meta-data'
        mapping = {'zone': 'placement/availability-zone'}
        if not USE_KUBERNETES:
            mapping.update({'ip': 'local-ipv4', 'id': 'instance-id'})
    elif provider == PROVIDER_OPENSTACK:
        mapping = {}  # Disable multi-url fetch
        url = 'http://169.254.169.254/openstack/latest/meta_data.json'
        openstack_metadata = requests.get(url, timeout=5).json()
        metadata['zone'] = openstack_metadata['availability_zone']
        if not USE_KUBERNETES:
            # OpenStack does not support providing an IP through metadata so keep
            # auto-discovered one.
            metadata['id'] = openstack_metadata.uuid
    else:
        logging.info("No meta-data available for this provider")
        return metadata

    for k, v in mapping.items():
        metadata[k] = requests.get('{}/{}'.format(url, v or k), timeout=2, headers=headers).text

    return metadata


def set_extended_wale_placeholders(placeholders, prefix):
    """ checks that enough parameters are provided to configure cloning or standby with WAL-E """
    for name in ('S3', 'GS', 'GCS', 'SWIFT', 'AZ'):
        if placeholders.get('{0}WALE_{1}_PREFIX'.format(prefix, name)) or \
                name in ('S3', 'GS', 'AZ') and placeholders.get('{0}WALG_{1}_PREFIX'.format(prefix, name)) or \
                placeholders.get('{0}WAL_{1}_BUCKET'.format(prefix, name)) and placeholders.get(prefix + 'SCOPE'):
            break
    else:
        return False
    scope = placeholders.get(prefix + 'SCOPE')
    dirname = 'env-' + prefix[:-1].lower() + ('-' + scope if scope else '')
    placeholders[prefix + 'WALE_ENV_DIR'] = os.path.join(placeholders['RW_DIR'], 'etc', 'wal-e.d', dirname)
    placeholders[prefix + 'WITH_WALE'] = True
    return name


def set_walg_placeholders(placeholders, prefix=''):
    walg_supported = any(placeholders.get(prefix + n) for n in AUTO_ENABLE_WALG_RESTORE +
                         ('WAL_GS_BUCKET', 'WALE_GS_PREFIX', 'WALG_GS_PREFIX'))
    default = placeholders.get('USE_WALG', False)
    placeholders.setdefault(prefix + 'USE_WALG', default)
    for name in ('USE_WALG_BACKUP', 'USE_WALG_RESTORE'):
        value = str(placeholders.get(prefix + name, placeholders[prefix + 'USE_WALG'])).lower()
        placeholders[prefix + name] = 'true' if value == 'true' and walg_supported else None


def get_listen_ip():
    """ Get IP to listen on for things that don't natively support detecting IPv4/IPv6 dualstack """

    def has_dual_stack():
        if hasattr(socket, 'AF_INET6') and hasattr(socket, 'IPPROTO_IPV6') and hasattr(socket, 'IPV6_V6ONLY'):
            sock = None
            try:
                sock = socket.socket(socket.AF_INET6, socket.SOCK_STREAM)
                sock.setsockopt(socket.IPPROTO_IPV6, socket.IPV6_V6ONLY, False)
                import urllib3
                return urllib3.util.connection.HAS_IPV6
            except socket.error as e:
                logging.debug('Error when working with ipv6 socket: %s', e)
            finally:
                if sock:
                    sock.close()
        return False

    info = socket.getaddrinfo(None, 0, socket.AF_UNSPEC, socket.SOCK_STREAM, 0, socket.AI_PASSIVE)
    # in case dual stack is not supported we want IPv4 to be preferred over IPv6
    info.sort(key=lambda x: x[0] == socket.AF_INET, reverse=not has_dual_stack())
    return info[0][4][0]


def get_placeholders(provider):
    """
    placeholders是基于provider和系统环境变量生成的配置字典
    placeholders中值得注意的配置包括：placeholders['postgresql']['parameters']：postgresql相关的参数字典被初始化

    """
    placeholders = dict(os.environ)

    placeholders.setdefault('PGHOME', os.path.expanduser('~'))
    placeholders.setdefault('APIPORT', '8008')
    placeholders.setdefault('BACKUP_SCHEDULE', '0 1 * * *')
    placeholders.setdefault('BACKUP_NUM_TO_RETAIN', '5')
    placeholders.setdefault('CRONTAB', '[]')
    placeholders.setdefault('PGROOT', os.path.join(placeholders['PGHOME'], 'pgroot'))
    placeholders.setdefault('WALE_TMPDIR', os.path.abspath(os.path.join(placeholders['PGROOT'], '../tmp')))
    placeholders.setdefault('PGDATA', os.path.join(placeholders['PGROOT'], 'pgdata'))
    placeholders.setdefault('HUMAN_ROLE', 'zalandos')
    placeholders.setdefault('PGUSER_STANDBY', 'standby')
    placeholders.setdefault('PGPASSWORD_STANDBY', 'standby')
    placeholders.setdefault('USE_ADMIN', 'PGPASSWORD_ADMIN' in placeholders)
    placeholders.setdefault('PGUSER_ADMIN', 'admin')
    placeholders.setdefault('PGPASSWORD_ADMIN', 'cola')
    placeholders.setdefault('PGUSER_SUPERUSER', 'postgres')
    placeholders.setdefault('PGPASSWORD_SUPERUSER', 'zalando')
    placeholders.setdefault('ALLOW_NOSSL', '')
    placeholders.setdefault('BGMON_LISTEN_IP', '0.0.0.0')
    placeholders.setdefault('PGPORT', '5432')
    placeholders.setdefault('SCOPE', 'dummy')
    placeholders.setdefault('RW_DIR', RW_DIR)
    placeholders.setdefault('SSL_TEST_RELOAD', 'SSL_PRIVATE_KEY_FILE' in os.environ)
    placeholders.setdefault('SSL_CA_FILE', '')
    placeholders.setdefault('SSL_CRL_FILE', '')
    placeholders.setdefault('SSL_CERTIFICATE_FILE', os.path.join(placeholders['RW_DIR'], 'certs', 'server.crt'))
    placeholders.setdefault('SSL_PRIVATE_KEY_FILE', os.path.join(placeholders['RW_DIR'], 'certs', 'server.key'))
    placeholders.setdefault('SSL_RESTAPI_CA_FILE', '')
    placeholders.setdefault('SSL_RESTAPI_CERTIFICATE_FILE', '')
    placeholders.setdefault('SSL_RESTAPI_PRIVATE_KEY_FILE', '')
    placeholders.setdefault('WALE_BACKUP_THRESHOLD_MEGABYTES', 102400)
    placeholders.setdefault('WALE_BACKUP_THRESHOLD_PERCENTAGE', 30)
    placeholders.setdefault('INITDB_LOCALE', 'en_US')
    # if Kubernetes is defined as a DCS, derive the namespace from the POD_NAMESPACE, if not set explicitely.
    # We only do this for Kubernetes DCS, as we don't want to suddently change, i.e. DCS base path when running
    # in Kubernetes with Etcd in a non-default namespace
    placeholders.setdefault('NAMESPACE', placeholders.get('POD_NAMESPACE', 'default')
    if USE_KUBERNETES and placeholders.get('DCS_ENABLE_KUBERNETES_API') else '')
    # use namespaces to set WAL bucket prefix scope naming the folder namespace-clustername for non-default namespace.
    placeholders.setdefault('WAL_BUCKET_SCOPE_PREFIX', '{0}-'.format(placeholders['NAMESPACE'])
    if placeholders['NAMESPACE'] not in ('default', '') else '')
    placeholders.setdefault('WAL_BUCKET_SCOPE_SUFFIX', '')
    placeholders.setdefault('WALE_ENV_DIR', os.path.join(placeholders['RW_DIR'], 'etc', 'wal-e.d', 'env'))
    placeholders.setdefault('USE_WALE', False)
    cpu_count = str(min(psutil.cpu_count(), 10))
    placeholders.setdefault('WALG_DOWNLOAD_CONCURRENCY', cpu_count)
    placeholders.setdefault('WALG_UPLOAD_CONCURRENCY', cpu_count)
    placeholders.setdefault('PAM_OAUTH2', '')
    placeholders.setdefault('CALLBACK_SCRIPT', '')
    placeholders.setdefault('DCS_ENABLE_KUBERNETES_API', '')
    placeholders.setdefault('KUBERNETES_ROLE_LABEL', 'spilo-role')
    placeholders.setdefault('KUBERNETES_SCOPE_LABEL', 'version')
    placeholders.setdefault('KUBERNETES_LABELS', KUBERNETES_DEFAULT_LABELS)
    placeholders.setdefault('KUBERNETES_USE_CONFIGMAPS', '')
    placeholders.setdefault('KUBERNETES_BYPASS_API_SERVICE', 'true')
    placeholders.setdefault('USE_PAUSE_AT_RECOVERY_TARGET', False)
    placeholders.setdefault('CLONE_METHOD', '')
    placeholders.setdefault('CLONE_WITH_WALE', '')
    placeholders.setdefault('CLONE_WITH_BASEBACKUP', '')
    placeholders.setdefault('CLONE_TARGET_TIME', '')
    placeholders.setdefault('CLONE_TARGET_INCLUSIVE', True)

    placeholders.setdefault('LOG_SHIP_SCHEDULE', '1 0 * * *')
    placeholders.setdefault('LOG_S3_BUCKET', '')
    placeholders.setdefault('LOG_TMPDIR', os.path.abspath(os.path.join(placeholders['PGROOT'], '../tmp')))
    placeholders.setdefault('LOG_BUCKET_SCOPE_SUFFIX', '')

    # see comment for wal-e bucket prefix
    placeholders.setdefault('LOG_BUCKET_SCOPE_PREFIX', '{0}-'.format(placeholders['NAMESPACE'])
    if placeholders['NAMESPACE'] not in ('default', '') else '')

    if placeholders['CLONE_METHOD'] == 'CLONE_WITH_WALE':
        # modify placeholders and take care of error cases
        name = set_extended_wale_placeholders(placeholders, 'CLONE_')
        if name is False:
            logging.warning('Cloning with WAL-E is only possible when CLONE_WALE_*_PREFIX '
                            'or CLONE_WALG_*_PREFIX or CLONE_WAL_*_BUCKET and CLONE_SCOPE are set.')
        elif name == 'S3':
            placeholders.setdefault('CLONE_USE_WALG', 'true')
    elif placeholders['CLONE_METHOD'] == 'CLONE_WITH_BASEBACKUP':
        clone_scope = placeholders.get('CLONE_SCOPE')
        if clone_scope and placeholders.get('CLONE_HOST') \
                and placeholders.get('CLONE_USER') and placeholders.get('CLONE_PASSWORD'):
            placeholders['CLONE_WITH_BASEBACKUP'] = True
            placeholders.setdefault('CLONE_PGPASS', os.path.join(placeholders['PGHOME'],
                                                                 '.pgpass_{0}'.format(clone_scope)))
            placeholders.setdefault('CLONE_PORT', 5432)
        else:
            logging.warning("Clone method is set to basebackup, but no 'CLONE_SCOPE' "
                            "or 'CLONE_HOST' or 'CLONE_USER' or 'CLONE_PASSWORD' specified")
    else:
        if set_extended_wale_placeholders(placeholders, 'STANDBY_') == 'S3':
            placeholders.setdefault('STANDBY_USE_WALG', 'true')

    placeholders.setdefault('STANDBY_WITH_WALE', '')
    placeholders.setdefault('STANDBY_HOST', '')
    placeholders.setdefault('STANDBY_PORT', '')
    placeholders.setdefault('STANDBY_CLUSTER', placeholders['STANDBY_WITH_WALE'] or placeholders['STANDBY_HOST'])

    if provider == PROVIDER_AWS and not USE_KUBERNETES:
        # AWS specific callback to tag the instances with roles
        placeholders['CALLBACK_SCRIPT'] = 'python3 /scripts/callback_aws.py'
        if placeholders.get('EIP_ALLOCATION'):
            placeholders['CALLBACK_SCRIPT'] += ' ' + placeholders['EIP_ALLOCATION']

    if any(placeholders.get(n) for n in AUTO_ENABLE_WALG_RESTORE):
        placeholders.setdefault('USE_WALG_RESTORE', 'true')
    if placeholders.get('WALG_AZ_PREFIX'):
        placeholders.setdefault('USE_WALG_BACKUP', 'true')
    if all(placeholders.get(n) for n in WALG_SSH_NAMES):
        placeholders.setdefault('USE_WALG_BACKUP', 'true')
    set_walg_placeholders(placeholders)

    placeholders['USE_WALE'] = any(placeholders.get(n) for n in AUTO_ENABLE_WALG_RESTORE +
                                   ('WAL_SWIFT_BUCKET', 'WALE_SWIFT_PREFIX', 'WAL_GCS_BUCKET',
                                    'WAL_GS_BUCKET', 'WALE_GS_PREFIX', 'WALG_GS_PREFIX'))

    if placeholders.get('WALG_BACKUP_FROM_REPLICA'):
        placeholders['WALG_BACKUP_FROM_REPLICA'] = str(placeholders['WALG_BACKUP_FROM_REPLICA']).lower()

    # Kubernetes requires a callback to change the labels in order to point to the new master
    if USE_KUBERNETES:
        if not placeholders.get('DCS_ENABLE_KUBERNETES_API'):
            placeholders['CALLBACK_SCRIPT'] = 'python3 /scripts/callback_role.py'

    placeholders.setdefault('postgresql', {})
    placeholders['postgresql'].setdefault('parameters', {})
    placeholders['WALE_BINARY'] = 'wal-g' if placeholders.get('USE_WALG_BACKUP') == 'true' else 'wal-e'
    placeholders['postgresql']['parameters']['archive_command'] = \
        'envdir "{WALE_ENV_DIR}" {WALE_BINARY} wal-push "%p"'.format(**placeholders) \
            if placeholders['USE_WALE'] else '/bin/true'

    if os.path.exists(MEMORY_LIMIT_IN_BYTES_PATH):
        with open(MEMORY_LIMIT_IN_BYTES_PATH) as f:
            os_memory_mb = int(f.read()) / 1048576
    else:
        os_memory_mb = sys.maxsize
    os_memory_mb = min(os_memory_mb, os.sysconf('SC_PAGE_SIZE') * os.sysconf('SC_PHYS_PAGES') / 1048576)

    # Depending on environment we take 1/4 or 1/5 of the memory, expressed in full MB's
    sb_ratio = 5 if USE_KUBERNETES else 4
    placeholders['postgresql']['parameters']['shared_buffers'] = '{}MB'.format(int(os_memory_mb / sb_ratio))
    # # 1 connection per 30 MB, at least 100, at most 1000
    placeholders['postgresql']['parameters']['max_connections'] = min(max(100, int(os_memory_mb / 30)), 1000)

    placeholders['instance_data'] = get_instance_metadata(provider)
    placeholders.setdefault('RESTAPI_CONNECT_ADDRESS', placeholders['instance_data']['ip'])

    placeholders['BGMON_LISTEN_IP'] = get_listen_ip()

    if 'SSL_CA' in placeholders and placeholders['SSL_CA_FILE'] == '':
        placeholders['SSL_CA_FILE'] = os.path.join(placeholders['RW_DIR'], 'certs', 'ca.crt')
    if 'SSL_CRL' in placeholders and placeholders['SSL_CRL_FILE'] == '':
        placeholders['SSL_CRL_FILE'] = os.path.join(placeholders['RW_DIR'], 'certs', 'server.crl')

    if {'SSL_RESTAPI_CERTIFICATE', 'SSL_RESTAPI_PRIVATE_KEY'} <= set(placeholders):
        if not placeholders['SSL_RESTAPI_CERTIFICATE_FILE']:
            placeholders['SSL_RESTAPI_CERTIFICATE_FILE'] = os.path.join(placeholders['RW_DIR'], 'certs',
                                                                        'rest-api-server.crt')
        if not placeholders['SSL_RESTAPI_PRIVATE_KEY_FILE']:
            placeholders['SSL_RESTAPI_PRIVATE_KEY_FILE'] = os.path.join(placeholders['RW_DIR'], 'certs',
                                                                        'restapi-api-server.key')
    if placeholders.get('SSL_RESTAPI_CA') and not placeholders['SSL_RESTAPI_CA_FILE']:
        placeholders['SSL_RESTAPI_CA_FILE'] = os.path.join(placeholders['RW_DIR'], 'certs', 'rest-api-ca.crt')

    return placeholders


def pystache_render(*args, **kwargs):
    render = pystache.Renderer(missing_tags='strict')
    return render.render(*args, **kwargs)


def get_dcs_config(config, placeholders):
    """
    该函数主要根据选择dcs的类型不同，并生成对应DCS相关的配置，当使用Kubernetes时，生成的内容大致如下：
    kubernetes:
      bypass_api_service: true
      labels:
        application: spilo
      pod_ip: 99.233.166.183
      ports:
      - name: postgresql
        port: 5432
      role_label: spilo-role
      scope_label: cluster-name
      use_endpoints: true
    """
    if USE_KUBERNETES and placeholders.get('DCS_ENABLE_KUBERNETES_API'):
        try:
            kubernetes_labels = json.loads(placeholders.get('KUBERNETES_LABELS'))
        except (TypeError, ValueError) as e:
            logging.warning("could not parse kubernetes labels as a JSON: {0}, "
                            "reverting to the default: {1}".format(e, KUBERNETES_DEFAULT_LABELS))
            kubernetes_labels = json.loads(KUBERNETES_DEFAULT_LABELS)

        config = {'kubernetes': {'role_label': placeholders.get('KUBERNETES_ROLE_LABEL'),
                                 'scope_label': placeholders.get('KUBERNETES_SCOPE_LABEL'),
                                 'labels': kubernetes_labels}}

        # 通常没有该配置
        if not placeholders.get('KUBERNETES_USE_CONFIGMAPS'):
            config['kubernetes'].update({'use_endpoints': True, 'pod_ip': placeholders['instance_data']['ip'],
                                         'ports': [{'port': 5432, 'name': 'postgresql'}]})
        # KUBERNETES_BYPASS_API_SERVICE默认为true
        if str(placeholders.get('KUBERNETES_BYPASS_API_SERVICE')).lower() == 'true':
            config['kubernetes']['bypass_api_service'] = True
    else:
        # (ZOOKEEPER|EXHIBITOR|CONSUL|ETCD3|ETCD)_(HOSTS|HOST|PORT|...)
        dcs_configs = defaultdict(dict)
        for name, value in placeholders.items():
            if '_' not in name:
                continue
            dcs, param = name.lower().split('_', 1)
            if dcs in PATRONI_DCS:
                if param == 'hosts':
                    if not (value.strip().startswith('-') or '[' in value):
                        value = '[{0}]'.format(value)
                    value = yaml.safe_load(value)
                elif param == 'discovery_domain':
                    param = 'discovery_srv'
                dcs_configs[dcs][param] = value
        for dcs in PATRONI_DCS:
            if dcs in dcs_configs:
                config = {dcs: dcs_configs[dcs]}
                break
        else:
            config = {}  # Configuration can also be specified using either SPILO_CONFIGURATION or PATRONI_CONFIGURATION

    if placeholders['NAMESPACE'] not in ('default', ''):
        config['namespace'] = placeholders['NAMESPACE']

    return config


def write_log_environment(placeholders):
    log_env = defaultdict(lambda: '')
    log_env.update(placeholders)

    aws_region = log_env.get('AWS_REGION')
    if not aws_region:
        aws_region = placeholders['instance_data']['zone'][:-1]
    log_env['LOG_AWS_HOST'] = 's3.{}.amazonaws.com'.format(aws_region)

    log_s3_key = 'spilo/{LOG_BUCKET_SCOPE_PREFIX}{SCOPE}{LOG_BUCKET_SCOPE_SUFFIX}/log/'.format(**log_env)
    log_s3_key += placeholders['instance_data']['id']
    log_env['LOG_S3_KEY'] = log_s3_key

    if not os.path.exists(log_env['LOG_TMPDIR']):
        os.makedirs(log_env['LOG_TMPDIR'])
        os.chmod(log_env['LOG_TMPDIR'], 0o1777)

    if not os.path.exists(log_env['LOG_ENV_DIR']):
        os.makedirs(log_env['LOG_ENV_DIR'])
    # 默认情况下LOG_ENV_DIR=/run/etc/log.d/env/
    for var in ('LOG_TMPDIR', 'LOG_AWS_HOST', 'LOG_S3_KEY', 'LOG_S3_BUCKET', 'PGLOG'):
        write_file(log_env[var], os.path.join(log_env['LOG_ENV_DIR'], var), True)


def write_wale_environment(placeholders, prefix, overwrite):
    s3_names = ['WALE_S3_PREFIX', 'WALG_S3_PREFIX', 'AWS_ACCESS_KEY_ID', 'AWS_SECRET_ACCESS_KEY',
                'WALE_S3_ENDPOINT', 'AWS_ENDPOINT', 'AWS_REGION', 'AWS_INSTANCE_PROFILE',
                'WALG_S3_SSE_KMS_ID', 'WALG_S3_SSE', 'WALG_DISABLE_S3_SSE', 'AWS_S3_FORCE_PATH_STYLE']
    azure_names = ['WALG_AZ_PREFIX', 'AZURE_STORAGE_ACCOUNT', 'AZURE_STORAGE_ACCESS_KEY',
                   'AZURE_STORAGE_SAS_TOKEN', 'WALG_AZURE_BUFFER_SIZE', 'WALG_AZURE_MAX_BUFFERS']
    gs_names = ['WALE_GS_PREFIX', 'WALG_GS_PREFIX', 'GOOGLE_APPLICATION_CREDENTIALS']
    swift_names = ['WALE_SWIFT_PREFIX', 'SWIFT_AUTHURL', 'SWIFT_TENANT', 'SWIFT_TENANT_ID', 'SWIFT_USER',
                   'SWIFT_USER_ID', 'SWIFT_USER_DOMAIN_NAME', 'SWIFT_USER_DOMAIN_ID', 'SWIFT_PASSWORD',
                   'SWIFT_AUTH_VERSION', 'SWIFT_ENDPOINT_TYPE', 'SWIFT_REGION', 'SWIFT_DOMAIN_NAME', 'SWIFT_DOMAIN_ID',
                   'SWIFT_PROJECT_NAME', 'SWIFT_PROJECT_ID', 'SWIFT_PROJECT_DOMAIN_NAME', 'SWIFT_PROJECT_DOMAIN_ID']
    ssh_names = WALG_SSH_NAMES
    walg_names = ['WALG_DELTA_MAX_STEPS', 'WALG_DELTA_ORIGIN', 'WALG_DOWNLOAD_CONCURRENCY',
                  'WALG_UPLOAD_CONCURRENCY', 'WALG_UPLOAD_DISK_CONCURRENCY', 'WALG_DISK_RATE_LIMIT',
                  'WALG_NETWORK_RATE_LIMIT', 'WALG_COMPRESSION_METHOD', 'USE_WALG_BACKUP',
                  'USE_WALG_RESTORE', 'WALG_BACKUP_COMPRESSION_METHOD', 'WALG_BACKUP_FROM_REPLICA',
                  'WALG_SENTINEL_USER_DATA', 'WALG_PREVENT_WAL_OVERWRITE', 'WALG_S3_CA_CERT_FILE',
                  'WALG_LIBSODIUM_KEY', 'WALG_LIBSODIUM_KEY_PATH', 'WALG_PGP_KEY', 'WALG_PGP_KEY_PATH',
                  'WALG_PGP_KEY_PASSPHRASE', 'no_proxy', 'http_proxy', 'https_proxy']

    wale = defaultdict(lambda: '')
    for name in ['PGVERSION', 'PGPORT', 'WALE_ENV_DIR', 'SCOPE', 'WAL_BUCKET_SCOPE_PREFIX', 'WAL_BUCKET_SCOPE_SUFFIX',
                 'WAL_S3_BUCKET', 'WAL_GCS_BUCKET', 'WAL_GS_BUCKET', 'WAL_SWIFT_BUCKET', 'BACKUP_NUM_TO_RETAIN',
                 'ENABLE_WAL_PATH_COMPAT'] + s3_names + swift_names + gs_names + walg_names + azure_names + ssh_names:
        wale[name] = placeholders.get(prefix + name, '')

    if wale.get('WAL_S3_BUCKET') or wale.get('WALE_S3_PREFIX') or wale.get('WALG_S3_PREFIX'):
        wale_endpoint = wale.pop('WALE_S3_ENDPOINT', None)
        aws_endpoint = wale.pop('AWS_ENDPOINT', None)
        aws_region = wale.pop('AWS_REGION', None)

        # for S3-compatible storage we want to specify WALE_S3_ENDPOINT and AWS_ENDPOINT, but not AWS_REGION
        if aws_endpoint or wale_endpoint:
            convention = 'path'
            if not wale_endpoint:
                wale_endpoint = aws_endpoint.replace('://', '+path://')
            else:
                match = re.match(r'^(\w+)\+(\w+)(://.+)$', wale_endpoint)
                if match:
                    convention = match.group(2)
                else:
                    logging.warning('Invalid WALE_S3_ENDPOINT, the format is protocol+convention://hostname:port, '
                                    'but got %s', wale_endpoint)
                if not aws_endpoint:
                    aws_endpoint = match.expand(r'\1\3') if match else wale_endpoint
            wale.update(WALE_S3_ENDPOINT=wale_endpoint, AWS_ENDPOINT=aws_endpoint, WALG_DISABLE_S3_SSE='true')
            wale['AWS_S3_FORCE_PATH_STYLE'] = 'true' if convention == 'path' else 'false'
            if aws_region and wale.get('USE_WALG_BACKUP') == 'true':
                wale['AWS_REGION'] = aws_region
        elif not aws_region:
            # try to determine region from the endpoint or bucket name
            name = wale.get('WAL_S3_BUCKET') or wale.get('WALE_S3_PREFIX')
            match = re.search(r'.*(\w{2}-\w+-\d)-.*', name)
            if match:
                aws_region = match.group(1)
            else:
                aws_region = placeholders['instance_data']['zone'][:-1]
            wale['AWS_REGION'] = aws_region
        else:
            wale['AWS_REGION'] = aws_region

        if not (wale.get('AWS_SECRET_ACCESS_KEY') and wale.get('AWS_ACCESS_KEY_ID')):
            wale['AWS_INSTANCE_PROFILE'] = 'true'
        if wale.get('USE_WALG_BACKUP') and wale.get('WALG_DISABLE_S3_SSE') != 'true' and not wale.get('WALG_S3_SSE'):
            wale['WALG_S3_SSE'] = 'AES256'
        write_envdir_names = s3_names + walg_names
    elif wale.get('WAL_GCS_BUCKET') or wale.get('WAL_GS_BUCKET') or \
            wale.get('WALE_GCS_PREFIX') or wale.get('WALE_GS_PREFIX') or wale.get('WALG_GS_PREFIX'):
        if wale.get('WALE_GCS_PREFIX'):
            wale['WALE_GS_PREFIX'] = wale['WALE_GCS_PREFIX']
        elif wale.get('WAL_GCS_BUCKET'):
            wale['WAL_GS_BUCKET'] = wale['WAL_GCS_BUCKET']
        write_envdir_names = gs_names + walg_names
    elif wale.get('WAL_SWIFT_BUCKET') or wale.get('WALE_SWIFT_PREFIX'):
        write_envdir_names = swift_names
    elif wale.get("WALG_AZ_PREFIX"):
        write_envdir_names = azure_names + walg_names
    elif wale.get("WALG_SSH_PREFIX"):
        write_envdir_names = ssh_names + walg_names
    else:
        return

    prefix_env_name = write_envdir_names[0]
    store_type = prefix_env_name[5:].split('_')[0]
    if not wale.get(prefix_env_name):  # WALE_*_PREFIX is not defined in the environment
        bucket_path = '/spilo/{WAL_BUCKET_SCOPE_PREFIX}{SCOPE}{WAL_BUCKET_SCOPE_SUFFIX}/wal/{PGVERSION}'.format(**wale)
        prefix_template = '{0}://{{WAL_{1}_BUCKET}}{2}'.format(store_type.lower(), store_type, bucket_path)
        wale[prefix_env_name] = prefix_template.format(**wale)
    # Set WALG_*_PREFIX for future compatibility
    if store_type in ('S3', 'GS') and not wale.get(write_envdir_names[1]):
        wale[write_envdir_names[1]] = wale[prefix_env_name]

    if not os.path.exists(wale['WALE_ENV_DIR']):
        os.makedirs(wale['WALE_ENV_DIR'])

    wale['WALE_LOG_DESTINATION'] = 'stderr'
    for name in write_envdir_names + ['WALE_LOG_DESTINATION', 'PGPORT'] + ([] if prefix else ['BACKUP_NUM_TO_RETAIN']):
        if wale.get(name):
            path = os.path.join(wale['WALE_ENV_DIR'], name)
            write_file(wale[name], path, overwrite)
            adjust_owner(path, gid=-1)

    if not os.path.exists(placeholders['WALE_TMPDIR']):
        os.makedirs(placeholders['WALE_TMPDIR'])
        os.chmod(placeholders['WALE_TMPDIR'], 0o1777)

    write_file(placeholders['WALE_TMPDIR'], os.path.join(wale['WALE_ENV_DIR'], 'TMPDIR'), True)


def update_and_write_wale_configuration(placeholders, prefix, overwrite):
    set_walg_placeholders(placeholders, prefix)
    write_wale_environment(placeholders, prefix, overwrite)


def write_clone_pgpass(placeholders, overwrite):
    pgpassfile = placeholders['CLONE_PGPASS']
    # pgpass is host:port:database:user:password
    r = {'host': escape_pgpass_value(placeholders['CLONE_HOST']),
         'port': placeholders['CLONE_PORT'],
         'database': '*',
         'user': escape_pgpass_value(placeholders['CLONE_USER']),
         'password': escape_pgpass_value(placeholders['CLONE_PASSWORD'])}
    pgpass_string = "{host}:{port}:{database}:{user}:{password}".format(**r)
    write_file(pgpass_string, pgpassfile, overwrite)
    os.chmod(pgpassfile, 0o600)
    adjust_owner(pgpassfile, gid=-1)


def check_crontab(user):
    with open(os.devnull, 'w') as devnull:
        cron_exit = subprocess.call(['crontab', '-lu', user], stdout=devnull, stderr=devnull)
        if cron_exit == 0:
            return logging.warning('Cron for %s is already configured. (Use option --force to overwrite cron)', user)
    return True


def setup_crontab(user, lines):
    lines += ['']  # EOF requires empty line for cron
    c = subprocess.Popen(['crontab', '-u', user, '-'], stdin=subprocess.PIPE)
    c.communicate(input='\n'.join(lines).encode())


def setup_runit_cron(placeholders):
    crontabs = os.path.join(placeholders['RW_DIR'], 'cron', 'crontabs')
    if not os.path.exists(crontabs):
        os.makedirs(crontabs)
        os.chmod(crontabs, 0o1730)
        if os.getuid() == 0:
            import grp
            os.chown(crontabs, -1, grp.getgrnam('crontab').gr_gid)

    link_runit_service(placeholders, 'cron')


def write_crontab(placeholders, overwrite):
    lines = ['PATH={PATH}'.format(**placeholders)]
    root_lines = []

    sys_nice_is_set = no_new_privs = None
    with open('/proc/self/status') as f:
        for line in f:
            if line.startswith('NoNewPrivs:'):
                no_new_privs = bool(int(line[12:]))
            elif line.startswith('CapBnd:'):
                sys_nice = 0x800000
                sys_nice_is_set = int(line[8:], 16) & sys_nice == sys_nice
    # 这里通过CapBnd判断当前用户是否拥有SYS_NICE权限，该权限能够让容器提升自己的nice值，及进程优先级
    # renice.sh 脚本会将：checkpointer、archiver、startup、walsender、walreceiver 的优先级减小20
    # PS：容器内通常没有该权限
    if sys_nice_is_set:
        renice = '*/5 * * * * bash /scripts/renice.sh'
        if not no_new_privs:
            lines += [renice]
        elif os.getuid() == 0:
            root_lines = [lines[0], renice]
        else:
            logging.info('Skipping creation of renice cron job due to running as not root '
                         'and with "no-new-privileges:true" (allowPrivilegeEscalation=false on K8s)')
    else:
        logging.info('Skipping creation of renice cron job due to lack of SYS_NICE capability')

    if placeholders.get('SSL_TEST_RELOAD'):
        env = ' '.join('{0}="{1}"'.format(n, placeholders[n]) for n in ('PGDATA', 'SSL_CA_FILE', 'SSL_CRL_FILE',
                                                                        'SSL_CERTIFICATE_FILE', 'SSL_PRIVATE_KEY_FILE')
                       if placeholders.get(n))
        hash_dir = os.path.join(placeholders['RW_DIR'], 'tmp')
        # 检查是否由于SSL证书的变化进行reload，如果是执行  pg_ctl reload 命令
        lines += ['*/5 * * * * {0} /scripts/test_reload_ssl.sh {1}'.format(env, hash_dir)]

    if bool(placeholders.get('USE_WALE')):
        lines += [('{BACKUP_SCHEDULE} envdir "{WALE_ENV_DIR}" /scripts/postgres_backup.sh' +
                   ' "{PGDATA}"').format(**placeholders)]

    if bool(placeholders.get('LOG_S3_BUCKET')):
        lines += [('{LOG_SHIP_SCHEDULE} nice -n 5 envdir "{LOG_ENV_DIR}"' +
                   ' /scripts/upload_pg_log_to_s3.py').format(**placeholders)]

    lines += yaml.load(placeholders['CRONTAB'])

    if len(lines) > 1 or root_lines:
        setup_runit_cron(placeholders)

    if len(lines) > 1 and (overwrite or check_crontab('postgres')):
        setup_crontab('postgres', lines)

    if root_lines and (overwrite or check_crontab('root')):
        setup_crontab('root', root_lines)


def write_pam_oauth2_configuration(placeholders, overwrite):
    pam_oauth2_args = placeholders.get('PAM_OAUTH2') or ''
    t = pam_oauth2_args.split()
    if len(t) < 2:
        return logging.info("No PAM_OAUTH2 configuration was specified, skipping")

    r = urlparse(t[0])
    if not r.scheme or r.scheme != 'https':
        return logging.error('First argument of PAM_OAUTH2 must be a valid https url: %s', r)

    pam_oauth2_config = 'auth sufficient pam_oauth2.so {0}\n'.format(pam_oauth2_args)
    pam_oauth2_config += 'account sufficient pam_oauth2.so\n'

    write_file(pam_oauth2_config, '/etc/pam.d/postgresql', overwrite)


def write_pgbouncer_configuration(placeholders, overwrite):
    pgbouncer_config = placeholders.get('PGBOUNCER_CONFIGURATION')
    if not pgbouncer_config:
        return logging.info('No PGBOUNCER_CONFIGURATION was specified, skipping')

    pgbouncer_dir = os.path.join(placeholders['RW_DIR'], 'pgbouncer')
    if not os.path.exists(pgbouncer_dir):
        os.makedirs(pgbouncer_dir)
    write_file(pgbouncer_config, pgbouncer_dir + '/pgbouncer.ini', overwrite)

    pgbouncer_auth = placeholders.get('PGBOUNCER_AUTHENTICATION') or placeholders.get('PGBOUNCER_AUTH')
    if pgbouncer_auth:
        write_file(pgbouncer_auth, pgbouncer_dir + '/userlist.txt', overwrite)

    link_runit_service(placeholders, 'pgbouncer')


def main():
    # 通过注入环境变量DEBUG，可以调整脚本的日志级别
    debug = os.environ.get('DEBUG', '') in ['1', 'true', 'TRUE', 'on', 'ON']
    args = parse_args()

    # loglevel
    logging.basicConfig(format='%(asctime)s - bootstrapping - %(levelname)s - %(message)s',
                        level=('DEBUG' if debug else (args.get('loglevel') or 'INFO').upper()))

    # Kubernetes环境中返回local
    provider = get_provider()

    # 根据provider和环境变量生成配置dict
    placeholders = get_placeholders(provider)
    logging.info('Looks like your running %s', provider)

    # pystache_render通过placeholders渲染了TEMPLATE形成config
    # config对象即是最后postgres.yml文件基本框架
    config = yaml.load(pystache_render(TEMPLATE, placeholders))
    # get_dcs_config 接口主要填写了 config["kubernetes"] 的内容
    config.update(get_dcs_config(config, placeholders))

    # 用户可以通过SPILO_CONFIGURATION或者PATRONI_CONFIGURATION环境变量注入配置，默认情况下以下内容被注入：
    # postgresql: {}
    # bootstrap:
    #   initdb:
    #     - auth-host: md5
    #     - auth-local: trust
    #   users:
    #     zalandos:
    #       password: ''
    #       options:
    #         - CREATEDB
    #         - NOLOGIN
    #   dcs: {}
    user_config = yaml.load(os.environ.get('SPILO_CONFIGURATION', os.environ.get('PATRONI_CONFIGURATION', ''))) or {}
    if not isinstance(user_config, dict):
        config_var_name = 'SPILO_CONFIGURATION' if 'SPILO_CONFIGURATION' in os.environ else 'PATRONI_CONFIGURATION'
        raise ValueError('{0} should contain a dict, yet it is a {1}'.format(config_var_name, type(user_config)))

    user_config_copy = deepcopy(user_config)
    # 合并入用户配置
    config = deep_update(user_config_copy, config)

    # 这里判断是否存在DCS的配置，如果没有在容器内部启动一个单点的etcd。
    # PS：这个应当是用于调试的逻辑？
    # PS：要求('zookeeper', 'exhibitor', 'consul', 'etcd3', 'etcd','kubernetes')之一的配置
    if provider == PROVIDER_LOCAL and not any(1 for key in config.keys() if key == 'kubernetes' or key in PATRONI_DCS):
        link_runit_service(placeholders, 'etcd')
        config['etcd'] = {'host': '127.0.0.1:2379'}

    pgdata = config['postgresql']['data_dir']
    version_file = os.path.join(pgdata, 'PG_VERSION')
    # if PG_VERSION file exists stick to it and build respective bin_dir
    # 这里根据数据目录中的PG_VERSION文件，在/usr/lib/postgresql目录下获取pg对应版本的BIN文件
    # 注意: centos和ubuntu安装postgresql时路径有区别：centos安装的路径为 /usr/pgsql-{PG_VERSION}
    if os.path.exists(version_file):
        with open(version_file) as f:
            version = f.read().strip()
            if is_valid_pg_version(version):
                config['postgresql']['bin_dir'] = get_bin_dir(version)

    # try to build bin_dir from PGVERSION if bin_dir is not set in SPILO_CONFIGURATION and PGDATA is empty
    # 当PG_VERSION不存时通过 PGVERSION 来设置 bin_dir 路径
    if not config['postgresql'].get('bin_dir'):
        version = os.environ.get('PGVERSION', '')
        if not is_valid_pg_version(version):
            version = get_binary_version('')
        config['postgresql']['bin_dir'] = get_bin_dir(version)

    placeholders['PGVERSION'] = get_binary_version(config['postgresql'].get('bin_dir'))
    version = float(placeholders['PGVERSION'])

    # 指定shared_preload_libraries，来源包括:
    # - Tempalte中写死：bg_mon,pg_stat_statements,pgextwlist,pg_auth_mon,set_user
    # - append_extensions函数中追加：timescaledb、pg_partman、pg_stat_kcache、pg_cron
    # PS：这些值实际上没有配置环境，导致spilo镜像中需要预装这些插件，否则会导致启动失败
    if 'shared_preload_libraries' not in user_config.get('postgresql', {}).get('parameters', {}):
        config['postgresql']['parameters']['shared_preload_libraries'] = \
            append_extensions(config['postgresql']['parameters']['shared_preload_libraries'], version)
    # pgextwlist 插件的相关配置
    if 'extwlist.extensions' not in user_config.get('postgresql', {}).get('parameters', {}):
        config['postgresql']['parameters']['extwlist.extensions'] = \
            append_extensions(config['postgresql']['parameters']['extwlist.extensions'], version, True)

    # Ensure replication is available
    # 定义config['bootstrap']['pg_hba']，实际情况下没有发现该配置
    if 'pg_hba' in config['bootstrap'] and not any(['replication' in i for i in config['bootstrap']['pg_hba']]):
        rep_hba = 'hostssl replication {} all md5'. \
            format(config['postgresql']['authentication']['replication']['username'])
        config['bootstrap']['pg_hba'].insert(0, rep_hba)

    # 逐一生成Sections配置文件，需要注意
    for section in args['sections']:
        logging.info('Configuring %s', section)
        if section == 'patroni':
            # 生成了postgres.yml 文件，并且将文件设置为postgres的uid和gid
            write_patroni_config(config, args['force'])
            adjust_owner(PATRONI_CONFIG_FILE, gid=-1)
            # 生成对应的runit文件
            link_runit_service(placeholders, 'patroni')
            # 创建/run/postgresql目录
            pg_socket_dir = '/run/postgresql'
            if not os.path.exists(pg_socket_dir):
                os.makedirs(pg_socket_dir)
                os.chmod(pg_socket_dir, 0o2775)
                adjust_owner(pg_socket_dir)

            # It is a recurring and very annoying problem with crashes (host/pod/container)
            # while the backup is taken in the exclusive mode which leaves the backup_label
            # in the PGDATA. Having the backup_label file in the PGDATA makes postgres think
            # that we are restoring from the backup and it puts this information into the
            # pg_control. Effectively it makes it impossible to start postgres in recovery
            # with such PGDATA because the recovery never-ever-ever-ever finishes.
            #
            # As a workaround we will remove the backup_label file from PGDATA if we know
            # for sure that the Postgres was already running with exactly this PGDATA.
            # As proof that the postgres was running we will use the presence of postmaster.pid
            # in the PGDATA, because it is 100% known that neither pg_basebackup nor
            # wal-e/wal-g are backing up/restoring this file.
            #
            # We are not doing such trick in the Patroni (removing backup_label) because
            # we have absolutely no idea what software people use for backup/recovery.
            # In case of some home-grown solution they might end up in copying postmaster.pid...
            postmaster_pid = os.path.join(pgdata, 'postmaster.pid')
            backup_label = os.path.join(pgdata, 'backup_label')
            if os.path.isfile(postmaster_pid) and os.path.isfile(backup_label):
                os.unlink(backup_label)
        # 生成对应的runit文件
        elif section == 'pgqd':
            link_runit_service(placeholders, 'pgqd')
        # 日志归档相关配置，从源码看应该在/run/etc/log.d/env/目录生成对应配置文件
        elif section == 'log':
            if bool(placeholders.get('LOG_S3_BUCKET')):
                write_log_environment(placeholders)
        # wal-e相关配置，生成的配置文件在/run/etc/wal-e.d/env
        elif section == 'wal-e':
            if placeholders['USE_WALE']:
                write_wale_environment(placeholders, '', args['force'])
        # 在/run/certs/目录生成server.crt 和 server.key文件
        #
        # 配置certificate时遵循以下逻辑：
        # - 在环境变量中注入了：SSL_CERTIFICATE和SSL_PRIVATE_KEY，如果有这两个环境变量的内容会被直接写入TLS文件
        # - SSL_PRIVATE_KEY_FILE指定的文件是否存在，如果存在直接退出
        # - 执行命令生成证书：/usr/bin/openssl req -nodes -new -x509 -subj '/CN=spilo.example.org' -keyout environment['SSL_PRIVATE_KEY_FILE'] -out environment['SSL_CERTIFICATE_FILE']
        #
        # 除了SSL_PRIVATE_KEY_FILE和SSL_CERTIFICATE_FILE，用户还可以指定REST API的证书，这个证书不会自动生成，只能通过环境变量注入
        elif section == 'certificate':
            write_certificates(placeholders, args['force'])
            write_restapi_certificates(placeholders, args['force'])
        # crontab模块初始化
        elif section == 'crontab':
            write_crontab(placeholders, args['force'])
        # pam-oauth2 初始化，主要是生成 /etc/pam.d/postgresql 文件的内容，目前看没啥用可以省略
        elif section == 'pam-oauth2':
            write_pam_oauth2_configuration(placeholders, args['force'])
        # 生成配置文件在/run/pgbouncer
        elif section == 'pgbouncer':
            write_pgbouncer_configuration(placeholders, args['force'])
        # bootstrap模块初始化，该模块是启动前配置模块，主要和wale等生成备份相关的，生成的配置文件在/run/etc/wal-e.d/env
        elif section == 'bootstrap':
            if placeholders['CLONE_WITH_WALE']:
                update_and_write_wale_configuration(placeholders, 'CLONE_', args['force'])
            if placeholders['CLONE_WITH_BASEBACKUP']:
                write_clone_pgpass(placeholders, args['force'])
       # 生成的配置文件在/run/etc/wal-e.d/env
        elif section == 'standby-cluster':
            if placeholders['STANDBY_WITH_WALE']:
                update_and_write_wale_configuration(placeholders, 'STANDBY_', args['force'])
        else:
            raise Exception('Unknown section: {}'.format(section))

    # We will abuse non zero exit code as an indicator for the launch.sh that it should not even try to create a backup
    sys.exit(int(not placeholders['USE_WALE']))


def escape_pgpass_value(val):
    output = []
    for c in val:
        if c in ('\\', ':'):
            output.append('\\')
        output.append(c)
    return ''.join(output)


if __name__ == '__main__':
    '''
    configure_spilo.py在launch.sh中被调用，最主要的功能是生成/run/postgres.yml(PS：$PGHOME/postgres.yml是该文件的软链接）。

    在精简模式中，调用configure_spilo.py的命令如下：
        python3 /scripts/configure_spilo.py patroni pgqd certificate pam-oauth2
    而全量模式中，调用 configure_spilo.py 的命令如下：
        /scripts/configure_spilo.py all
    '''
    main()

## launch.sh
#!/bin/sh

# 通过这种解压 /a.tar.xz 的方式可以最小限度的减小镜像的大小

if [ -f /a.tar.xz ]; then
    echo "decompressing spilo image..."
    if tar xpJf /a.tar.xz -C / > /dev/null 2>&1; then
        rm /a.tar.xz
        ln -snf dash /bin/sh
    else
        echo "failed to decompress spilo image"
        exit 1
    fi
fi

# 启动命令为 CMD ["/bin/sh", "/launch.sh", "init"]
# dumb-init正确处理容器接收的信号量，防止容器推出时子进程没有正常退出，出现僵尸进程。 PS：https://github.com/Yelp/dumb-init
#
# 此处 exec 命令会立即终止当前的shell，在原进程ID（1）不变的情况下，立即通过dumb-init重新执行/launch.sh脚本
if [ "x$1" = "xinit" ]; then
    exec /usr/bin/dumb-init -c --rewrite 1:0 -- /bin/sh /launch.sh
fi

# 以下两个参数都是和内存刷新脏页数据相关的
sysctl -w vm.dirty_background_bytes=67108864 > /dev/null 2>&1
sysctl -w vm.dirty_bytes=134217728 > /dev/null 2>&1

# 创建相关目录,这些环境变量在build镜像时已经注入，控制器覆盖了$PGDATA
# $RW_DIR=/run
# $PGROOT=$PGHOME/pgdata/pgroot  $PGHOME=/home/postgres
# $PGLOG=$PGROOT/pg_log
# $PGDATA=$PGROOT/data
mkdir -p "$PGLOG" "$PGDATA" "$RW_DIR/postgresql" "$RW_DIR/tmp" "$RW_DIR/certs"

# 下面的逻辑，将/etc/passwd账号中postgres的UID/GID替换为当前用户的UID/GID。由于系统使用UID区别用户，因此实际将当前用户变成为了postgres用户。
#
# 构建spilo镜像时，进行了如下处理：
# - 安装postgres->自动生成postgres用户
# - 修改postgres用户的HOME为指定路径
# - 将/etc/passwd权限改为了664
# - 将postgres追加到root Group中
#
# /etc/passwd 文件是所有用户可读的，每个用户占用一行，格式为：
#   "用户名:口令(通常就是x):UID:GID:注释性描述:HOME目录:登录Shell"
#
# PS：正常情况镜像是通过ROOT用户运行的，下面的逻辑执行不到
if [ "$(id -u)" -ne 0 ]; then
    sed -e "s/^postgres:x:[^:]*:[^:]*:/postgres:x:$(id -u):$(id -g):/" /etc/passwd > "$RW_DIR/tmp/passwd"
    cat "$RW_DIR/tmp/passwd" > /etc/passwd
    rm "$RW_DIR/tmp/passwd"
fi

# 生成postgresql-xx.csv这是csv格式的日志文件
# spilo会将postgresql的日志格式设置为：log_destination=csvlog，这是postgres的原生能力
for i in $(seq 0 7); do
    if [ ! -f "${PGLOG}/postgresql-$i.csv" ]; then
        touch "${PGLOG}/postgresql-$i.csv"
    fi
done

# 后面的脚本会在/run/certs中生成server.crt和server.key文件
# 这两文件会作为pg配置：ssl_key_file、ssl_cert_file
chown -R postgres: "$PGROOT" "$RW_DIR/certs"
chmod -R go-w "$PGROOT"
chmod 01777 "$RW_DIR/tmp"
chmod 0700 "$PGDATA"

# 调用configure_spilo.py生成配置文件
if [ "$DEMO" = "true" ]; then
    python3 /scripts/configure_spilo.py patroni pgqd certificate pam-oauth2
elif python3 /scripts/configure_spilo.py all; then

    # patroni_wait.sh 脚本检查本地pg进程是否启动完成，patroni_wait.sh需要指明pg是replicas还是master，默认是master，通过curl http://localhost:8008/replicas 或者 http://localhost:8008/master 是否返回200来判断
    # postgres_backup.sh 脚本基于wal-e或者wal-g，生成一个base backup文件
    #
    # 以下CMD的含义是：等待master启动成功，之后生成一个base backup文件，如果该节点是replicas或者启动失败，那么返回-2
    # PS：需要注意CMD是后台运行的因此不会阻塞启动脚本，而每次pg的master启动后都会生成一个base backup文件！！！
    CMD="/scripts/patroni_wait.sh -t 3600 -- envdir $WALE_ENV_DIR /scripts/postgres_backup.sh $PGDATA"
    if [ "$(id -u)" = "0" ]; then
        su postgres -c "PATH=$PATH $CMD" &
    else
        $CMD &
    fi
fi

sv_stop() {
    sv -w 86400 stop patroni
    sv -w 86400 stop /etc/service/*
}

[ ! -d /etc/service ] && exit 1  # /etc/service has not been created due to an error, the container is no-op

# trap命令捕捉系统信号 TERM QUIT INT ，并调用sv_stop函数
trap sv_stop TERM QUIT INT

# 通过runit启动 /etc/service 目录下的所有进程，PS：/etc/service 下的内容是 /scripts/configure_spilo.py 生成的
# 关于runit工具可以参考：
# - http://smarden.org/runit/index.html
# - http://kchard.github.io/runit-quickstart/
# - https://segmentfault.com/a/1190000006644578
/usr/sbin/runsvdir -P /etc/service &

wait
	#!/bin/sh

	# 通过这种解压 /a.tar.xz 的方式可以最小限度的减小镜像的大小

	if [ -f /a.tar.xz ]; then
	echo "decompressing spilo image..."
	if tar xpJf /a.tar.xz -C / > /dev/null 2>&1; then
	rm /a.tar.xz
	ln -snf dash /bin/sh
	else
	echo "failed to decompress spilo image"
	exit 1
	fi
	fi

	# 启动命令为 CMD ["/bin/sh", "/launch.sh", "init"]
	# dumb-init正确处理容器接收的信号量，防止容器推出时子进程没有正常退出，出现僵尸进程。 PS：https://github.com/Yelp/dumb-init
	#
	# 此处 exec 命令会立即终止当前的shell，在原进程ID（1）不变的情况下，立即通过dumb-init重新执行/launch.sh脚本
	if [ "x$1" = "xinit" ]; then
	exec /usr/bin/dumb-init -c --rewrite 1:0 -- /bin/sh /launch.sh
	fi

	# 以下两个参数都是和内存刷新脏页数据相关的
	sysctl -w vm.dirty_background_bytes=67108864 > /dev/null 2>&1
	sysctl -w vm.dirty_bytes=134217728 > /dev/null 2>&1

	# 创建相关目录,这些环境变量在build镜像时已经注入，控制器覆盖了$PGDATA
	# $RW_DIR=/run
	# $PGROOT=$PGHOME/pgdata/pgroot $PGHOME=/home/postgres
	# $PGLOG=$PGROOT/pg_log
	# $PGDATA=$PGROOT/data
	mkdir -p "$PGLOG" "$PGDATA" "$RW_DIR/postgresql" "$RW_DIR/tmp" "$RW_DIR/certs"

	# 下面的逻辑，将/etc/passwd账号中postgres的UID/GID替换为当前用户的UID/GID。由于系统使用UID区别用户，因此实际将当前用户变成为了postgres用户。
	#
	# 构建spilo镜像时，进行了如下处理：
	# - 安装postgres->自动生成postgres用户
	# - 修改postgres用户的HOME为指定路径
	# - 将/etc/passwd权限改为了664
	# - 将postgres追加到root Group中
	#
	# /etc/passwd 文件是所有用户可读的，每个用户占用一行，格式为：
	# "用户名:口令(通常就是x):UID:GID:注释性描述:HOME目录:登录Shell"
	#
	# PS：正常情况镜像是通过ROOT用户运行的，下面的逻辑执行不到
	if [ "$(id -u)" -ne 0 ]; then
	sed -e "s/^postgres:x:[^:]:[^:]:/postgres:x:$(id -u):$(id -g):/" /etc/passwd > "$RW_DIR/tmp/passwd"
	cat "$RW_DIR/tmp/passwd" > /etc/passwd
	rm "$RW_DIR/tmp/passwd"
	fi

	# 生成postgresql-xx.csv这是csv格式的日志文件
	# spilo会将postgresql的日志格式设置为：log_destination=csvlog，这是postgres的原生能力
	for i in $(seq 0 7); do
	if [ ! -f "${PGLOG}/postgresql-$i.csv" ]; then
	touch "${PGLOG}/postgresql-$i.csv"
	fi
	done

	# 后面的脚本会在/run/certs中生成server.crt和server.key文件
	# 这两文件会作为pg配置：ssl_key_file、ssl_cert_file
	chown -R postgres: "$PGROOT" "$RW_DIR/certs"
	chmod -R go-w "$PGROOT"
	chmod 01777 "$RW_DIR/tmp"
	chmod 0700 "$PGDATA"

	# 调用configure_spilo.py生成配置文件
	if [ "$DEMO" = "true" ]; then
	python3 /scripts/configure_spilo.py patroni pgqd certificate pam-oauth2
	elif python3 /scripts/configure_spilo.py all; then

	# patroni_wait.sh 脚本检查本地pg进程是否启动完成，patroni_wait.sh需要指明pg是replicas还是master，默认是master，通过curl http://localhost:8008/replicas 或者 http://localhost:8008/master 是否返回200来判断
	# postgres_backup.sh 脚本基于wal-e或者wal-g，生成一个base backup文件
	#
	# 以下CMD的含义是：等待master启动成功，之后生成一个base backup文件，如果该节点是replicas或者启动失败，那么返回-2
	# PS：需要注意CMD是后台运行的因此不会阻塞启动脚本，而每次pg的master启动后都会生成一个base backup文件！！！
	CMD="/scripts/patroni_wait.sh -t 3600 -- envdir $WALE_ENV_DIR /scripts/postgres_backup.sh $PGDATA"
	if [ "$(id -u)" = "0" ]; then
	su postgres -c "PATH=$PATH $CMD" &
	else
	$CMD &
	fi
	fi

	sv_stop() {
	sv -w 86400 stop patroni
	sv -w 86400 stop /etc/service/*
	}

	[ ! -d /etc/service ] && exit 1 # /etc/service has not been created due to an error, the container is no-op

	# trap命令捕捉系统信号 TERM QUIT INT ，并调用sv_stop函数
	trap sv_stop TERM QUIT INT

	# 通过runit启动 /etc/service 目录下的所有进程，PS：/etc/service 下的内容是 /scripts/configure_spilo.py 生成的
	# 关于runit工具可以参考：
	# - http://smarden.org/runit/index.html
	# - http://kchard.github.io/runit-quickstart/
	# - https://segmentfault.com/a/1190000006644578
	/usr/sbin/runsvdir -P /etc/service &

	wait