节点启动或停止失败类问题 可能影响 DN主节点启动失败,会导致访问到该DN的节点SQL报错,实例部分不可用; CN主节点启动失败,会导致流入该节点的SQL语句报错,流入其它CN主节点的DDL语句报错; CN/DN备节点失败失败,如果开启同步复制,同步复制节点数量不足且未启用退化策略时,会导致DDL、DML语句卡住; CN/DN备节点失败失败,可能会导致无可用备节点,主节点再次异常会导致实例不可用,有数据丢失风险。 解决步骤 1. 按照错误提示,修正pghba.conf文件内容; 2. 重新发起节点启动任务,或等待节点自动拉起。 postgresql.conf文件内容错误导致启动失败问题 问题描述 节点启动失败,启动日志(在Agent目录logs/clslog下对应节点的日志pgctl.startxxx.log)显示报错 configuration file "....../pghba.conf" contains errors,如: 20240115 01:01:08.874 GMT [21832,coord(0,0)] FATAL: configuration file "/data/xxx/....../postgresql.conf" contains errors 而前一行会提示错误位置和错误原因,例如: LOG: unrecognized configuration parameter "workmam" in file "/data/xxx/....../postgresql.conf" line 23 这里显示第23行的参数 workman无效,此处是参数名拼写错误,应该是workmem。 postgresql.conf中配置加载的参数文件postgresql.conf.user,或postgresql.auto.conf文件内容错误,也会启动失败,报错同上,仅指向文件不同。 需要说明的是,配置文件中参数名错误会导致节点启动失败,而参数值错误不会导致节点启动失败,只是参数值设置失效,仍会使用默认值。参数值错误,在启动启动日志(在Agent目录logs/clslog下对应节点的日志pgctl.startxxx.log)中会有类似如下提示: LOG: invalid value for parameter "workmem": "4m" HINT: Valid units for this parameter are "kB", "MB", "GB", and "TB". 这里显示workmem参数值错误,并给出了可选说明。