Paragon Automationのノードの再起動 |Paragon Automation(Pathfinder、Planner、Insights)24.1 |ジュニパーネットワークス

現在のParagon Automationクラスターデータをバックアップします。

バックアップしたデータを、クラスタ外のセキュリティで保護されたセカンダリサーバにコピーします。data.sh には、バックアップされたファイルの場所に関する情報が含まれています。scp -prv コマンドを実行して、バックアップしたファイルをローカルホストからクラスタ外のセカンダリサーバにコピーします。

health-check.sh スクリプトを使用して、ポッドにエラーがないか確認します。

kubectl get nodes コマンドを使用して、クラスタノードのステータスを表示します。ノードのステータスは Ready で、ロールは control-plane または none のいずれかである必要があります。

プライマリノードを遮断して、スケジューリングから削除します。

Kubernetes ノードをコード化すると、Kubernetes スケジューラで使用不可としてマークされ、新しいポッドをホストできなくなります。これは、現在実行中のポッドに影響を与えることなくノードのメンテナンスを実行する必要がある場合に便利です。

これにより、ノードが遮断され、新しいポッドをホストできなくなります。

ノードをコード化した後、ノードをドレインして実行中のポッドを削除し、他のノードに再スケジュールすることができます。次のコマンドを使用して、すべてのノードをドレインします (ノードからすべてのポッドを安全に削除します)。

再スケジュールを待機しているポッドがあるかどうかを確認します。

コード化されたノード上の保留中のプロセスが一覧表示されます。保留中のプロセスがないノードには、 <none>とマークされます。

スケジュールを待機しているポッドがない場合は、health-check.sh スクリプトを使用してポッドにエラーがないか再確認します。

接続されたノードをリブートします。

ノードの再起動には約 5 分から 10 分かかります。

プライマリノード1で次のコマンドを実行します。

クラスター内のポッドは、コマンドを実行してから 15 分以内に再分散されます。

ポッドが再配布されたら、health-check.sh スクリプトを使用してポッドにエラーがないか確認します。

新しく再起動したノードを特定します。

ステップ3からステップ12を繰り返して、Paragon Automationの他のノードを再起動します。