システムのトラブルシューティング
Junos OS プロセスで生成されたコア ファイルの保存
デフォルトでは、内部Junos OSプロセスがコアファイルを生成すると、そのファイルと関連するコンテキスト情報は、デバッグ目的で /var/tmp/process-name.core.core-number という名前の圧縮 tar ファイルに保存されます。TGZです。コンテキスト情報には、設定およびシステムログメッセージファイルが含まれます。
コアファイルおよび関連するコンテキスト情報の保存を無効にするには:
[edit system] no-saved-core-context;
コアファイルのみを保存するには、次のようにします。
[edit system] saved-core-files number;
ここで、 number は保存するコア・ファイルの数で、1 から 10 までの値を指定できます。
コア・ファイルをコンテキスト情報とともに保存するには、次のようにします。
[edit system] saved-core-context;
Junos OS プロセスからのコア ファイルの表示
Junos OS 内部プロセスがコア ファイルを生成すると、その出力は /var/crash/ と /var/tmp/ にあります。Junos OS Evolvedの場合、出力コアファイルは、ルーティングエンジンコアファイルの場合は /var/core/ 、FPCコアファイルの場合は /var/lib/ftp/in/にあります 。これらのディレクトリを使用すると、大規模なネットワーク全体の中核的な問題をすばやく見つけることができます。
CLI コマンド show system core-dumps を使用して、コア ファイルを表示します。
root@host> show system core-dumps -rw------- 1 root wheel 268369920 Jun 18 17:59 /var/crash/vmcore.0 -rw-rw---- 1 root field 3371008 Jun 18 17:53 /var/tmp/rpd.core.0 -rw-r--r-- 1 root wheel 27775914 Jun 18 17:59 /var/crash/kernel.0
参照
システム状態カウンターを収集して、システム デバッグ用の情報をキャプチャする
ネットワーク デバイス上のシステム状態カウンターを収集してアーカイブできます。システムの問題をデバッグする際にJTACにサポートを要請すると、お客様とJTACサポートチームは、システムの問題が発生する前の定期的なインスタンスでシステムで何が起きていたかを確認できます。
この機能をサポートするネットワーク デバイスは、RE、PFE、SHELL カウンターおよびその他のシステム状態カウンターを定期的に収集するシェル スクリプトを実行します。カウンターは、プロトコル関連または CPU 関連のいずれかです。収集されたカウンターは、var/log ディレクトリの counter.log ファイルに保存されます。同じディレクトリ内の counter.info ファイルに、スクリプト実行パラメータの設定が記録されます。
カウンターはタイムスタンプ付きで counter.log ファイルに書き込まれ、デバッグ プロセスに役立ちます。
スクリプトの実行をカスタマイズするには、次の 2 つの方法があります。
デフォルトのスクリプト実行パラメータ値は、 counter.info ファイルを編集して変更できます。このタスクを実行するには、
super-userとしてログインする必要があります。 「スクリプト実行パラメーター値の変更方法」を参照してください。スクリプトの実行を再起動し、後で停止できます。通常、これは counter.info ファイルが削除または編集されたために行われます。 スクリプトの実行を再開または停止する方法を参照してください。
シェルスクリプトの内容と実行方法
2 セットのカウンターが定期的に収集されます。
-
SET1 — このセットは、時間的制約のあるアプリケーションのシステム状態を 9 秒の短い間隔で定期的に収集します。
-
SET2 — このセットは、システム状態を 60 分のゆっくりとした間隔で定期的に収集します。
ソフトウェアは、SET1およびSET2カウンタの収集を開始する前に、CPU使用率をチェックします。ソフトウェアが高い CPU 使用率 (85% 以上) を検出した場合、通常指定されたカウンターは収集されません。代わりに、通常指定されたカウンターのセットよりも小さいセットを構成するさまざまなカウンターが収集されます。
スクリプトの実行方法を次に示します。
シェルスクリプトは、ネットワークデバイスの起動から240秒後に実行を開始します。
SET1 が最初に実行されます。
SET1のいずれかのコマンドが割り当てられた時間内に終了しない場合、スクリプトはそのコマンドの実行を切り捨て、CLI出力コレクションを
counter.logファイルに保存してから次のコマンドに進みます。SET1 の実行が終了すると、SET2 が開始されます。この場合も、割り当てられた時間内に完了しなかったコマンドは切り捨てられ、CLI出力コレクションは
counter.logファイルに保存され、スクリプトは次の行項目に移動します。CLI 出力の収集中にスクリプトの実行が再起動または停止された場合、スクリプトは進行中の CLI 出力の収集を完了し、正常に終了します。
super-userとしてログインし、SET1とSET2のCLIリストなど、スクリプトの実行パラメータを編集できます。
How to Change Script-Execution Parameter Values を参照してください。
スクリプト実行パラメーター値を変更する方法
SET1およびSET2のCLIリストや、アーカイブするログファイルの数など、シェルスクリプト実行パラメータ値を変更することができます。パラメータ値を変更するには、 super-user としてログインする必要があります。
表 1 は、 counter.info ファイルで編集できるパラメーター設定をリストしています。
| 設定 | の説明 | デフォルトの | 使用上の注意 |
|---|---|---|---|
| SET1_TIME | SET1 の広告申込情報の収集を高速で実行する時間間隔(秒単位) | 9秒 | < SET2_TIME に設定 |
| SET2_TIME | 行項目のSET2コレクションを低速間隔で実行する時間間隔(秒単位) | 3600秒 | > SET1_TIME に設定 |
| MAX_CLI_EXECUTION_TIME | 各 CLI 出力収集の完了を待つ最大時間間隔(秒単位) | 25秒 | CLI 出力収集にこの時間よりも時間がかかる場合、スクリプトはその特定の CLI 出力収集を終了し、スクリプト内の次のステートメントを実行します。この動作により、スクリプトはすべてのステートメントを確実に実行します。 |
| SET1_ON | 高速カウンター収集を有効または無効にします | 1 (有効) | |
| SET2_ON | 低速カウンター収集の有効化および無効化 | 1 (有効) | |
| LOG_FILE_ARCHIVE_MIN_SIZE | アーカイブするファイルの最小サイズcounter.log | 1024キロメートル競走 | |
| LOG_FILE_ARCHIVE_COUNT | アーカイブする counter.log ファイルの数 | 10 | |
| バージョン | counter.info ファイルのバージョン番号 |
注意:
/var/log/counter.infoファイルの VERSION 値は更新
しないでください。
|
|
| スクリプトで実行されるコマンドのSET1およびSET2 CLIリスト | CLIのリストは、以下のサブリストに分かれています。
手記:CPU使用率が>85%と検出された場合、RE_CPU、PFE_CPU、およびSHELL_CPUに記載されているCLIの出力がSET1_TIMEとSET2_TIMEの間隔で収集されます。
|
各セットには、CLIコマンドのデフォルトリストが付属しています。 | デフォルトのCLIリストに必要なすべてのシステム情報を提供しない場合は、CLIリストを編集して、必要な追加のシステム情報のカウンターを取得します。 |
スクリプトの実行を再開または停止する方法
counter.info ファイルに変更を加えた場合は、restartコマンドを使用してスクリプトを手動で実行します。
user@host> request restart system-counter-script
stopコマンドを使用して、スクリプトの実行を停止します。
user@host> request stop system-counter-script