Haute disponibilité pour la surveillance du réseau
Le type de cluster Junos Space que vous créez détermine le degré de haute disponibilité du service de surveillance du réseau. Une structure Junos Space sans nœuds FMPM (Fault Monitoring and Performance Monitoring) utilise les deux nœuds de haute disponibilité (HA) du cluster pour protéger le service de surveillance du réseau contre les défaillances de nœuds. Toutefois, lorsqu’une fabric Junos Space comprend un ou plusieurs nœuds FMPM, la fonctionnalité de surveillance du réseau est désactivée sur les nœuds Junos Space et activée sur les nœuds FMPM.
Cette rubrique comprend les sections suivantes :
Fabric haute disponibilité sans nœuds FMPM
Lorsqu’une fabric Junos Space n’inclut pas de nœuds FMPM, le cluster Junos Space utilise une solution de réserve qui utilise les deux nœuds de haute disponibilité (HA) du cluster pour protéger le service de surveillance du réseau contre les défaillances de nœuds.
La figure 1 illustre comment la surveillance réseau s’exécute sur deux nœuds HA du cluster pour protéger le service en cas de défaillance d’un nœud.

Le service de surveillance réseau est automatiquement installé sur tous les nœuds du cluster. Toutefois, à tout moment, le service de surveillance réseau s’exécute uniquement sur le nœud qui possède actuellement l’adresse IP virtuelle (VIP) et il est responsable de toutes les fonctionnalités de gestion des pannes et des performances pour l’ensemble du cluster. La surveillance du réseau utilise la base de données PostgreSQL 9.1 pour ses besoins de stockage. Comme le montre la figure 1 , une réplication en streaming en temps réel avec archivage continu est mise en place entre les deux nœuds HA (nœud 1 et nœud 2 dans le cluster), ce qui garantit que la base de données de surveillance du réseau sur le nœud de secours est synchronisée en permanence avec la base de données de surveillance du réseau sur le nœud actif. En outre, une tâche cron s’exécute sur le nœud actif une fois par jour à minuit pour synchroniser le système de fichiers de surveillance du réseau avec le nœud de secours, ce qui garantit que tous les fichiers de configuration back-end utilisés par la surveillance du réseau sont également synchronisés entre les deux nœuds HA.
Lorsqu’un basculement d’adresse IP virtuelle vers le nœud de secours se produit, la surveillance du réseau est automatiquement démarrée sur le nœud. L’initialisation du service de surveillance réseau prend environ 3 à 5 minutes avant d’exécuter toutes les fonctionnalités de surveillance des pannes et des performances pour le cluster. Par conséquent, les utilisateurs de Junos Space peuvent s’attendre à une interruption de surveillance du réseau d’environ 3 à 5 minutes.
Le service de surveillance sur les deux nœuds HA est chargé de s’assurer que le service de surveillance du réseau s’exécute sur le nœud HA propriétaire de l’adresse IP virtuelle et non sur l’autre nœud HA (de secours). Comme nous l’avons déjà indiqué, le service de surveillance vérifie l’état de tous les services sur le nœud toutes les secondes. Si le service de surveillance détecte que le nœud est propriétaire de l’adresse IP virtuelle, mais qu’il n’exécute pas le service de surveillance du réseau, il démarre le service de surveillance du réseau et crée la tâche cron pour synchroniser les données de gestion des pannes et des performances avec l’autre nœud. Si le service de surveillance détecte que le nœud ne possède pas l’adresse IP virtuelle, mais qu’il exécute le service de surveillance du réseau, il arrête le service et supprime l’entrée de tâche cron pour la synchronisation des données.
Fabric haute disponibilité avec nœuds FMPM
Si vous gérez un réseau vaste ou complexe, vous souhaiterez peut-être dédier toutes vos fonctionnalités de surveillance des performances et du réseau à un nœud spécial appelé nœud FMPM (Fault Monitoring and Performance Monitoring). Lorsque vous créez une structure Junos Space avec un ou plusieurs nœuds FMPM, la fonctionnalité de surveillance du réseau est désactivée sur tous les nœuds Junos Space et activée sur les nœuds FMPM. Lorsque le premier nœud FMPM est ajouté à la structure, la fonctionnalité de surveillance du réseau est activée sur ce nœud et la base de données PostgreSQL 9.1 s’exécute sur ce nœud.
Lorsque vous ajoutez un deuxième noeud FMPM à la fabric, le premier noeud FMPM fonctionne comme noeud principal et le second noeud FMPM fonctionne comme noeud de secours. Le service de surveillance du réseau est automatiquement installé sur les deux nœuds FMPM de l’équipe FMPM. Toutefois, à tout moment, le service de surveillance du réseau s’exécute uniquement sur le nœud FMPM qui possède actuellement l’adresse VIP, et le service est responsable de toutes les fonctionnalités de gestion des pannes (FM) et de gestion des performances (PM) pour l’équipe FMPM. La surveillance du réseau utilise la base de données PostgreSQL 9.1 pour ses besoins de stockage.
Une réplication en streaming en temps réel avec archivage continu est mise en place entre les deux nœuds FMPM de l’équipe, ce qui garantit que la base de données de surveillance du réseau sur le nœud de secours est synchronisée en permanence avec la base de données de surveillance du réseau sur le nœud actif. En outre, une tâche cron s’exécute sur le nœud FMPM actif une fois par jour à minuit pour synchroniser le système de fichiers de surveillance du réseau avec le nœud FMPM de secours, ce qui garantit que tous les fichiers de configuration back-end utilisés par la surveillance du réseau sont également synchronisés entre les deux nœuds FMPM. Lorsqu’un basculement d’IP virtuelle vers le nœud FMPM de secours se produit, la surveillance du réseau est automatiquement démarrée sur le deuxième nœud FMPM. L’initialisation du service de surveillance réseau prend environ 3 à 5 minutes avant qu’il n’exécute toutes les fonctionnalités FM et PM pour l’équipe FMPM. Par conséquent, les utilisateurs de Junos Space peuvent s’attendre à une interruption de surveillance du réseau d’environ 3 à 5 minutes.
Le service de surveillance sur les deux nœuds est chargé de s’assurer que le service de surveillance du réseau s’exécute sur le nœud FMPM qui possède l’adresse IP virtuelle et ne s’exécute pas sur l’autre nœud FMPM (de secours). Comme nous l’avons déjà indiqué, le service de surveillance vérifie l’état de tous les services sur le nœud FMPM actif toutes les secondes. Si le service de surveillance détecte que le nœud FMPM possède l’adresse IP virtuelle mais n’exécute pas le service de surveillance du réseau, le service de surveillance démarre le service de surveillance du réseau et crée la tâche cron pour synchroniser les données de gestion des pannes et des performances avec l’autre nœud. Si le service de surveillance détecte que le nœud FMPM n’est pas propriétaire de l’adresse IP virtuelle, mais qu’il exécute le service de surveillance du réseau, le service de surveillance arrête le service et supprime l’entrée de tâche cron pour la synchronisation des données.