Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
 

Adaptive Stichprobenerstellung – Übersicht

Adaptives Sampling ist der Prozess der Überwachung der gesamten eingehenden Datenverkehrsrate auf dem Netzwerkgerät und der Bereitstellung intelligenter Rückmeldungen an Schnittstellen, um die Abtastraten auf Schnittstellen auf der Grundlage der Datenverkehrsbedingungen dynamisch anzupassen. Adaptives Sampling verhindert eine Überlastung der CPU und hält das System auf einem optimalen Niveau, selbst wenn sich die Datenverkehrsmuster auf den Schnittstellen ändern. Während die Abtastrate die konfigurierte Anzahl von Ausgangs- oder Eingangspaketen ist, aus denen ein Paket abgetastet wird, ist die adaptive Abtastrate die maximale Anzahl von Abtastungen, die pro Linecard generiert werden sollen, d. h., sie ist der Grenzwert für das adaptive Sampling. Die Stichprobenlast ist die Datenmenge (oder Anzahl der Pakete), die zu einem bestimmten Zeitpunkt über ein Netzwerk bewegt wird. Wenn Sie die Abtastrate erhöhen, verringern Sie die Abtastmenge und umgekehrt. Angenommen, die konfigurierte Abtastrate beträgt 2 (d. h. 1 Paket von 2 Paketen wird abgetastet), und dann wird diese Rate verdoppelt, sodass sie 4 ergibt, oder es wird nur 1 Paket von 4 Paketen abgetastet.

Die adaptive Abtastrate, d. h. die maximale Anzahl von Stichproben, die pro Linecard generiert werden sollen, konfigurieren Sie auf Hierarchieebene [edit protocols sflow adaptive-sample-rate] .

Um Genauigkeit und Effizienz der Abtastung zu gewährleisten, verwenden die Geräte der QFX-Serie eine adaptive sFlow-Abtastung. Adaptive Abtastung überwacht die Gesamtrate des eingehenden Datenverkehrs auf dem Gerät und gibt Feedback an die Schnittstellen, damit diese ihre Abtastrate dynamisch an die Verkehrsbedingungen anpassen können. Der sFlow-Agent liest alle 5 Sekunden die Statistiken zu den Schnittstellen und identifiziert fünf Schnittstellen mit der höchsten Anzahl von Samples. Wenn auf einem Standalone-Switch das CPU-Verarbeitungslimit erreicht ist, wird ein binärer Backoff-Algorithmus implementiert, um die Sampling-Last der fünf wichtigsten Schnittstellen um die Hälfte zu reduzieren. Die angepasste Abtastrate wird dann auf die fünf wichtigsten Schnittstellen angewendet.

Die Verwendung von adaptivem Sampling verhindert eine Überlastung der CPU und sorgt dafür, dass das Gerät auch dann auf optimalem Niveau arbeitet, wenn sich die Datenverkehrsmuster auf den Schnittstellen ändern. Die reduzierte Probenahmelast wird verwendet, bis:

  • Sie starten das Gerät neu.

  • Sie konfigurieren eine neue Abtastrate.

  • Die Fallback-Funktion für adaptive Stichproben erhöht die Stichprobenlast, da die Anzahl der generierten Stichproben kleiner als der konfigurierte Schwellenwert ist.

Wenn eine bestimmte Schnittstelle nicht konfiguriert ist, wird die IP-Adresse der nächsten Schnittstelle in der Prioritätenliste als IP-Adresse für den Agenten verwendet. Nachdem dem Agenten eine IP-Adresse zugewiesen wurde, wird die Agent-ID erst geändert, wenn der sFlow-Dienst neu gestartet wird. Mindestens eine Schnittstelle muss konfiguriert werden, damit dem Agenten eine IP-Adresse zugewiesen werden kann.

Betrachtungen

Bei der QFX-Serie umfassen die Einschränkungen des sFlow-Datenverkehrs-Samplings Folgendes:

  • Das sFlow-Sampling auf Eingangsschnittstellen erfasst keinen CPU-gebundenen Datenverkehr.

  • sFlow-Sampling auf Ausgangsschnittstellen unterstützt keine Broadcast- und Multicast-Pakete.

  • Ausgangsbeispiele enthalten keine Änderungen, die am Paket in der Ausgangspipeline vorgenommen wurden.

  • Wenn ein Paket aufgrund eines Firewallfilters verworfen wird, wird der Ursachencode für das Verwerfen des Pakets nicht an den Collector gesendet.

  • Das out-priority Feld für ein VLAN wird bei Eingangs- und Ausgangsbeispielen immer auf 0 (Null) gesetzt.

  • Sie können die sFlow-Überwachung nicht für eine Link Aggregation Group (LAG) konfigurieren, aber Sie können sie individuell für eine LAG-Mitgliedsschnittstelle konfigurieren.

  • Da auf Switches der QFX10000-Serie für eine Gruppe von Ports in einer Multicast-Gruppe das Minimum der konfigurierten sFlow-Rate oder die aggressivste Abtastrate unter diesen Ports in der Eingangs-Pipeline für Ausgangspakete erfolgt, wird für das Sampling über alle Ports in dieser Gruppe hinweg das Minimum der konfigurierten sFlow-Rate oder die aggressivste Samplerate unter diesen Ports verwendet.

  • Ab Junos OS Version 19.4 und höher wird auf Switches der QFX10000-Serie der Zielport eines abgetasteten UDP-Pakets 6635 lautet und das Paket keinen gültigen MPLS-Header enthält, das Paket mit Datenstromabtastung beschädigt oder abgeschnitten. Das eigentliche Paket wird weitergeleitet.

  • Auf eigenständigen Switches der QFX10000-Serie und dem Virtual Chassis der QFX-Serie (mit QFX3500- und QFX3600-Switches) werden Ausgangs-Firewall-Filter nicht auf sFlow-Sampling-Pakete angewendet. Auf diesen Plattformen unterscheidet sich die Softwarearchitektur von der auf anderen Geräten der QFX-Serie, und sFlow-Pakete werden von der Routing-Engine (nicht von der Linecard auf dem Host) gesendet und übertragen den Switch nicht. Ausgangs-Firewall-Filter wirken sich auf Datenpakete aus, die einen Switch transtieren, aber nicht auf Pakete, die von der Routing-Engine gesendet werden. Daher werden sFlow-Sampling-Pakete immer an den sFlow-Kollektor gesendet.

Funktionsweise von adaptivem Sampling

Alle paar Sekunden oder jeden Zyklus sammelt der sFlow-Agent die Schnittstellenstatistiken. Aus diesen aggregierten Statistiken wird eine durchschnittliche Anzahl von Abtastungen pro Sekunde für den Zyklus berechnet. Die Zykluslänge hängt von der Plattform ab:

  • Alle 12 Sekunden für Switches der EX-Serie und QFX5K sowie Router der MX-Serie und PTX-Serie

  • Alle 5 Sekunden für andere Switches der QFX-Serie als QFX5K

Wenn die kombinierte Abtastrate aller Schnittstellen auf einer Linecard die adaptive Abtastrate überschreitet, wird ein binärer Backoff-Algorithmus initiiert, der die Abtastlast auf den Schnittstellen verringert. Adaptives Sampling verdoppelt die Abtastrate an den betroffenen Grenzflächen, wodurch die Abtastlast um die Hälfte reduziert wird. Dieser Vorgang wird so lange wiederholt, bis die CPU-Auslastung aufgrund von sFlow auf einer bestimmten Linecard auf ein akzeptables Niveau gesunken ist.

Welche Schnittstellen auf einer Linecard am adaptiven Sampling teilnehmen, hängt von der Plattform ab:

  • Bei Routern der MX-Serie und Switches der EX-Serie werden die Abtastraten auf allen Schnittstellen auf der Linecard angepasst.

  • Für Router der PTX-Serie und Switches der QFX-Serie werden nur die fünf Schnittstellen mit den höchsten Abtastraten auf der Linecard angepasst.

Für alle Plattformen bleiben die erhöhten Abtastraten so lange in Kraft, bis eine der folgenden Bedingungen erfüllt ist:

  • Das Gerät wird neu gestartet.

  • Eine neue Abtastrate wird konfiguriert.

Wenn Sie die Fallback-Funktion für adaptives Sampling aktiviert haben und die Anzahl der Samples aufgrund einer Datenverkehrsspitze auf den konfigurierten Schwellenwert für den Sample-Grenzwert ansteigt, wird die adaptive Samplingrate umgekehrt.

Fallback für adaptives Sampling

Die Fallback-Funktion für adaptives Sampling verwendet nach der Konfiguration und nach dem adaptiven Sampling einen binären Backup-Algorithmus, um die Samplingrate zu verringern (und damit die Samplinglast zu erhöhen), wenn die Anzahl der generierten Samples kleiner als der konfigurierte sample-limit-threshold Wert ist, ohne den normalen Datenverkehr zu beeinträchtigen.

Ab Junos OS Version 18.3R1 unterstützt Junos OS für Switches der EX-Serie die Fallback-Funktion für adaptives Sampling. Ab Junos OS Version 19.1R1 unterstützt Junos OS für Geräte der MX-, PTX- und QFX-Serie die Fallback-Funktion für adaptives Sampling.

Das Fallback für adaptives Sampling ist standardmäßig deaktiviert. Um diese Funktion zu aktivieren, fügen Sie die fallback Optionen und adaptive-sample-rate sample-limit-threshold in die [edit protocols sflow adaptive-sample-rate] Hierarchieebene ein.

Nachdem eine adaptive Stichprobenentnahme stattgefunden hat und die Linecard eine unterdurchschnittliche Leistung aufweist (d. h., die Anzahl der in einem Zyklus generierten Stichproben kleiner ist als der konfigurierte Wert für die sample-limit-threshold Anweisung), wird die angepasste Rate für fünf kontinuierliche Zyklen adaptiver Stichprobenentnahme umgekehrt. Wenn die umgekehrte Adaption stattgefunden hat und die Anzahl der in einem Zyklus erzeugten Samples wieder weniger als die Hälfte der aktuellen adaptierten Rate beträgt (und daher für fünf kontinuierliche Zyklen), kann eine weitere umgekehrte Adaption stattfinden.

Eine umgekehrte Anpassung findet nicht statt, wenn die Schnittstellen bereits die konfigurierte Rate aufweisen.

Einschränkungen bei adaptivem Sampling

Im Folgenden sind die Einschränkungen der Funktion "Adaptive Sample" aufgeführt:

  • Wenn Sie sFlow auf Standalone-Routern oder eigenständigen Switches der QFX-Serie auf mehreren Schnittstellen und mit einer hohen Abtastrate konfigurieren, empfehlen wir, einen Collector anzugeben, der sich im Datennetzwerk und nicht im Verwaltungsnetzwerk befindet. Ein hohes Volumen an sFlow-Datenverkehr im Verwaltungsnetzwerk kann den Datenverkehr der Verwaltungsschnittstelle beeinträchtigen.

  • Auf Routern unterstützt sFlow keinen ordnungsgemäßen Neustart. Wenn ein ordnungsgemäßer Neustart erfolgt, wird die adaptive Abtastrate auf die vom Benutzer konfigurierte Abtastrate festgelegt.

  • Auf einer mit Geschwindigkeit wählbaren Linecard (die mehrere Geschwindigkeiten unterstützt) werden Schnittstellen mit der höchsten Abtastanzahl für das adaptive Sampling-Fallback ausgewählt. Der Sicherungsalgorithmus wählt die Schnittstellen aus, auf denen die adaptive Abtastrate maximal oft erhöht wird, und verringert dann alle fünf Sekunden die Abtastrate auf jeder dieser Schnittstellen. Auf einer Linecard mit einem Tarif wird jedoch nur eine Abtastrate pro Linecard unterstützt, und der Fallbackmechanismus für adaptives Sampling sichert die Abtastrate auf allen Schnittstellen der Linecard.