Zum Hauptinhalt gehen

Referenz der Metriken

Das Tick-Packaging von BlueMind bietet die Überwachung einer großen Anzahl von Daten (sogenannte Metriken). Einige der überwachten Daten sind Rohdaten, andere werden vorverarbeitet, um eine größere Relevanz zu erreichen und die Interpretation und Analyse zu erleichtern.

Jede Metrik enthält eine Baumstruktur, die Folgendes enthalten kann: :

  • datalocation : Servername
  • host : Name oder IP des Hosts
  • meterType : der Datentyp
    • gauge : Momentanwert
    • counter : Zähler mit Inkrementierung
    • distsum: Datenpaar, das einen Zähler und eine Menge enthält, z.B. :
      • -lmtpd.emailSize = (Anzahl der Emails, Gesamtgröße der Emails)
      • -lmtpd.emailRecipients = (Anzahl der Emails, Anzahl der Empfänger)
    • timer: identisch mit distsum, aber die Menge wird immer in Nanosekunden angegeben.
  • status : je nach Datentyp kann es sich um einen Status ok/failed (zum Beispiel erfolgreiche/fehlgeschlagene Anforderung), success/failure (zum Beispiel erfolgreiche/nicht erfolgreiche Authentifizierung) usw. handeln

Gemeinsame Daten

Im Allgemeinen werden die Metriken nach Komponenten gruppiert.

JVM

Für jede Komponente können Sie die JVM-Metriken finden:

  • **<composant>*.hprof: Die Anzahl der hprof-Dateien, die auf der Maschine existieren, um festzustellen, ob es einen Absturz gab
  • **<composant>*.jvm *: Alle Informationen über die jvm für diese Komponente (aktueller Speicherverbrauch, maximaler Verbrauch, etc.)

Heartbeat

In jedem Bestandteil, der Wechselwirkungen mit dem Kern hat, finden sich die folgenden Metriken, die dazu dienen zu überwachen, dass die Daten zum Status der Gesundheit (Heartbeat - wörtlich "Herzschlag") des Kerns korrekt vom Bestandteil empfangen werden:

Name der MetrikTypInhaltWeitere Informationen
heartbeat.receiver.ageGaugeAlter des Empfangs des letzten HeartbeatsEntspricht der Zeit zwischen 2 Heartbeats.
Der Kern sollte seinen Gesundheitszustand alle 4 Sekunden senden, längere Zeiten, die 8 Sekunden überschreiten, sollten also auf einen ordnungsgemäßen Betrieb hinweisen
heartbeat.receiver.failuresZählerAnzahl der fehlgeschlagenen Empfänge
heartbeat.receiver.latencyGaugeEmpfangsdauer des HeartbeatsZeit zwischen dem Senden des Heartbeats durch den Kern und dem Empfang durch den Bestandteil
heartbeat.receiver.latencyMaxGaugemaximale Empfangsdauer
heartbeat.receiver.receivedZählerAnzahl der OK-Empfänge

Hazelcast

Die Server, die Mitglieder des Hazelcast-Clusters sind, haben die folgende Metrik:

Name der MetrikTypInhaltWeitere Informationen
cluster.membersGaugeDer Wert dieser Metrik muss '3' sein.

Die Metriken

Name der MetrikTypInhaltWeitere Informationen
agent.metricsGatheredZählerAnzahl der vom Agenten gesammelten MetrikenDiese Metrik wird hauptsächlich verwendet, um zu überprüfen, ob der Agent noch in Betrieb ist: Wenn keine Daten vorhanden sind, bedeutet dies, dass der Agent nichts mehr sammelt und somit nicht mehr in Betrieb ist.
agent.vmware*Daten über die Maschine, die den Agenten hostetDer Agent ist nur aktiv, wenn die vmware-tools auf den Maschinen, auf denen BlueMind gehostet wird, erkannt werden. In diesem Fall werden die Metriken des "vSphere Guest SDK" extrahiert und historisiert.
Diese Metriken ermöglichen die Diagnose von Problemen im Zusammenhang damit, wie BlueMind auf VMware virtualisiert wird.
bluemind.cluster
bluemind.cluster.partitions
bm-coreBlueMind Hauptmaschine
callsCountZählerAnzahl der beim Core eingegangenen Anrufe
dirVersionGauge
directory.cluster.eventsZähler
handlingDurationTimerDauer der Bearbeitung von Anträgen
heartbeat.broadcastZähler
heartbeat.maxPeriodGauge
heartbeat.periodGauge
bm-easmobile Verbindungsdienst
executionTimeTimer
responseSizeDistSum
activeConnectionsGaugeAnzahl der aktiven Verbindungen
connectionCountZähler
deliveriesZähler
emailEmpfängerDistSumAnzahl der Empfänger pro E-Mail
emailSizeDistSumGröße der E-Mails
sessionDurationTimerSitzungsdauer
traffic.transportLatencyTimer
bm-milterAnalyse und Bearbeitung von E-Mails auf SMTP-Ebene
connectionsCountZähler
sessionDurationTimer
traffic.classZähler
traffic.sizeZähler
bm-webserverWebanwendungsserver
appCache.requestTimeTimer
appCache.requestsZähler
ftlTemplates.requestsZählerAnzahl der vom Webserver erzeugten Seitenaufrufe
staticFile.requestsZählerAnzahl der Anfragen zur Anzeige von statischen Seiten
bm-ysnpDatenvalidierungsdienst
authCountZählerAnzahl der bearbeiteten Anträge- status ok: Anfragen validiert (z.B. Authentifizierung akzeptiert für das von einer Person eingegebene Login/Passwort)
- status failed: Validierung abgelehnt (z.B. Authentifizierung fehlgeschlagen, da Passwort falsch)
Andere
cpuDaten über die Nutzung von Prozessorenermöglicht die Kontrolle der Nutzung und Verteilung von Prozessoren
DiskDaten zur Verwaltung des Speicherplatzesermöglicht die Kontrolle des belegten/freien/gesamten/etc. Speicherplatzes pro Laufwerk, Partition, Pfad usw.
diskioAnzahl der in Echtzeit geschriebenen/gelöschten Byteszeigt an, ob die Disc gut oder zu gut arbeitet.
elasticsearch*.Daten über ElasticSearchFür weitere Informationen und Details zu den ES-Metriken siehe die dedizierte Dokumentation
influxdb*.Daten aus der Metrik-Speicherbank
kapacitor*Daten über das Werkzeug selbst
kernel
kernel_vmstat
mem
memcached
netto
netstat
nginx
phpfpm
postfix_queue
postgresqlInformationen über die BlueMind-Datenbank
Prozesse
Swap
syslog
system