Zum Hauptinhalt springen

Metrik-Referenz

Das Packaging-Tick von BlueMind ermöglicht das Monitoring einer großen Anzahl von Daten (Metriken genannt). Einige der überwachten Daten sind roh, andere werden jedoch vorverarbeitet, um eine größere Relevanz zu erhalten und die Interpretation und Analyse zu erleichtern.

Jede Metrik hat eine Baumstruktur, die folgende Elemente enthalten kann:

  • datalocation: Servername
  • host: Name oder IP des Hosts
  • meterType: der Datentyp
    • gauge: momentane Messung
    • counter: inkrementaler Zähler
    • distsum: Datenpaar bestehend aus einem Zähler und einer Menge, z. B.:
      • -lmtpd.emailSize = (Anzahl der Emails, Gesamtgröße der Emails)
      • -lmtpd.emailRecipients = (Anzahl der Emails, Anzahl der Empfänger)
    • timer: wie distsum, aber die Menge wird immer in Nanosekunden angegeben
  • status: je nach Art der Daten kann es sich um einen Status ok/failed handeln (z.B. erfolgreiche/fehlgeschlagene Anfrage), success/failure (z.B. erfolgreiche/fehlgeschlagene Authentifizierung) usw.

Gemeinsame Daten

Im Allgemeinen sind die Metriken nach Komponenten gruppiert.

JVM

Für jede Komponente können Sie die Metriken für die JVM finden:

  • bm-"Komponente".hprof: Die Anzahl der auf dem Rechner vorhandenen hprof-Dateien ermöglicht festzustellen, ob es einen Absturz gab
  • bm-"Komponente".jvm. alle jvm-Informationen für diese Komponente (aktueller Speicherverbrauch, Maximum, etc.)

Heartbeat

In jeder Komponente, die mit dem Core interagiert, werden die folgenden Metriken verwendet, um zu überwachen, dass die Core-Zustandsdaten (Heartbeat) von der Komponente empfangen werden:

Name der MetrikTypInhaltWeitere Informationen
heartbeat.receiver.ageGaugeAlter des letzten Heartbeat-EmpfangsEntspricht der Zeit zwischen 2 Heartbeats.
Der Core soll alle 4 Sekunden seinen Gesundheitszustand senden, längere Abstände, die ggf. 8 Sekunden überschreiten, müssen daher als Funktionswarnung gedeutet werden.
heartbeat.receiver.failuresCounterAnzahl der Empfangsfehlschläge
heartbeat.receiver.latencyGaugeheartbeat-EingangsdauerZeit zwischen dem Senden des Heartbeats durch den Core und dem Empfang durch die Komponente
heartbeat.receiver.latencyMaxGaugemaximale Eingangsdauer
heartbeat.receiver.receivedCounterAnzahl der Empfänge OK

Hazelcast

Server, die Mitglieder des Hazelcast-Clusters sind, haben die folgende Metrik:

Name der MetrikTypInhaltWeitere Informationen
cluster.membersGaugeder Wert dieser Metrik muss '3' sein

Metriken

Name der MetrikTypInhaltWeitere Informationen
agent.metricsGatheredCounterAnzahl der vom Agent gesammelten MetrikenDiese Metrik wird hauptsächlich verwendet, um zu überprüfen, ob der Agent noch in Betrieb ist: das Fehlen von Daten zeigt an, dass der Agent nichts mehr sammelt, also nicht mehr funktioniert
agent.vmware*Daten, die den Rechner betreffen, auf dem der Agent läuftDer Agent ist nur aktiv, wenn vmware-Tools auf Rechnern erkannt wird, auf denen BlueMind gehostet wird. In diesem Fall werden die Metriken des "vSphere Guest SDK" extrahiert und historisiert.
Diese Metriken ermöglichen es, Probleme zu diagnostizieren, die mit der Art und Weise der Virtualisierung von BlueMind auf vmware zusammenhängen.
bluemind.cluster
bluemind.cluster.partitions
bm-coreBlueMind Hauptmaschine
callsCountCounterAnzahl der vom Core empfangenen Anrufe
dirVersionGauge
directory.cluster.eventsCounter
handlingDurationTimerAnfragebearbeitungszeit
heartbeat.broadcastCounter
heartbeat.maxPeriodGauge
heartbeat.periodGauge
bm-easmobiler Verbindungsdienst
executionTimeTimer
responseSizeDistSum
bm-hpsAuthentifizierungsdienst
authCountCounterAnzahl der Verbindungsanfragen für BlueMindstatus success: Verbindung erfolgreich
status failed: Verbindung fehlgeschlagen (falsches Login und/oder Passwort)
ftlTemplates.requestsCounterAnzahl der angeforderten generierten Seiten
requestsCountCounterAnzahl der bedienten Anfragen pro hps- kind: maintenance- Anzeige der Wartungsseite
- kind: protected - Anzeige einer geschützten Seite.

Ermöglicht insbesondere die Überprüfung der tatsächlichen Anzahl der Aufrufe der Wartungsseite. Zu viele "Wartungsanfragen" können ein Zeichen für ein Problem sein.
staticFile.requestsCounterAnzahl der angeforderten statischen SeitenBeispiel: Login-Seite
upstreamRequestSizeDistSumAnforderungsgröße
upstreamRequestTimeTimerAnfragebearbeitungszeit
upstreamRequestsCountCounterAnzahl der Anfragen
bm-lmtpdE-Mail-Zustelldienst
activeConnectionsGaugeAnzahl der aktiven Verbindungen
connectionCountCounter
deliveriesCounter
emailRecipientsDistSumAnzahl von Empfängern pro E-Mail
emailSizeDistSumGröße der E-Mails
sessionDurationTimerSitzungsdauer
traffic.transportLatencyTimer
bm-locatorLokalisierung der Dienste
executionTimeTimerAbfrage-Durchlaufzeit
requestsCountCounterAnzahl der vom Dienst empfangenen Anfragen- origin: Komponente, die die Anfrage gestellt hat
- statusCode: http-Rückgabecode
bm-filterAnalyse und Modifikation von E-Mails auf SMTP-Ebene
connectionsCountCounter
sessionDurationTimer
traffic.classCounter
traffic.sizeCounter
bm-webserverWeb-Anwendungsserver
appCache.requestTimeTimer
appCache.requestsCounter
ftlTemplates.requestsCounterAnzahl der vom Webserver erzeugten Seitenanzeigeanforderungen
staticFile.requestsCounterAnzahl der Anzeigeanforderungen für statische Seiten
bm-xmppInstant-Messaging-Dienst
packetsCountCounterAnzahl der vom Dienst übertragenen PaketeWird verwendet, um zu sehen, in welchem Umfang der Messaging-Dienst genutzt wird und ob er ordnungsgemäß oder nicht mehr funktioniert
bm-ysnpDatenvalidierungsdienst
authCountCounterAnzahl der abgeschlossenen Anfragen- status ok: validierte Anfragen (z. B. Authentifizierung für das von einer Person eingegebene Login/Passwort akzeptiert)
- status failed: Validierung abgelehnt (z. B. Authentifizierung fehlgeschlagen, da falsches Passwort)
Andere
cpuProzessorauslastungsdatenErmöglicht die Steuerung der Verwendung und Verteilung von Prozessoren
diskSpeicherplatzverwaltungsdatenErmöglicht die Kontrolle des verwendeten/freien/gesamten/etc. Speicherplatzes pro Festplatte, Partition, Pfad usw.
diskioAnzahl der geschriebenen/gelesenen Bytes in EchtzeitZeigt an, ob die Festplatte richtig oder zu viel arbeitet
elasticsearch*ElasticSearch betreffende DatenWeitere Informationen und Details zu ES-Metriken finden Sie in der Dokumentation
imapd.process
influxdb*Daten der Metrik-Speicherdatenbank
kapacitor*Daten, die das Tool selbst betreffen
kernel
kernel_vmstat
mem
memcached
net
netstat
nginx
phpfpm
postfix_queue
postgresqlInformationen über die BlueMind-Datenbank
processes
swap
syslog
system