Zum Hauptinhalt springen
Version: 14.1

Wie kann ich eine strukturelle Systemüberwachung einrichten?

Wie kann ich eine strukturelle Systemüberwachung einrichten?

Brauche ich eine Zustandsüberwachung?

Wenn Sie ein BOC Produkt in Ihrer eigenen Infrastruktur (on premise) betreiben, möchten Sie vielleicht ein Monitoring für Ihr Produkt einrichten. Eine strukturelle Systemüberwachung kann helfen, die Entstehung von Engpässen (z.B. aufgrund von Szenario-Wachstum), Stabilitätsproblemen oder Ausfällen frühzeitig zu erkennen, so dass Gegenmaßnahmen ergriffen werden können, bevor echte Probleme auftreten.

In diesem Artikel werden verschiedene Überwachungsmöglichkeiten aufgeführt. Sie müssen nicht alle davon implementieren. Wählen Sie einfach die Möglichkeiten aus, die für Ihr Unternehmen und Ihre Bedürfnisse geeignet sind.

Hinweis: Dieser Artikel bezieht sich auf den Betrieb von ADONIS, ADOIT oder ADOGRC in Ihrer eigenen Infrastruktur (on remise).

Wenn Sie ein BOC Produkt in der BOC-Cloud (SaaS) nutzen, kümmert sich BOC um die Zustandsüberwachung.

Wie richte ich eine Überwachung ein?

Überwachung der Verfügbarkeit des Dienstes

Führen Sie Aufrufe gegen die auth.view Dienst-URL mit einem kurzen Timeout (Empfehlung: 10 Sekunden) aus.

Wenn der Aufruf den Statuscode HTTP 200 als Antwort zurückgibt, ist der gesamte Service-Stack (Webserver, Anwendungsserver, Datenbank) verfügbar und die Antwortzeiten sind angemessen.

Jeder andere Rückgabecode deutet auf ein Problem hin. Befolgen Sie in diesem Fall die Richtlinien unter "Wie behebt man einen Ausfall (on premise)?".

Beispiel: https://adoxx.[mycompany].com/auth.view?forceConnectorType=STANDARD

Prozessstatus überwachen

Überwachen Sie, ob alle Prozesse, die für das Funktionieren Ihres BOC Produkts erforderlich sind, ausgeführt werden.

Richten Sie Warnmeldungen ein, wenn einer dieser Prozesse angehalten wird oder nicht mehr reagiert:

  • Web Server Dienst (Tomcat.exe).
  • Applikationsserver Ihres BOC Produkts (aserver.exe).
  • Query-Engine-Dienst Ihres BOC Produkts (aqe_server.exe)
  • FTS-Dienst Ihres BOC Produkts (afts_server.exe)
  • Datenbankinstanz.

Systemüberwachung

Vergewissern Sie sich, dass die Systemüberwachung der folgenden Server eingerichtet ist:

  • Web Server
  • Applikationsserver
  • Datenbank-Server

Typische Indikatoren für die Überwachung sind:

  • CPU-Nutzung
  • RAM-Nutzung
  • Freier Festplattenspeicher

Wenn eine dieser Ressourcen zu einem Engpass wird, sollten Sie frühzeitig darauf aufmerksam gemacht werden und das Problem schnell beheben.

Datenbank-Überwachung

Wenden Sie sich an Ihr Datenbankteam, um Ressourcenverbrauch, Arbeitslast und Anzahl der verwendeten Datenbankverbindungen auf der Datenbankinstanz Ihres BOC Produkts zu überwachen.

Im Laufe der Zeit kann der Ressourcenverbrauch aufgrund des Szenariowachstums, des Wachstums der Benutzerbasis und/oder individueller Belastungsspitzen ansteigen. Stellen Sie sicher, dass die Datenbankinstanz nicht überlastet wird, und weisen Sie bei Bedarf mehr Ressourcen zu.

Log-Überwachung

Überprüfen Sie die folgenden Logdateien Ihres BOC Produkts auf Einträge, die auf Probleme hinweisen:

  • aworker-log: "\<Applikationsserver Log Pfad>\<Zeitstempel>_aworker.log"
  • aserver-log: "\<Applikationsserver Log Pfad>\<Zeitstempel>_aserver.log"
  • webserver-log: "\<Webserver Log Pfad>\<BOC Produkt und Version>.log" (e.g. ADONIS15.0.log)
  • database-errorlog: "\<Applikationsserver Log Pfad>\<Zeitstempel>_adoxx_db.log"
aserver-log
Stichwörter"System memory status"
Beispieleintrag"System memory status (total / available): 16383 MB / 543 MB"
MaßnahmeWenn wenig Arbeitsspeicher verfügbar ist (weniger als 2 GB oder weniger als 10 % des Gesamtspeichers), sollten Sie den Arbeitsspeicher auf dem Anwendungsserver erhöhen.
aworker-log
Stichwörter"[WARN] Performance issue: m_pDataSource"
Beispieleintrag2023-09-07 21:55:57.182 [4040][1612009049] [52341][WARN] Performance issue: m_pDataSource->ExistsRepoInstInDB(pID->GetUUID(), bRet) took 16.421 seconds
MaßnahmeWenn ein solcher Fehler häufiger als 10 Mal pro Tag auftritt, kann dies auf bevorstehende Leistungsprobleme hinweisen, die höchstwahrscheinlich mit der Datenbank- oder Netzwerkleistung zusammenhängen.
webserver-log
Stichwörter"Worker lost"
Beispieleintrag2023-02-06 15:19:04,171 ERROR [pool-3-thread-14][S] WORKER LOST AS1:41403 - com.boc.axw.core.applicationserver.PingAWorkerThread.onAWorkerLost(PingAWorkerThread.java:131)
MaßnahmeWenn ein solcher Eintrag häufiger als 3 Mal pro Tag auftritt, deutet dies auf ein Problem hin. Wenden Sie sich an die BOC Hotline und stellen Sie ein Support-Informationspaket bereit.
database-errorlog
Das Datenbank-Fehlerprotokoll sollte immer leer sein.Das Protokoll enthält Clientseitige Fehlermeldungen, die vom Datenbankserver an den Client zurückgegeben wurden.Wenn das Protokoll Einträge enthält, gehen Sie der gemeldeten Datenbankfehlermeldung nach.