Wie kann ich eine strukturelle Systemüberwachung einrichten?
Wie kann ich eine strukturelle Systemüberwachung einrichten?
Brauche ich eine Zustandsüberwachung?
Wenn Sie ein BOC Produkt in Ihrer eigenen Infrastruktur (on premise) betreiben, möchten Sie vielleicht ein Monitoring für Ihr Produkt einrichten. Eine strukturelle Systemüberwachung kann helfen, die Entstehung von Engpässen (z.B. aufgrund von Szenario-Wachstum), Stabilitätsproblemen oder Ausfällen frühzeitig zu erkennen, so dass Gegenmaßnahmen ergriffen werden können, bevor echte Probleme auftreten.
In diesem Artikel werden verschiedene Überwachungsmöglichkeiten aufgeführt. Sie müssen nicht alle davon implementieren. Wählen Sie einfach die Möglichkeiten aus, die für Ihr Unternehmen und Ihre Bedürfnisse geeignet sind.
Hinweis: Dieser Artikel bezieht sich auf den Betrieb von ADONIS, ADOIT oder ADOGRC in Ihrer eigenen Infrastruktur (on remise).
Wenn Sie ein BOC Produkt in der BOC-Cloud (SaaS) nutzen, kümmert sich BOC um die Zustandsüberwachung.
Wie richte ich eine Überwachung ein?
Überwachung der Verfügbarkeit des Dienstes
Führen Sie Aufrufe gegen die auth.view Dienst-URL mit einem kurzen Timeout (Empfehlung: 10 Sekunden) aus.
Wenn der Aufruf den Statuscode HTTP 200 als Antwort zurückgibt, ist der gesamte Service-Stack (Webserver, Anwendungsserver, Datenbank) verfügbar und die Antwortzeiten sind angemessen.
Jeder andere Rückgabecode deutet auf ein Problem hin. Befolgen Sie in diesem Fall die Richtlinien unter "Wie behebt man einen Ausfall (on premise)?".
Beispiel:
https://adoxx.[mycompany].com/auth.view?forceConnectorType=STANDARD
Prozessstatus überwachen
Überwachen Sie, ob alle Prozesse, die für das Funktionieren Ihres BOC Produkts erforderlich sind, ausgeführt werden.
Richten Sie Warnmeldungen ein, wenn einer dieser Prozesse angehalten wird oder nicht mehr reagiert:
- Web Server Dienst (Tomcat.exe).
- Applikationsserver Ihres BOC Produkts (aserver.exe).
- Query-Engine-Dienst Ihres BOC Produkts (aqe_server.exe)
- FTS-Dienst Ihres BOC Produkts (afts_server.exe)
- Datenbankinstanz.
Systemüberwachung
Vergewissern Sie sich, dass die Systemüberwachung der folgenden Server eingerichtet ist:
- Web Server
- Applikationsserver
- Datenbank-Server
Typische Indikatoren für die Überwachung sind:
- CPU-Nutzung
- RAM-Nutzung
- Freier Festplattenspeicher
Wenn eine dieser Ressourcen zu einem Engpass wird, sollten Sie frühzeitig darauf aufmerksam gemacht werden und das Problem schnell beheben.
Datenbank-Überwachung
Wenden Sie sich an Ihr Datenbankteam, um Ressourcenverbrauch, Arbeitslast und Anzahl der verwendeten Datenbankverbindungen auf der Datenbankinstanz Ihres BOC Produkts zu überwachen.
Im Laufe der Zeit kann der Ressourcenverbrauch aufgrund des Szenariowachstums, des Wachstums der Benutzerbasis und/oder individueller Belastungsspitzen ansteigen. Stellen Sie sicher, dass die Datenbankinstanz nicht überlastet wird, und weisen Sie bei Bedarf mehr Ressourcen zu.
Log-Überwachung
Überprüfen Sie die folgenden Logdateien Ihres BOC Produkts auf Einträge, die auf Probleme hinweisen:
- aworker-log: "\<Applikationsserver Log Pfad>\<Zeitstempel>_aworker.log"
- aserver-log: "\<Applikationsserver Log Pfad>\<Zeitstempel>_aserver.log"
- webserver-log: "\<Webserver Log Pfad>\<BOC Produkt und Version>.log" (e.g. ADONIS15.0.log)
- database-errorlog: "\<Applikationsserver Log Pfad>\<Zeitstempel>_adoxx_db.log"
aserver-log | |
---|---|
Stichwörter | "System memory status" |
Beispieleintrag | "System memory status (total / available): 16383 MB / 543 MB" |
Maßnahme | Wenn wenig Arbeitsspeicher verfügbar ist (weniger als 2 GB oder weniger als 10 % des Gesamtspeichers), sollten Sie den Arbeitsspeicher auf dem Anwendungsserver erhöhen. |
aworker-log | |
---|---|
Stichwörter | "[WARN] Performance issue: m_pDataSource" |
Beispieleintrag | 2023-09-07 21:55:57.182 [4040][1612009049] [52341][WARN] Performance issue: m_pDataSource->ExistsRepoInstInDB(pID->GetUUID(), bRet) took 16.421 seconds |
Maßnahme | Wenn ein solcher Fehler häufiger als 10 Mal pro Tag auftritt, kann dies auf bevorstehende Leistungsprobleme hinweisen, die höchstwahrscheinlich mit der Datenbank- oder Netzwerkleistung zusammenhängen. |
webserver-log | |
---|---|
Stichwörter | "Worker lost" |
Beispieleintrag | 2023-02-06 15:19:04,171 ERROR [pool-3-thread-14][S] WORKER LOST AS1:41403 - com.boc.axw.core.applicationserver.PingAWorkerThread.onAWorkerLost(PingAWorkerThread.java:131) |
Maßnahme | Wenn ein solcher Eintrag häufiger als 3 Mal pro Tag auftritt, deutet dies auf ein Problem hin. Wenden Sie sich an die BOC Hotline und stellen Sie ein Support-Informationspaket bereit. |
database-errorlog | ||
---|---|---|
Das Datenbank-Fehlerprotokoll sollte immer leer sein. | Das Protokoll enthält Clientseitige Fehlermeldungen, die vom Datenbankserver an den Client zurückgegeben wurden. | Wenn das Protokoll Einträge enthält, gehen Sie der gemeldeten Datenbankfehlermeldung nach. |