Monitoring von Truenas Core mit CheckMK

bic

Contributor
Joined
Dec 7, 2021
Messages
184
Schon seit graumer Zeit monitore ich mein Büronetzwerk (aus reiner Lust und Laune auch das zu Hause) mit CheckMK um möglichst rechtzeitig sich eventuell anbahnende Problem erkennen zu können, wie z.B. voll laufende Platten, Temperaturprobleme, Netzwerkengpässe, etc. Dies klappt je nach OS mittels enstprechender Agenten oder per SNMP insoweit einwandfrei.

Ebenfalls in das Monitoring über SNMP mit eingebunden ist nun auch Truenas Core, wobei sich der hier mögliche Überwachungsumfang als recht "übersichtlich" erweist, es fehlt das für mich wesentliche, nämlich die Auslastung und der Zustand der ZFS-Pools:

1695229681749.png


Hier setzt nun meine Frage an, daher, hat jemand vielleicht in dieser Sache Erfahrung und kennt auch eine Lösung dafür, die ZFS-Pools zu monitoren?

Ich bin für jeden Denkanstoß dankbar!
 

ChrisRJ

Wizard
Joined
Oct 23, 2020
Messages
1,919
Es ist lange her, dass ich damit was gemacht habe. Demnaechst werde ich aber wieder tiefer einsteigen und dann habe ich genau die gleiche Anforderung. Bis dahin kann ich leider nur eine relativ vage Erinnerung anbieten. Im Prinzip brauchst Du ein Shell Script, dass die entsprechenden Daten sammelt (z.B. Poolname, -status etc.), interpretiert (String Analyse, ob der Pool ok ist oder nicht) und sowohl Werte als auch Status in einem bestimmten Format auf STDOUT ausgibt. Soweit meine Erinnerung. Melde mich wieder, wenn ich mehr habe.
 

Patrick M. Hausen

Hall of Famer
Joined
Nov 25, 2013
Messages
7,776
Wenn man mit Observium per SNMP auf ein TN CORE "schießt", kriegt man eher mehr Info als einem lieb ist, nämlich sämtliche ZFS Datasets inkl. Jails etc. pp. ...

Am SNMP generell liegt es also nicht.
 

bic

Contributor
Joined
Dec 7, 2021
Messages
184
Hmmm, CheckMK liefert ja einen FreeBSD-Agenten mit, welcher sich von Hand auch installieren lässt. An der richtigen Stelle installiert überlebt dieser auch einen Neustart und lässt sich problemlos local aufrufen und scheint auch die gewünschten Parameter zu liefern:

1695239693729.png


Leider, aber auch selbstverständlich sind allerdings die diversen Einträge in den diversen Configfiles nach einem Reboot weg, so dass sich der Agent nicht übers Netzwerk erreichen lässt. Und dieses Problem lässt sich jetzt wie lösen ?

@ Patrick M. Hausen - stümpt. Wenn ich mir die MIB-Files von der Truenas runterlade und das richtige für den Paessler-SNMP-Tester verwende, scheint die Truenas ebenfalls die gewünschten Angaben per SNMP zu liefern:

1695240846798.png


CheckMK fragt augenscheinlich reichlich unvollständig ab. Ich werde mir nun einmal anschauen, ob man CheckMK beibringen kann, richtig zu fragen. Funktioniert dies, wäre mir das lieber, als mit dem Agent irgenwelche Verrenkungen machen zu müssen.

Ich bin dennoch weiter dankbar für andere Ideen!
 

Patrick M. Hausen

Hall of Famer
Joined
Nov 25, 2013
Messages
7,776
Weshalb benutzt man CheckMK überhaupt? Als ich mir das das letzte Mal angesehen hatte, war es ein billiger Nagios-Rip-Off mit kommerzieller Lizenz. Ich würde jedenfalls nichts anderes als ein Open-Source-Produkt einsetzen und ggf. dem Projekt eine Spende zukommen lassen.

- Nagios
- Icinga
- Zabbix
- Observium
- LibreNMS
- ...
 

bic

Contributor
Joined
Dec 7, 2021
Messages
184
Weshalb benutzt man CheckMK überhaupt? Als ich mir das das letzte Mal angesehen hatte, war es ein billiger Nagios-Rip-Off mit kommerzieller Lizenz. Ich würde jedenfalls nichts anderes als ein Open-Source-Produkt einsetzen und ggf. dem Projekt eine Spende zukommen lassen.

- Nagios
- Icinga
- Zabbix
- Observium
- LibreNMS
- ...
Nun ja, irgendwo, bzw. womit muss man ja mal anfangen. Und da es CheckMK auch als kostenfreie RAW-Edition gibt und das Teil nach dem KISS-Prinzip die Grafana-Anbindung nebst vordefinierten Graphen gleich mitliefert, habe ich mich dafür entschieden. Dies nicht, ohne mir vorher etwaige Alternativen anzusehen. Bisher genügte jedenfalls das Gespann CheckMK/Grafana meinen bescheidenen Ansprüchen als Hobby-ITler :frown:
 

Patrick M. Hausen

Hall of Famer
Joined
Nov 25, 2013
Messages
7,776
Hobby-ITler ist keine Schande. Ich bin nur generell skeptisch, wenn Firmen Open-Source wieder in Closed-Source Produkte umwandeln.
 

bic

Contributor
Joined
Dec 7, 2021
Messages
184
..... Ich bin nur generell skeptisch, wenn Firmen Open-Source wieder in Closed-Source Produkte umwandeln.
Och ... dann gäbe es ja überhaupt kaum noch professionelle Software :grin:

Aber wieder zurück zur Sache. Zwischenzeitlich habe ich mir einmal angeschaut, was man an den CheckMK SNMP-Regeln so rumschrauben kann. Grundsätzlich ist hier ein wenig möglich und wenn ich die Bulk-Abfrage für die Truenas zulasse, kommen noch ein paar überwachte Services hinzu, jedoch nichts bzgl. ZFS, lediglich jede Menge Disk-IOs - schade.

Das, was ich eigentlich erhofft hatte, nämlich das man CheckMK ein MIB-File unterjubeln kann, ist nicht möglich, das schreiben die auch explizit. Damit hat sich dann auch die Erweiterung der Abfrage mittels SNMP erledigt, denn welche OID ich verwenden müsste um ein am Ende brauchbares Ergebniss zu erhalten, ist mir nicht bekannt.

Also wieder zurück zum Agenten .... aber nicht den von CheckMK mitgelieferten :smile: Denn nach einiger Sucherei haben ich diesen
Phyton-Scribt gefunden, welcher einwandfrei funktioniert, ein Reboot überlebt und zumindest eine Aussage zum ZFS-Pool Status macht. Im Moment schaut es daher nun so aus, wobei dies eine Mischung aus Agent und SNMP darstellt und ich noch ein paar Services aus der Überwachung rausschmeiße:

1695319084026.png


Ich glaube, vorläufig werde ich dies erst einmal so lassen und mich gelegentlich, dann, wenn die Tage wieder länger und kälter werden, noch einmal damit befassen.
 

bic

Contributor
Joined
Dec 7, 2021
Messages
184
Ha, es ist noch ein Service aufgetaucht, der Pool wird tatsächlich auch überwacht:

1695363903497.png


Hier mal dessen Wachstum:

1695364259019.png


Nun bin wirklich erst einmal zufrieden, das ist mehr, als ich anfangs hoffte. Jetzt schaue ich noch mal nach den Snapshots :cool:

Im Grafana sieht das Ganze im Moment dann so aus, die letzten 6 Stunden und nicht viel los:

1695364896525.png
 
Last edited:
Top