irgendwas fehlt - automatische Registrierung, Status "Info"

    This site uses cookies. By continuing to browse this site, you are agreeing to our Cookie Policy.

    • irgendwas fehlt - automatische Registrierung, Status "Info"

      Moin,

      grade mich mal an die automatische Registrierung gemacht.

      Soweit klappt auch fast alles

      Agent installiert

      /etc/bloonix/agent/register.conf angelegt und gefüllt
      webgui_url <URL>
      data {
      company_id 1
      company_authkey <Key>
      }

      Agent neu durchgetreten

      /var/log/bloonix/bloonix-agent-register.log
      Apr 26 21:42:06 [INFO] registration was successful

      Mit einem Operations-User den Host einer Gruppe und Template zugeordnet.
      Host auf aktiv gestellt

      Alles tutti, die Kiste wird auch in der Webgui unter Hosts geführt.
      Nur leider dauerhaft mit dem Status "Info"

      /etc/bloonix/agent/conf.d/host.conf wurde auch automatisch angelegt und eingerichtet

      host {
      host_id 12
      password <Key halt>
      agent_id localhost
      }


      Wenn die host.conf angelegt ist, muss ja auch kein host-init durchgeführt werden.

      In den Agent Logs finde ich nur unregelmäßig die Fehlermeldung:
      [Apr 26 2018 22:21:50] ERROR 5980 0.003318 child 6024 died: 2304 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 600)
    • Im Logfile des Servers(bloonix-server.log)

      habe ich nur fehlgeschlagene Authentifizierungen von ehemaligen Agenten, die noch versuchen mit dem Server zu reden. Also nichts was mit dem Fall zu tun haben sollte.
      Hab bei den einfach den Bloonix-Agent noch nicht deaktiviert/gelöscht

      [May 02 2018 10:37:19] NOTICE 2271 0.001335 <BloonixServerIP> request finished (0.023s) (host id 4) (/usr/share/perl5/Bloonix/Server.pm, line 256)
      [May 02 2018 10:37:19] INFO 2271 0.000206 <BloonixServerIP> wait for tcp connection (host id 4) (/usr/share/perl5/Bloonix/Server.pm, line 175)
      [May 02 2018 10:37:19] INFO 2265 30.114860 <BloonixServerIP> process tcp request (host id 4) (/usr/share/perl5/Bloonix/Server.pm, line 206)
      [May 02 2018 10:37:19] NOTICE 2265 0.001178 <AgentServerIP> check authorization (n/a) (/usr/share/perl5/Bloonix/Server.pm, line 308)
      [May 02 2018 10:37:19] NOTICE 2265 0.000216 <AgentServerIP> processing request (host id 9) (/usr/share/perl5/Bloonix/Server.pm, line 323)
      [May 02 2018 10:37:19] WARNING 2265 0.000784 <AgentServerIP> access denied (host id 9) (/usr/share/perl5/Bloonix/Server.pm, line 333)
      [May 02 2018 10:37:19] WARNING 2265 0.000165 <AgentServerIP> $VAR1 = {
      'facts' => {},
      'whoami' => 'agent',
      'version' => '0.80',
      'host_id' => '9',
      'action' => 'get-services',
      'agent_id' => 'localhost',
      'password' => '<Passwort>'
      };


      Das waren aber auch alles welche die ich händisch über die Webgui angelegt hatte.


      In den restlichen Logs auf dem Server ist soweit ich sehen kann nichts.



      Auf den Agenten ist ein weiterer Error dazu gekommen:
      [Mai 02 2018 09:04:50] ERROR 18301 0.002405 Expected 'PeerHost' at /usr/share/perl5/Bloonix/IO/SIPC.pm line 153.


      Daher geben sich die 2 Fehlermeldungen die Klinke in die Hand

      grep -ir "error" /var/log/bloonix/bloonix-agent.log
      ...
      [Mai 02 2018 09:04:20] ERROR 18286 0.002376 Expected 'PeerHost' at /usr/share/perl5/Bloonix/IO/SIPC.pm line 153.
      [Mai 02 2018 09:04:20] ERROR 30282 0.009945 child 18286 died: 2304 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 600)
      [Mai 02 2018 09:04:35] ERROR 18295 0.002510 Expected 'PeerHost' at /usr/share/perl5/Bloonix/IO/SIPC.pm line 153.
      [Mai 02 2018 09:04:35] ERROR 30282 0.010444 child 18295 died: 2304 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 600)
      [Mai 02 2018 09:04:50] ERROR 18301 0.002405 Expected 'PeerHost' at /usr/share/perl5/Bloonix/IO/SIPC.pm line 153.
      [Mai 02 2018 09:04:50] ERROR 30282 0.013099 child 18301 died: 2304 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 600)


      Leider kann ich mit dem PeerHost in dem File nix anfangen, auf Verdacht aber mal auf dem Server nachgekuckt:

      netstat -tulpn
      tcp 0 0 0.0.0.0:5460 0.0.0.0:* LISTEN 1493/perl


      vom Agent aus:
      telnet <FQDN vom Bloonixserver> 5460
      Trying <richtige IP, also Hostauflösung klappt auch>...
      Connected to <FQDN vom Bloonixserver>.
      Escape character is '^]'.


      Sieht also auch gut aus


      Auf einem 2. Agent genau das selbe Spiel, selbe Fehlermeldungen.




      Zum den Systemen:
      Agent 1(Host ID 10) LXC Container auf einem Ubuntu 16.04.3 Trägersystem, OS ist das 0815 LXC Ubuntu Template. Wird von privater IP auf eine öffentliche NAT, geht mit der auch komplett raus und auch kommt auch alles rein. Einzig eine Softwarefirewall läuft, eingehend wird gefiltert ausgehend aktuell nicht.

      Agent 2(Host ID 13) EC2 Container, Ubuntu 16.04 und komplett mit dem Arsch, offen im Netz. Reine Testinstanz um eventuelle Blockierungen bei Agent 1 auszuschließen.

      Bloonixserver ist auch direkt über öffentliche IP Adressierbar

      händisch über die Webgui angelegte Agenten funktionieren nach entsprechender host-initialisierung auch

      Agent 2 hatte ich auch mal gelöscht und neu registrieren lassen, daher ist der jetz HostID 13 und nichtmehr 12 wie im ersten Post

      The post was edited 1 time, last by Stechpaddel ().

    • Sorry für Doppelpost, aber die 10.000 Zeichenbegrenzung hat zugeschlagen...

      Mal das bloonix-agent.log geleert und den Agent mal durchgetreten:

      [Mai 02 2018 11:50:35] NOTICE 22600 0.106501 initializing dispatcher (/usr/share/perl5/Bloonix/Agent.pm, line 89)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000220 set env PLUGIN_LIBDIR = /var/lib/bloonix/agent (/usr/share/perl5/Bloonix/Agent.pm, line 155)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000082 set env CONFIG_PATH = /etc/bloonix/agent (/usr/share/perl5/Bloonix/Agent.pm, line 155)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000056 set env LANG = C (/usr/share/perl5/Bloonix/Agent.pm, line 155)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000623 initialized dispatcher (/usr/share/perl5/Bloonix/Dispatcher.pm, line 108)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000085 initialize socket /var/run/bloonix/bloonix-agent.sock.1525254635.22600 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 182)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000776 start dispatcher (/usr/share/perl5/Bloonix/Dispatcher.pm, line 85)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000848 child 22601 forked (/usr/share/perl5/Bloonix/Dispatcher.pm, line 437)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000730 child 22602 forked (/usr/share/perl5/Bloonix/Dispatcher.pm, line 437)
      [Mai 02 2018 11:50:35] NOTICE 22601 0.002017 child 22601 initialized (/usr/share/perl5/Bloonix/Agent.pm, line 193)
      [Mai 02 2018 11:50:35] INFO 22601 0.000272 connect to parent (/usr/share/perl5/Bloonix/Dispatcher.pm, line 761)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000710 child 22603 forked (/usr/share/perl5/Bloonix/Dispatcher.pm, line 437)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000752 child 22604 forked (/usr/share/perl5/Bloonix/Dispatcher.pm, line 437)
      [Mai 02 2018 11:50:35] NOTICE 22602 0.002519 child 22602 initialized (/usr/share/perl5/Bloonix/Agent.pm, line 193)
      [Mai 02 2018 11:50:35] INFO 22602 0.000244 connect to parent (/usr/share/perl5/Bloonix/Dispatcher.pm, line 761)
      [Mai 02 2018 11:50:35] INFO 22602 0.000469 child 22602 status: ready (/usr/share/perl5/Bloonix/Dispatcher.pm, line 763)
      [Mai 02 2018 11:50:35] INFO 22602 0.000281 waiting to get a job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 500)
      [Mai 02 2018 11:50:35] NOTICE 22603 0.002723 child 22603 initialized (/usr/share/perl5/Bloonix/Agent.pm, line 193)
      [Mai 02 2018 11:50:35] INFO 22601 0.002155 child 22601 status: ready (/usr/share/perl5/Bloonix/Dispatcher.pm, line 763)
      [Mai 02 2018 11:50:35] INFO 22603 0.000258 connect to parent (/usr/share/perl5/Bloonix/Dispatcher.pm, line 761)
      [Mai 02 2018 11:50:35] INFO 22601 0.000144 waiting to get a job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 500)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.001917 push host 14 into queue (/usr/share/perl5/Bloonix/Agent.pm, line 244)
      [Mai 02 2018 11:50:35] INFO 22603 0.000493 child 22603 status: ready (/usr/share/perl5/Bloonix/Dispatcher.pm, line 763)
      [Mai 02 2018 11:50:35] INFO 22600 0.000178 1 objects ready, 2/4 children ready (/usr/share/perl5/Bloonix/Dispatcher.pm, line 345)
      [Mai 02 2018 11:50:35] INFO 22600 0.000067 send object to child 22601 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 363)
      [Mai 02 2018 11:50:35] INFO 22603 0.000157 waiting to get a job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 500)
      [Mai 02 2018 11:50:35] INFO 22601 0.000846 connect to parent (/usr/share/perl5/Bloonix/Dispatcher.pm, line 761)
      [Mai 02 2018 11:50:35] INFO 22601 0.000153 child 22601 status: alive (/usr/share/perl5/Bloonix/Dispatcher.pm, line 763)
      [Mai 02 2018 11:50:35] INFO 22601 0.000104 reading job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 512)
      [Mai 02 2018 11:50:35] INFO 22601 0.000089 got a job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 521)
      [Mai 02 2018 11:50:35] INFO 22601 0.000346 start processing: get-services (/usr/share/perl5/Bloonix/Agent/Worker.pm, line 88)
      [Mai 02 2018 11:50:35] INFO 22601 0.000108 get services (/usr/share/perl5/Bloonix/Agent/Worker.pm, line 579)
      [Mai 02 2018 11:50:35] ERROR 22601 0.002122 Expected 'PeerHost' at /usr/share/perl5/Bloonix/IO/SIPC.pm line 153.
      (/usr/share/perl5/Bloonix/IO/SIPC.pm, line 161)
      [Mai 02 2018 11:50:35] WARNING 22601 0.000159 Expected 'PeerHost' at /usr/share/perl5/Bloonix/IO/SIPC.pm line 153.
      - at /usr/share/perl5/Bloonix/IO/SIPC.pm line 163.
      (/usr/share/perl5/Bloonix/Agent.pm, line 103)
      [Mai 02 2018 11:50:35] INFO 22600 0.006776 object sent to child 22601 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 372)
      [Mai 02 2018 11:50:35] ERROR 22600 0.006210 child 22601 died: 2304 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 600)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000725 child 22605 forked (/usr/share/perl5/Bloonix/Dispatcher.pm, line 437)
      [Mai 02 2018 11:50:35] INFO 22600 0.000263 reaping child 22601 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 420)
      [Mai 02 2018 11:50:35] WARNING 22600 0.000595 killing non existent pid 22601 (/usr/share/perl5/Bloonix/Dispatcher.pm, line 265)
      [Mai 02 2018 11:50:35] INFO 22600 0.000120 flushing 3 finished objects (/usr/share/perl5/Bloonix/Dispatcher.pm, line 316)
      [Mai 02 2018 11:50:35] NOTICE 22600 0.000188 next check of host id 14 at 1525254650 (/usr/share/perl5/Bloonix/Agent.pm, line 482)
      [Mai 02 2018 11:50:35] NOTICE 22604 0.010074 child 22604 initialized (/usr/share/perl5/Bloonix/Agent.pm, line 193)
      [Mai 02 2018 11:50:35] INFO 22604 0.007955 connect to parent (/usr/share/perl5/Bloonix/Dispatcher.pm, line 761)
      [Mai 02 2018 11:50:35] NOTICE 22605 0.002074 child 22605 initialized (/usr/share/perl5/Bloonix/Agent.pm, line 193)
      [Mai 02 2018 11:50:35] INFO 22605 0.000196 connect to parent (/usr/share/perl5/Bloonix/Dispatcher.pm, line 761)
      [Mai 02 2018 11:50:35] INFO 22604 0.000347 child 22604 status: ready (/usr/share/perl5/Bloonix/Dispatcher.pm, line 763)
      [Mai 02 2018 11:50:35] INFO 22604 0.000140 waiting to get a job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 500)
      [Mai 02 2018 11:50:35] INFO 22605 0.000355 child 22605 status: ready (/usr/share/perl5/Bloonix/Dispatcher.pm, line 763)
      [Mai 02 2018 11:50:35] INFO 22605 0.000153 waiting to get a job (/usr/share/perl5/Bloonix/Dispatcher.pm, line 500)
    • Agent 1 und Agent 2

      server {
      #host <FQDN des Bloonixservers>
      port 5460
      mode failover
      use_ssl yes
      ssl_verify_mode peer
      ssl_ca_path /etc/ssl/certs
      }

      das host musste ich auskommentieren, da mit dem normalen host @@SERVER@@ der Agent sich nicht starten lässt.


      Jetz bin ich mir aber nich sicher, ob ich den Bloonixserver zum Test dort eingetragen hab.


      Also Agent 3 und 4 Server frisch eingerichtet

      da steht auch nach "registration was successful" in der /etc/bloonix/agent/main.conf weiterhin #host @@SERVER@@.


      Nehme ich bei Agent 1 und 2 die Raute weg, hat sich der Status auch geändert, also geht.


      Bleibt bei mir die Frage:

      Editiert der Agent in der main.conf den Host dann auf den Eintrag der register.conf?

      Wenn Ja: dann is ja Mist, dass man erst den Eintrag auskommentieren muss, damit man den Agent starten kann um dann anschließend die Raute wieder herausnehmen, da sonst der Host auskommentiert ist
      Wenn Nein: muss das eingetragen werden? Würde ja "Es darf kein Host in der Konfiguration des Agenten konfiguriert sein." in der Doku widersprechen. Danach funktioniert es aber halt

      The post was edited 1 time, last by Stechpaddel ().

    • Jetz bin ich endgültig verwirrt....

      Den BloonixServer teile ich ja in der /etc/bloonix/agent/register.conf mit.
      Daher versteh ich nicht, wieso der dann ein 2. mal eingetragen werden muss.

      bloonix-init-host ist mE hier auch obsolet, da der Agent sich ja selbst am Server registriert.
      Sonst würde die /etc/bloonix/agent/conf.d/host.conf ja nicht gefüllt werden.
      Außerdem habe ich die HostID und das Passwort ja erst, wenn die Kiste am Server schon angemeldet ist und der Agent daher schon weiß mit wem er reden soll.


      bloonix-monitoring.org/de/docs…ed-host-registration.html
      "Es darf kein Host in der Konfiguration des Agenten konfiguriert sein."
      Widerspricht ja, dass ich jetzt doch im Agenten den Host eintragen muss.


      Will nich über dein eigenes Monitoring diskutieren, aber verstehe es gerade echt nicht.