Článek přečtěte do 4 min.

Častou otázkou je, zda Nagios Monitoring Solutions poskytuje monitorování v reálném čase. Krátká odpověď je ano. 

Je však monitorování v reálném čase vždy lepší? Někteří lidé mohou být překvapeni, když slyší, že i když je monitorování v reálném čase v mnoha případech užitečné, není to vždy nejlepší monitorovací technika ve všech případech použití monitorování.

V tomto článku se dozvíte, jak můžete implementovat monitorování v reálném čase pomocí Nagios, a také případy použití, kdy monitorování v reálném čase není výhodné.

Jak Nagios provádí monitorování v reálném čase

Existují tři způsoby, jak můžete využít monitorování v reálném čase s řešeními Nagios:

1. SNMP monitorování v reálném čase

SNMP trapy jsou klasickým příkladem monitorování v reálném čase. Zejména Nagios XI lze nakonfigurovat tak, aby přijímal SNMP trapy, které vám dávají možnost vidět v reálném čase upozornění na zařízení, která sledujete. Výsledkem je, že Nagios XI může informovat správné lidi, jakmile XI dostane impuls. Můžete mít například přepínač nakonfigurovaný tak, aby odeslal upozornění do XI, když je kabel zapojen do rozhraní. Když se tato zástrčka zapojí, zařízení okamžitě odešle upozornění do Nagios XI odešle upozornění.

SNMP Trap Nagios XI: Rozhraní Edit Trap Definition

2. Pasivní kontroly monitorování v reálném čase

Pasivní kontroly jsou další metodou, kterou může Nagios XI použít k monitorování zařízení v reálném čase. Díky aktivním kontrolám XI oslovuje informace o zařízeních, která monitoruje. Pasivní kontroly fungují opačně, monitorovaná zařízení si plánují vlastní kontroly a zasílají výsledky zpět do XI. Protože monitorovaný systém nepotřebuje plánovat tisíce nebo desetitisíce kontrol služby, je pro systém mnohem jednodušší naplánovat tyto kontroly častěji, například každých 30 sekund.

Pasivní kontroly jsou také výhodné, protože mohou snížit zatížení vašeho serveru XI snížením počtu aktivních kontrol. Aby bylo možné sledovat jakékoli problémy, které se vyskytnou ve vašich monitorovaných zařízeních, Nagios XI provádí mnoho aktivních kontrol v intervalech, což zvyšuje zátěž XI, zvláště když jsou všechny vaše kontroly nastaveny na jednominutové intervaly. Rozložením části této zátěže na vaše zařízení prostřednictvím pasivních kontrol může Nagios XI běžet efektivněji a vy můžete rychle přijímat oznámení o změnách stavu.

3. Nagios Cross-Platform Agent

Kromě síťových zařízení a dalších zařízení s podporou SNMP můžete také použít Nagios Cross-Platform Agent (NCPA) s XI k přijímání výstrah v reálném čase ze serverové infrastruktury. Pomocí tohoto agenta můžete monitorovat statistiky serveru pro hlavní operační systémy (tj. Windows, Linux a Mac) s aktivními nebo pasivními kontrolami a graficky znázorňovat většinu obecných systémových informací serveru v reálném čase. Chcete-li mít tato data v reálném čase, má NCPA možnost pasivní konfigurace.

Všechny tyto metody umožňují využít monitorování v reálném čase v Nagios XI. S těmito schopnostmi můžete získat cenné informace o tom, co sledujete; monitorování v reálném čase vám však ne vždy poskytne nejlepší hodnotu.

Nagios Cross-Platform Agent's (NCPA) Live Data: Stránka s informacemi o CPU/paměti

Když monitorování v reálném čase není užitečné

Máte-li možnosti monitorování v reálném čase, monitorovací systém po obdržení informace okamžitě zasáhne. Monitorovací řešení může například obdržet SNMP past a okamžitě odešle upozornění. Odlišná představa může být také v odvětví, kde monitorování „v reálném čase“ zahrnuje nepřetržitý tok dat o výkonu dodávaných ve velmi krátkých (možná jednosekundových) intervalech.

Bez ohledu na vaši definici může být monitorování v reálném čase v určitých situacích užitečné, ale není to nejlepší způsob monitorování v každé situaci.

Jako případ použití pro případy, kdy monitorování v reálném čase není přínosem, přemýšlejte o hostiteli virtuálního počítače, který vykazuje nárůst diskových I/O dat, která jsou jinak konzistentní a normální. Chceme o tomto nárůstu dat upozornit monitorovací tým nebo jakýkoli jiný tým? Ne. Nechtěli bychom kvůli této situaci budit ve 3 hodiny ráno technika. Jedná se o přechodný nárůst metriky výkonu. Není to trvalé. Spousta metrik výkonu se na okamžik zvýší a obnoví normální výkon.

Použití monitorování v reálném čase k okamžitému odeslání oznámení o nárůstu dat o výkonu, jako je tomu v tomto případě, vede k problému zvanému únava oznámení (nebo v případě probuzení spícího technika může vést k fyzickému únava). Týmy jsou tak zahlceny oznámeními, která nemají smysl, že je začnou ignorovat. To není pro organizaci dobré, protože mohou také ignorovat skutečně kritické problémy.

Navíc definice monitorování „v reálném čase“, které zahrnují určitý smysl pro proudy dat ve velmi krátkých intervalech, jsou problematické dvěma způsoby:

  1. Tento druh definice zdůrazňuje špatnou část upozornění na údaje o výkonu. Absolutní délka intervalu mezi datovými body není nejdůležitější; přetrvávání problému v čase je.
  2. Příliš časté vzorkování metrik výkonu může mít významný negativní dopad na výkon monitorovaných zařízení. Když zařízení kontrolujete v krátkých intervalech, stráví tato zařízení více času reakcí na kontroly z monitorovacího nástroje a méně času reakcí na skutečné požadavky. V důsledku toho nebudou zařízení fungovat optimálně.

Tyto problémy jsou důvodem, proč má Nagios XI vestavěnou kontrolní logiku, kterou lze nakonfigurovat tak, aby pouze informovala tým o přetrvávajících problémech. Když diskový vstup/výstup, využití CPU nebo šířka pásma stoupnou nad stanovenou prahovou hodnotu a zůstanou tam po určitou dobu, právě tehdy bychom možná chtěli probudit technika.

Závěr

Monitorování v reálném čase je užitečné ve správných situacích, ale je důležité mít na paměti, že to není jediný způsob monitorování. Zejména v případech, kdy chceme omezit upozornění na přetrvávající problémy, může zaměření „v reálném čase“ vést ke skutečné únavě týmů z upozornění.

Pokud vás zajímá používání monitorování v reálném čase a téměř v reálném čase s Nagios XI, kontaktujte nás ještě dnes.

Zdroj: Nagios