NARZĘDZIA MONITORINGU INFRASTRUKTURY
Zestawienie narzędzi do monitoringu infrastruktury IT — od rozwiązań open-source po platformy komercyjne. Porównanie funkcjonalności, modeli wdrożeniowych i obsługiwanych źródeł metryk.
NARZĘDZIA OPEN-SOURCE
| Narzędzie | Model zbierania | Przechowywanie | Silne strony |
|---|---|---|---|
| Prometheus | Pull (HTTP scrape) | TSDB (lokalna) | Kubernetes-native, PromQL, Alertmanager |
| Zabbix | Agent / SNMP / JMX | MySQL / PostgreSQL | Duże środowiska, SNMP trap, mapy sieci |
| Nagios Core | Plugin (aktywne / pasywne) | Flat files | Powszechność, bogaty ekosystem pluginów |
| Grafana + Loki | Log aggregation | Loki / Object storage | Wizualizacja, korelacja metryk i logów |
| OpenTelemetry | Push (OTLP) | Backend-agnostic | Standard obserwabilności, traces + metrics + logs |
ROZWIĄZANIA KOMERCYJNE
Datadog
SaaS APM i monitoring infrastruktury. Agenty dla systemów, kontenerów i chmur (AWS, Azure, GCP). Zaawansowane dashboardy, anomaly detection ML, Log Management. Model cenowy: per host / per GB ingestion.
SaaS · Agent-based
Dynatrace
Full-stack observability z automatycznym wykrywaniem topologii (Smartscape). OneAgent instalowany per host, AI-driven root cause analysis (Davis). Wymaga infrastruktury on-premise lub SaaS.
SaaS / On-prem · OneAgent
PRTG Network Monitor
Monitoring sieci i infrastruktury z licencjonowaniem per sensor. Obsługuje SNMP, WMI, NetFlow, sFlow. Popularny w MŚP i enterprise w Polsce. On-premise, instalacja Windows.
On-prem · Per sensor
Checkmk
Rozwinięcie Nagios z automatycznym odkrywaniem usług. Edycje Raw (open-source), Enterprise i Cloud. Agent-based + SNMP. Silny w środowiskach mieszanych Linux/Windows.
On-prem / SaaS · Agent + SNMP
KLUCZOWE METRYKI INFRASTRUKTURY
| Komponent | Metryka | Próg ostrzeżenia | Próg krytyczny |
|---|---|---|---|
| CPU | Użycie (%) | >80% (5 min avg) | >95% (5 min avg) |
| RAM | Available memory | <20% | <5% |
| Dysk | Wykorzystanie (%) | >80% | >90% |
| Sieć | Interface utilization | >70% | >90% |
| Storage | Latencja I/O (ms) | >10 ms | >50 ms |
Progi przykładowe dla typowych środowisk produkcyjnych. Wartości należy dostosować do charakterystyki konkretnego środowiska.