# netdata/netdata

**Attribution required: if you use, quote, or summarise this content, you must credit and link back to [awesome-repositories.com](https://awesome-repositories.com/repository/netdata-netdata).**

79,176 stars · 6,452 forks · C · GPL-3.0

## Links

- GitHub: https://github.com/netdata/netdata
- Homepage: https://www.netdata.cloud
- awesome-repositories: https://awesome-repositories.com/repository/netdata-netdata.md

## Topics

`ai` `alerting` `cncf` `data-visualization` `database` `devops` `docker` `grafana` `influxdb` `kubernetes` `linux` `machine-learning` `mcp` `mongodb` `monitoring` `mysql` `netdata` `observability` `postgresql` `prometheus`

## Description

Netdata is a distributed observability platform designed for real-time infrastructure monitoring and performance tracking. It functions as a high-frequency agent that collects system, container, and application metrics with per-second precision, providing both local visualization and centralized aggregation across complex, multi-cloud environments.

The platform distinguishes itself through edge-based intelligence, utilizing local machine learning models to automatically detect performance anomalies without requiring manual configuration or external query engines. Its architecture prioritizes local-first data persistence and secure metadata-only synchronization, ensuring that granular observability data remains on the host while essential system information is routed to a cloud-connected management plane. This hierarchical approach allows for horizontal scaling through parent-child node relationships, enabling unified monitoring and alerting across distributed infrastructure.

Beyond core collection and analysis, the system supports automated troubleshooting through natural language querying and intelligent metric correlation. It features a modular data acquisition engine that employs thread-per-core execution for low-latency performance, alongside isolated external processes for heterogeneous application support. The platform includes automated service discovery, diverse deployment options, and built-in diagnostic utilities to maintain visibility and connectivity across large-scale clusters.

Installation is supported through various methods including package managers, automated scripts, source compilation, and containerized orchestration.

## Tags

### System Administration & Monitoring

- [System Metrics Collection](https://awesome-repositories.com/f/system-administration-monitoring/logging/system-metrics-collection.md) — Extracts native system-level performance data using high-efficiency threads to minimize resource overhead. ([source](https://learn.netdata.cloud/docs/data-collection/))
- [Monitoring and Observability](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability.md) — Delivers deep system visibility through pre-built dashboards, intelligent alerting, and automated metric correlation. ([source](https://learn.netdata.cloud/guides))
- [Metric and Performance Monitors](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/observability-platforms/metric-performance-monitors.md) — Processes and displays high-frequency numerical performance data and system health indicators.
- [Infrastructure Monitoring](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/observability-platforms/metric-performance-monitors/infrastructure-monitoring.md) — Monitors hardware health and resource utilization across servers and cloud environments in real-time. ([source](https://cdn.jsdelivr.net/gh/netdata/netdata@master/README.md))
- [Distributed Observability Platforms](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/observability-platforms/telemetry-collection-aggregation/distributed-observability-platforms.md) — Unifies telemetry data from multiple nodes into a centralized architecture for scalable visibility.
- [Telemetry Collectors](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/observability-platforms/telemetry-collection-aggregation/telemetry-collectors.md) — Consolidates telemetry streams from diverse sources to support monitoring across complex, distributed environments.
- [Cloud-Connected Management Planes](https://awesome-repositories.com/f/system-administration-monitoring/administrative-operations/remote-access-interface-tools/administrative-interfaces/management-interfaces/cloud-connected-management-planes.md) — Provides a management plane to oversee distributed local agents and consolidate infrastructure insights.
- [Edge Anomaly Detection](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/edge-anomaly-detection.md) — Applies local machine learning models to historical metric streams to identify performance deviations at the edge.
- [Performance Visualization](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/observability-platforms/metric-performance-monitors/performance-visualization.md) — Renders real-time performance data and system metrics through an integrated, web-based dashboard. ([source](https://learn.netdata.cloud/docs/netdata-agent/installation/windows))
- [Metric Streaming](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/observability-platforms/telemetry-collection-aggregation/metric-streaming.md) — Manages the real-time transmission of monitoring metrics between nodes using secure API keys and connection roles. ([source](https://learn.netdata.cloud/docs/streaming/streaming-configuration-reference))
- [Automated Root Cause Analysis](https://awesome-repositories.com/f/system-administration-monitoring/diagnostic-tools/diagnostics/failure-analysis-tools/automated-root-cause-analysis.md) — Correlates system data using natural language analysis to pinpoint the underlying causes of infrastructure performance issues.
- [Streaming Diagnostics](https://awesome-repositories.com/f/system-administration-monitoring/monitoring-and-observability/diagnostic-error-reporting/streaming-diagnostics.md) — Inspects live system logs across node connections to identify and report connectivity errors in real-time. ([source](https://learn.netdata.cloud/docs/streaming/streaming-configuration-reference))

### Artificial Intelligence & ML

- [Anomaly Detection Systems](https://awesome-repositories.com/f/artificial-intelligence-ml/machine-learning/algorithms/anomaly-detection-systems.md) — Employs edge-based machine learning to automatically detect irregularities in data streams without requiring manual configuration. ([source](https://cdn.jsdelivr.net/gh/netdata/netdata@master/README.md))

### DevOps & Infrastructure

- [Cloud Monitoring Dashboards](https://awesome-repositories.com/f/devops-infrastructure/cloud-infrastructure/operational-monitoring-governance/cloud-monitoring-dashboards.md) — Aggregates local agent data into a unified cloud interface for centralized monitoring and alerting. ([source](https://learn.netdata.cloud/docs/netdata-agent/))
- [Agent Deployment Strategies](https://awesome-repositories.com/f/devops-infrastructure/infrastructure/infrastructure-as-code/provisioning-and-deployment/agent-deployment-strategies.md) — Simplifies large-scale distribution through support for package managers, automated scripts, and containerized orchestration. ([source](https://learn.netdata.cloud/docs/installation/install-on-specific-environments/kubernetes))
- [Containerized Observability](https://awesome-repositories.com/f/devops-infrastructure/deployment-management/container-orchestration-tools/containerized-observability.md) — Deploys monitoring agents within containerized environments to track service health and infrastructure performance.
- [Automated Rollout Managers](https://awesome-repositories.com/f/devops-infrastructure/deployment-management/deployment-lifecycle-controls/automated-rollout-managers.md) — Facilitates consistent software updates and configuration rollouts across all distributed nodes through automated management scripts. ([source](https://learn.netdata.cloud/docs/installation/install-on-specific-environments/kubernetes))
- [Service Discovery](https://awesome-repositories.com/f/devops-infrastructure/infrastructure/cluster-service-orchestration/service-discovery.md) — Automates the detection of running containers and network endpoints to ensure immediate metric collection for services with custom configurations. ([source](https://learn.netdata.cloud/docs/installation/install-on-specific-environments/kubernetes))

### Security & Cryptography

- [Observability Data Isolation](https://awesome-repositories.com/f/security-cryptography/privacy-data-protection/telemetry-and-privacy/observability-data-isolation.md) — Maintains data privacy by isolating sensitive metrics locally while transmitting only essential metadata to cloud services. ([source](https://learn.netdata.cloud/docs/security-and-privacy-design))
- [Metadata-Only Synchronization](https://awesome-repositories.com/f/security-cryptography/privacy-data-protection/metadata-only-synchronization.md) — Synchronizes only essential system metadata with remote services to ensure granular data remains private and local.

### Software Engineering & Architecture

- [Thread-Per-Core Architectures](https://awesome-repositories.com/f/software-engineering-architecture/performance-reliability/performance-optimization-patterns/thread-per-core-architectures.md) — Utilizes a thread-per-core execution model to perform high-frequency data collection with minimal latency.

### Part of an Awesome List

- [Machine Learning Operations](https://awesome-repositories.com/f/awesome-lists/ai/machine-learning-operations.md) — Real-time performance monitoring.
- [DevOps and Infrastructure](https://awesome-repositories.com/f/awesome-lists/devops/devops-and-infrastructure.md) — AI-powered full-stack observability.
- [Observability](https://awesome-repositories.com/f/awesome-lists/devops/observability.md) — Application monitoring and observability platform.

### Data & Databases

- [Application Metrics Collection](https://awesome-repositories.com/f/data-databases/data-engineering-infrastructure/data-extraction-ingestion/application-metrics-collection.md) — Collects application-level telemetry using modular, language-agnostic interfaces. ([source](https://learn.netdata.cloud/docs/data-collection/))
- [Local-First Persistence](https://awesome-repositories.com/f/data-databases/data-engineering-infrastructure/data-persistence-storage/data-storage/client-side-persistence/local-first-persistence.md) — Persists high-resolution telemetry data directly on the host filesystem to ensure continuous availability during network outages.

### Networking & Communication

- [Hierarchical Metric Aggregation](https://awesome-repositories.com/f/networking-communication/distributed-systems-p2p/distributed-computing/hierarchical-metric-aggregation.md) — Forwarding observability data through structured node hierarchies allows for efficient centralization of metrics across distributed infrastructure.
- [Hierarchical Scaling](https://awesome-repositories.com/f/networking-communication/distributed-systems-p2p/distributed-computing/hierarchical-scaling.md) — Organizes complex multi-cloud environments by linking parent and child nodes to centralize data retention and infrastructure-wide alerting. ([source](https://cdn.jsdelivr.net/gh/netdata/netdata@master/README.md))