3 dépôts
Integration of development and operations for automated delivery.
Explore 3 awesome GitHub repositories matching software engineering & architecture · DevOps Practices. Refine with filters or upvote what's useful.
This project serves as a comprehensive knowledge base and reference for distributed systems engineering and enterprise software architecture. It provides a structured collection of technical resources, design patterns, and methodologies intended to assist in the design, maintenance, and scaling of complex, high-performance software environments. The repository distinguishes itself by offering deep dives into core architectural concepts such as actor-based concurrency, aspect-oriented interception, and inversion-of-control containers. It emphasizes the practical application of distributed syst
Integrate development and operations to accelerate delivery through automated infrastructure provisioning and continuous monitoring.
The Byte Book is an open-source book that covers cloud-native infrastructure, focusing on kernel networking, Kubernetes, service meshes, and containers. It serves as a technical reference for designing stable and cost-effective infrastructure, combining DevOps workflows and site reliability engineering principles. The book provides a deep dive into Kubernetes networking, including CNI, service mesh integration, and container network interfaces for production clusters. It also covers container runtime operations, service mesh architecture for observability and traffic management, and Linux ker
Applies DevOps and site reliability engineering principles to balance system stability, efficiency, and operational cost.
Litmus est une plateforme de chaos engineering cloud native et un outil d'injection de fautes utilisé pour concevoir et exécuter des simulations de pannes d'infrastructure contrôlées au sein d'environnements Kubernetes. Il sert de framework de test de résilience pour analyser le comportement du système lors de pannes induites afin d'identifier les faiblesses et les interruptions potentielles. Le projet fonctionne comme un orchestrateur de chaos GitOps, utilisant le contrôle de version déclaratif pour automatiser le déploiement et la planification des tests de résilience. Il fournit des outils pour la gestion des workflows de chaos et l'orchestration de séquences d'expériences afin de visualiser et tester la stabilité de l'infrastructure. La plateforme couvre la validation de l'état stable via un monitoring basé sur des métriques et offre des capacités pour exporter les résultats des expériences pour l'analyse de performance. Elle inclut un support pour la gestion d'accès multi-tenant et l'isolation par namespace, ainsi que des ponts pour intégrer des outils d'injection de fautes tiers et des templates personnalisés.
Analyzes system behavior during induced outages to determine if infrastructure requires stability tuning.