2 repository-uri
Techniques for maximizing the number of workloads per physical node by reducing virtualization overhead.
Distinguishing note: Candidates focus on networking or monitoring, while this is about compute density and packing.
Explore 2 awesome GitHub repositories matching devops & infrastructure · Workload Density Optimization. Refine with filters or upvote what's useful.
KServe is an open platform for deploying and serving generative and predictive AI models on Kubernetes. It defines inference services as custom resources with declarative YAML specifications, enabling a Kubernetes-native approach to model deployment and lifecycle management. The platform leverages Knative-based serverless scaling for automatic scale-to-zero and revision management, and supports a pluggable serving runtime architecture that maps model formats to containerized execution environments. KServe distinguishes itself through model-aware autoscaling that scales replicas based on token
Adjusts GPU, memory, and autoscaling settings based on whether the workload is generative or predictive.
Acest proiect oferă roadmap-uri strategice și ghiduri care detaliază evoluția și tiparele de deployment ale serviciilor gestionate de orchestrare a containerelor și securitate. Servește drept document public de urmărire pentru funcționalitățile viitoare și prioritățile de dezvoltare pentru EKS, ECS, ECR și Fargate. Resursa include un ghid de orchestrare a containerelor în cloud și o strategie pentru Kubernetes și ECS, conturând dezvoltarea serviciilor gestionate de Kubernetes și a serviciilor de orchestrare proprietare pentru infrastructura cloud. De asemenea, oferă un plan de securitate și monitorizare axat pe scanarea activităților malițioase și urmărirea sănătății workload-urilor. Materialul acoperă o gamă largă de capabilități de infrastructură, inclusiv provizionarea resurselor, scalarea automată a resurselor de calcul și a sarcinilor, și gestionarea imaginilor de containere. Abordează rețelistica și gestionarea traficului prin load balancing și optimizarea densității pod-urilor, precum și observabilitatea prin rutarea log-urilor și urmărirea performanței.
Implements IPv4 prefix assignment to network interfaces to increase container density on Windows nodes.