GitOps

10Mehrere Cluster verwalten

Wenn man mit Kubernetes arbeitet, wird man in den seltensten Fällen alles auf einem einzigen Cluster erledigen. Unabhängig davon, ob man ein lokales Minikube mit Docker verwendet oder auf verschiedene Cluster zugreift, ist der Aufbau und die Instandhaltung der Cluster von großer Bedeutung. Dies führt zu erheblichem Entwicklungsaufwand, zumal je nach Hyperscaler und deren APIs unterschiedliches Wissen erforderlich ist. Neben der Gewährleistung funktionaler Anforderungen müssen auch Qualitätsmerkmale wie Sicherheit oder Compliance berücksichtigt werden. Auch die Frage nach der idealen Größe und dem grundsätzlichen Nutzen des Clusters ist von Bedeutung. Ein zu großer Cluster oder ein Cluster, der nur für Testzwecke eingerichtet wurde, kann unnötige Kosten verursachen. Gerade in Cloud-Umgebungen werden provisionierte Ressourcen und ihre Laufzeit in Rechnung gestellt.

Auch der Betrieb, besser bekannt als Day-2-Operations, bringt weitere Schwierigkeiten mit sich. Je mehr Cluster in einer Umgebung vorhanden sind, desto umfangreicher und komplexer wird das Lifecycle-Management. Es müssen regelmäßig kritische Sicherheitspatches sowie Minor- und Major-Updates von Kubernetes und seinen Abhängigkeiten installiert werden, um Sicherheitslücken und Angriffe zu vermeiden. Besonders in großen Unternehmen mit verschiedenen Abteilungen und Bereichen findet man immer wieder Silos, die nicht auf dem aktuellen Stand sind.

GitOps für Multi-Cluster

Von der deklarativen Konfiguration bis zur Automatisierung bietet GitOps eine effiziente und skalierbare Lösung zur Cluster-Verwaltung im Unternehmen. Wie im letzten Kapitel 9 bereits erklärt wurde, ist es nicht möglich, alle Operationen mit GitOps zu automatisieren. Das Ziel sollte daher sein, konsistent die Aktionen zu automatisieren, die mit GitOps möglich sind. So bleibt genug Kapazität für manuelle Tätigkeiten.

In diesem Kapitel möchten wir erläutern, wie wir mit GitOps diese Herausforderungen lösen können. Wir werden hierfür exemplarisch Cluster API für das Cluster-Management einsetzen.

10.1Single-Cluster vs. Multi-Cluster

Es ist wichtig zu prüfen, ob ein Cluster benötigt wird. Mittels Namespaces kann eine logische Trennung von Clustern erreicht werden, was im Allgemeinen zu einer höheren Pod-Dichte als bei physisch isolierten Clustern führt. Dadurch bleibt weniger ungenutzte Compute-Kapazität im Cluster übrig. Durch die flexible Architektur von Kubernetes lässt sich die Anzahl der Worker-Nodes gemäß den Anforderungen hoch- oder herunterskalieren. Dieser Ansatz ist leicht zu verwalten und die Kosten bleiben überschaubar.

Jedoch sind Namespaces zunächst nur Namensräume, damit Ressourcen mit gleichem Namen mehrfach im Cluster deployt werden können. Der Zugriff auf die Namespaces, genauer gesagt auf die jeweilige API, kann mit RBAC verwaltet werden. Jedoch ist als Admin zu beachten, dass das Netzwerk zwischen den Namespaces im Standardfall nicht segmentiert ist. Ein Pod hat einfachen Zugriff auf einen Pod aus einem anderen Namespace. Die Netzwerkkommunikation ist davon abhängig, welche CNI-Implementierung (Container Network Interface) eingesetzt wird und wie diese konfiguriert ist. Im Falle von Calico kann über sogenannte Policies das Netzwerk, genauer gesagt die jeweiligen Namespaces, auf unterschiedlichen OSI-Schichten abgesichert werden 1.

Eine vollständige Isolierung ist jedoch in der Regel nicht erreichbar. Außerdem besteht eine Gefahr, wenn Hacker Zugriff auf hochprivilegierte Konten erlangen. Daher sind nahezu alle Namespaces anfällig für Angriffe. Eine gängige Methode der Cluster-Isolierung ist die physische Trennung von Kubernetes-Clustern. In diesem Isolationsmodell werden Teams oder Workloads eigene Cluster zugewiesen. Jedoch erhöht diese simple Variante den Verwaltungs- und Finanzaufwand enorm, weil physisch isolierte Cluster in der Regel über eine geringe Pod-Dichte verfügen. Jedes Team oder jeder Workload hat einen eigenen Cluster, wodurch dem Cluster oft zu viele Computerressourcen zugewiesen werden. Dieser Nachteil kann jedoch durch verschiedene Mechanismen, wie eine automatisierte Zuweisung von Ressourcen mittels Autoscaling, gemildert werden.

10.2Cluster API

Das Projekt Cluster API (CAPI) ist ein Unterprojekt von Kubernetes, das sich mit der deklarativen Verwaltung von Kubernetes-Clustern befasst. Mithilfe von APIs und Werkzeugen können Cluster bereitgestellt, aktualisiert und verwaltet werden. Das Ziel der Initiatoren der Kubernetes Special Interest Group (SIG) Cluster Lifecycle ist es, die Verwaltung und den Betrieb von Kubernetes so einfach wie möglich zu gestalten 2.

Die Rolle von kubeadm

Für den Aufbau eines Clusters gibt es zahlreiche Distributionen für unterschiedliche Zwecke. In allen Lösungen ist kubeadm die zentrale Komponente für den Aufbau standardisierter Kubernetes-Cluster 3. Es ermöglicht den Aufbau von Kubernetes-Clustern, die den Kubernetes Conformance Test4 bestehen können und reduziert somit die Komplexität. Seit seinen Anfängen ist kubeadm zum Standard-Bootstrapping-Tool für mehrere andere Anwendungen geworden, darunter Kubespray5, minikube6 und KinD7. Jedoch beschränkt sich kubeadm lediglich auf das Einrichten des Clusters. Genauso wichtig wie die Einrichtung von Clustern ist jedoch das Lifecycle Management. Hier setzt die Cluster API an.

Das Projekt beinhaltet das Einrichten von Clustern sowie die Konfiguration ihrer Infrastruktur. Hierzu gehören VPCs, Netzwerke und VMs. Eine API steht zur Verfügung, die eine einheitliche und generische Installation von Clustern über alle Anbieter hinweg ermöglicht. Die dazugehörigen Provider vereinfachen und standardisieren die Installation auf verschiedenen Cloud-Plattformen wie AWS, Azure, Google Cloud und auch On-Premise-Lösungen 8. Dies hält die Lernkurve flach und erleichtert den Einstieg. Wenn jedoch die Notwendigkeit besteht, eine eigene Lösung zu entwickeln, kann das Framework durch selbst erstellte Provider erweitert werden.

10.3Konzept von Cluster API

Wie in Abb. 10–1 gezeigt wird, ist die Control Plane auf dem Management-Cluster die zentrale Komponente der Cluster API.

Abb. 10–1
Über die Cluster API können Benutzer mithilfe vorher festgelegter Spezifikationen Workload-Cluster auf verschiedene Plattformen bringen, ohne dabei plattformspezifisches Wissen zu benötigen.

Für dieses Vorhaben ist ein Kubernetes-Cluster unerlässlich. Der zentrale Management-Cluster überwacht alle Komponenten und Zustände der Workload-Cluster. Zur Konfiguration können sowohl eine imperative als auch eine deklarative Methode verwendet werden. Für die deklarative Konfiguration muss das Projekt Cluster API Operator9 genutzt werden. Zusätzlich sind in diesem Cluster alle benötigten Infrastruktur-Provider installiert, um von dort die Workload-Cluster zu provisionieren. Die Cluster API erweitert die Kubernetes-API um eigene CRDs, damit Cluster deklarativ spezifiziert werden können. So können wir domänenspezifische Ressourcen erstellen – und der Cluster API Controller gleicht stetig den aktuellen mit dem gewünschten Zustand ab. Auch gängige Konfigurationswerkzeuge wie Kustomize oder Helm lassen sich problemlos verwenden.

10.4Definition der Cluster API-Ressourcen

Die hohe Flexibilität von Kubernetes ermöglicht es uns, Cluster spezifisch an unsere Anforderungen anzupassen. Dabei können wir zwischen verschiedenen Optionen wie Bare Metal, virtuellen Maschinen oder Managed Services wählen und die Größe sowie Sicherheitsanforderungen individuell festlegen. Um den Anforderungen gerecht zu werden, nutzen wir die Architektur von Cluster API, die eine hohe Flexibilität ermöglicht. Hierbei werden neben der Cluster API selbst auch Provider eingesetzt, die wiederum in Bootstrap- und Infrastruktur-Provider unterteilt sind.

Bootstrap-Provider gewährleisten, dass Maschinen wie virtuelle Maschinen in Kubernetes-Nodes konvertiert werden. Standardmäßig wird kubeadm verwendet.
Infrastruktur-Provider stellen die definierten Cluster in einer Zielumgebung mit allen abhängigen Ressourcen bereit.

Abb. 10–2
Cluster API CRDs

Die Darstellung 10–2 zeigt das Zusammenspiel der Ressourcen auf, wenn wir Cluster API-Ressourcen (1) definieren. Dabei gibt es nicht nur generische Cluster API-eigene Ressourcen wie Cluster oder Machine, sondern auch providerspezifische Ressourcen (2). Die Bootstrap-Config (3) erzeugt und verwaltet die notwendigen Daten zur Registrierung einer Maschine als Knoten in einem Kubernetes Cluster.

Entwickelnde haben den Vorteil, dass sie die unterliegenden, providerspezifischen Ressourcen individuell austauschen und anpassen können. Wenn ich mich entscheide, meinen Workload von einem On-Premise-System auf einen Hyperscaler zu migrieren, reicht es aus, die Implementierung entsprechend anzupassen. Auch bereits existierende Cluster, die auf anderem Wege bereitgestellt wurden, können mithilfe von Cluster API verwaltet und migriert werden 10. Cluster API unterstützt somit eine Vielzahl an Providern. Neben Hyperscalern können auch andere Provider genutzt werden 11.

Wir gehen davon aus, dass ein einfacher EKS-Cluster mithilfe der Cluster API eingerichtet werden soll. In diesem Fall werden die in Abb. 10–3 aufgeführten Ressourcen benötigt.

Abb. 10–3
EKS-Cluster mit Cluster API

Ein Cluster ist das zentrale Element und referenziert sowohl auf eine obligatorische providerspezifische AWSCluster -Ressource als auch auf eine AWSManagedControlPlane -Ressource. Mit dieser Ressource lassen sich grundsätzliche Konfigurationen für das Pod-Netzwerk wie die CIDR der Pods definieren.

Ein MachineDeployment in Kubernetes dient als Vorlage für die entsprechenden Maschinen, ähnlich wie eine Deployment-Ressource. Da wir einen Managed Service nutzen, ist keine zusätzliche Ressource erforderlich. Stattdessen erstellen wir eine AWSMachine-Template und geben hier beispielsweise den Instanztyp der Worker-Nodes an. Zusätzlich definieren wir ein EKSConfigTemplate, um die Container-Runtime zu spezifizieren.

10.5Installation des Management-Clusters

Wie bereits zu Beginn dieses Kapitels erwähnt, ist es mit Cluster API einfach möglich, standardisierte Kubernetes-Cluster zu provisionieren und zu verwalten. Allerdings erfordert die Control Plane von Cluster API einen Management-Cluster, der für unseren Zweck folgende Kriterien erfüllen muss:

Zuverlässigkeit
Ausfallsicherheit
Wartbarkeit

Wir müssen einen zuverlässigen und ausfallsicheren Cluster in unserer Infrastruktur aufbauen. Zusätzlich müssen wir sicherstellen, dass unser Management-Cluster wartbar ist und Updates problemlos eingespielt werden können. Wir nutzen hierfür ebenfalls Cluster API. Um Kubernetes-Cluster zu provisionieren, benötigen wir jedoch selbst einen Kubernetes-Cluster, der wiederum einen weiteren Kubernetes-Cluster benötigt. Um dieses »Henne-Ei«-Problem zu lösen, verwenden wir einen temporären Bootstrap-Cluster. Der Prozess ist dann wie folgt:

Ein Bootstrap-Cluster dient häufig als lokaler Cluster. Wir erzeugen einen Cluster, um zuerst unseren Management-Cluster lokal aufzubauen.
Wir provisionieren ein neuen Ziel-Cluster.
Die Manifeste zur Konfiguration des Management-Clusters werden im Config-Repo versioniert und später für unser Ziel-Cluster verwendet, das dann der finale Management-Cluster ist.
Der Workload wird auf das unser Ziel-Cluster verschoben.
Der Bootstrap-Cluster wird abgebaut.

Unser Management-Cluster kann sowohl imperativ als auch deklarativ konfiguriert werden. Dabei werden wir unseren Bootstrap-Cluster imperativ bauen, wohingegen wir für den Management-Cluster den Cluster API Operator einsetzen. Wir setzen hier exemplarisch EKS ein.

10.5.1Provider konfigurieren und temporären Management-Cluster bauen

Zunächst stellen wir sicher, dass wir mit KinD einen lokalen Kubernetes-Cluster bauen können und clusterctl 12 installiert haben. Um neue Cluster bei AWS bereitstellen zu können, müssen selbstverständlich die entsprechenden Anforderungen des jeweiligen Providers erfüllt werden. Für die Einrichtung von AWS als Provider müssen zunächst die Rollen und Rechte mit Identity and Access Management (IAM) angelegt werden. Zur Vereinfachung stellt AWS das Tool clusterawsadm zur Verfügung 13, das die benötigten Ressourcen über AWS Cloud-Formation auf AWS bereitstellt. Hierfür ist wichtig ein Access- oder Session-Token als Umgebungsvariable zu definieren. Mithilfe des folgenden Befehls werden dann alle erforderlichen Ressourcen erstellt:

Listing 10–1
Anlegen der IAM-Rollen und Policies für den Management-Cluster mit AWS-Provider

export AWS_REGION=[Region]

export AWS_ACCESS_KEY_ID=[Key-Id]

export AWS_SECRET_ACCESS_KEY=[Secret]

clusterawsadm bootstrap iam create-cloudformation-stack

export AWS_B64ENCODED_CREDENTIALS=

$(clusterawsadm bootstrap credentials encode-as-profile)

Listing 10–2
Ausgabe nach Anlage aller Ressourcen

Attempting to create AWS CloudFormation stack

cluster-api-provider-aws-sigs-k8s-io

Following resources are in the stack:

Resource |Type |Status

AWS::IAM::InstanceProfile

|control-plane.cluster-api-provider-aws

.sigs.k8s.io |CREATE_COMPLETE

AWS::IAM::InstanceProfile |controllers.cluster-api-provider-aws

.sigs.k8s.io |CREATE_COMPLETE

...

|CREATE_COMPLETE

Nun können wir mit folgendem Befehl unseren Management-Cluster aufbauen:

Listing 10–3
Installation des Management-Clusters

export EXP_MACHINE_POOL=true

clusterctl init --infrastructure aws

Mit dieser zusätzlichen Umgebungsvariable aktivieren wir in der Cluster API die experimentelle Nutzung der sogenannten MachinePools. Mit dieser Ressource lassen sich Worker-Nodes logisch gruppieren, um unter anderem zentral die minimale und maximale Anzahl der Worker-Nodes zu verwalten.

Der Unterschied zwischen einem MachinePool und einem Machine-Deployment ist, dass ein MachinePool das Lifecycle Management der Maschinen der darunterliegenden Infrastruktur delegiert. Im Falle von AWS wird eine Autoscaling Group14 erstellt. So können beim Hoch- und Herunterskalieren des Clusters alle Vorteile wie Autoscaling der jeweiligen Cloud-Provider genutzt werden. Im Falle von EKS wird eine Managed Node Group15 angelegt, die den Lebenszyklus der Knoten verwaltet, was technisch gesehen EC2-Instanzen sind.

Listing 10–4
Ausgabe nach Anlage aller Ressourcen

Fetching providers

Installing cert-manager Version="v1.13.0"

Waiting for cert-manager to be available...

Installing Provider="cluster-api" Version="v1.5.2"

TargetNamespace="capi-system"

Installing Provider="bootstrap-kubeadm" Version="v1.5.2"

TargetNamespace="capi-kubeadm-bootstrap-system"

Installing Provider="control-plane-kubeadm" Version="v1.5.2"

TargetNamespace="capi-kubeadm-control-plane-system"

Installing Provider="infrastructure-aws" Version="v2.2.4"

TargetNamespace="capa-system"

Your management cluster has been initialized successfully!

Im Zuge des init-Prozesses werden Cluster API und kubeadm für die Provider Bootstrap und Control Plane installiert. Zudem wird AWS als Infrastructure-Provider eingerichtet, um unseren ersten funktionsfähigen Cluster deployen zu können.

Warum wird der Cert-Manager installiert?

Wir stellen fest, dass Cluster API auch den Cert-Manager16 im Management-Cluster mitinstalliert hat – warum eigentlich?

Cluster API implementiert einen Admission-Controller und verwendet Admission Webhooks zur Validierung und zur Modifikation von Admission Requests^17,18. Auf diese Weise fängt die Cluster API Anfragen ab, bevor der Inhalt dieser Anfragen persistiert wird. Über den Validation Webhook prüft die Cluster API, ob die übergebenen Werte und Parameter gültig sind und setzt über den Mutating Webhook Default-Werte, falls diese nicht gesetzt sind.

Die Kommunikation mit den jeweiligen Webhooks erfolgt ausschließlich über HTTPS. Hierfür ist ein gültiges Zertifikat erforderlich. Man kann ein eigenes Zertifikat verwenden oder man delegiert diesen Schritt an den Cert-Manager19. Mit dem CA-Injector20 kann das selbstsignierte Zertifikat dynamisch erzeugt und während des Deployments der Webhooks mitgegeben werden.

10.5.2Worker Cluster anlegen

Wie in Listing 10–4 ersichtlich ist, ermöglicht uns der Befehl clusterctl generate cluster die Generierung der benötigten Ressourcen als YAML-Dateien. Um unsere Workload-Cluster auf AWS bereitzustellen, müssen wir neben der Definition der benötigten AWS-Maschinentypen und des AWS EC2 Key-Pairs auch die Region definieren 21, in der die Cluster erstellt werden sollen 22,23. Diese Informationen müssen als Umgebungsvariablen zur Generierung von EKS-spezifischen Ressourcen definiert werden, wobei der sogenannte flavor als Kommando-Parameter angegeben werden muss. Zusätzlich können weitere Parameter wie die Kubernetes-Version und die Anzahl der Worker-Nodes definiert werden. Das Kommando ändert sich wie folgt:

Listing 10–5
Erstellung des Workload-Clusters

export AWS_REGION=us-east-1

export AWS_NODE_MACHINE_TYPE=t3.large

export AWS_SSH_KEY_NAME=capi-eks

clusterctl generate cluster gitops-eks-dev-cluster \

--flavor eks-managedmachinepool \

--kubernetes-version v1.25.3 \

--worker-machine-count=3 > capi-eks.yaml

Bei Ausführung werden nun die folgenden Ressourcen erzeugt:

Listing 10–6
Generierte Ressourcen für den Workload-Cluster

apiVersion: cluster.x-k8s.io/v1beta1

kind: Cluster

metadata:

spec: {}

---

apiVersion: infrastructure.cluster.x-k8s.io/v1beta2

kind: AWSManagedCluster

metadata:

spec: {}

---

apiVersion: controlplane.cluster.x-k8s.io/v1beta2

kind: AWSManagedControlPlane

metadata:

spec: {}

---

apiVersion: cluster.x-k8s.io/v1beta1

kind: MachinePool

metadata:

spec: {}

---

apiVersion: infrastructure.cluster.x-k8s.io/v1beta2

kind: AWSManagedMachinePool

metadata:

spec: {}

Wir haben nun eine Cluster-Ressource mit den dazugehörigen EKS-relevanten Ressourcen AWSManagedControlPlane und einem AWS-ManagedCluster. Weiterhin haben wir ein MachinePool, das ein AWSManagedMachinePool beinhaltet.

Da wir den Workload nach der Migration in Argo CD als Application verwalten wollen, erzeugen wir gleich eine kustomization.yaml und spezifizieren das generierte Manifest hier als Ressource hinzu:

Listing 10–7
Kustomize für den Workload-Cluster

apiVersion: kustomize.config.k8s.io/v1beta1

kind: Kustomization

resources:

- capi-eks.yaml

Die Ressourcen können durch kubectl apply -k. erzeugt werden. Gleichzeitig versionieren wir dieses Manifest in Git.

Listing 10–8
Apply der Cluster API-Ressourcen

kubectl -f capi-eks-quickstart.yaml apply

cluster.cluster.x-k8s.io/gitops-eks-dev-cluster created

awsmanagedcluster.infrastructure.cluster.x-k8s.io

/gitops-eks-dev-cluster created

awsmanagedcontrolplane.controlplane.cluster.x-k8s.io

/gitops-eks-dev-cluster-control-plane created

machinepool.cluster.x-k8s.io/gitops-eks-dev-cluster-pool-0

created

awsmanagedmachinepool.infrastructure.cluster.x-k8s.io

/gitops-eks-dev-cluster-pool-0 created

Um den Status des Deployments zu betrachten, kann folgender clusterctl-Befehl genutzt werden:

Listing 10–9
Den Status der Provisionierung mit clusterctl abrufen

clusterctl describe cluster gitops-eks-dev-cluster

NAME READY SEVERITY REASON SINCE MESSAGE

Cluster/gitops-eks-dev-cluster False Warning

NatGatewaysReconciliationFailed 4m55s 3 of 10 completed

|-- ClusterInfrastructure -

AWSManagedCluster/gitops-eks-dev-cluster

|-- ControlPlane - AWSManagedControlPlane/

gitops-eks-dev-cluster-control-plane False

Warning NatGatewaysReconciliationFailed

4m55s 3 of 10 completed

|-- Workers

|--MachinePool/gitops-eks-dev-cluster-pool-0

False Info WaitingForInfrastructure 6m17s

|-- MachineInfrastructure - AWSManagedMachinePool/

gitops-eks-dev-cluster-pool-0

Im Erfolgsfall werden folgende Informationen angezeigt:

Listing 10–10
Erfolgreiche Provisionierung des Workload-Clusters

clusterctl describe cluster gitops-eks-dev-cluster

Cluster/gitops-eks-dev-cluster True 30m

|-- ClusterInfrastructure - AWSManagedCluster

/gitops-eks-dev-cluster

|-- ControlPlane - AWSManagedControlPlane

/gitops-eks-dev-cluster-control-plane True 30m

|-- Workers

|-- MachinePool/gitops-eks-dev-cluster-pool-0 True 30m

Der Zugang zum EKS-Cluster wird durch das Erstellen eines neuen Kontexts in der kubeconfig ermöglicht. Hierfür muss der folgende Befehl ausgeführt werden:

Listing 10–11
Neuen Kontext setzen

aws eks update-kubeconfig \

--name gitops-eks-dev-cluster-control-plane \

--region us-east-1

Added new context arn:aws:eks:us-east-1:[ID]:

cluster/gitops-eks-dev-cluster-control-plane to

/Users/bariscubukcuoglu/.kube/config

So können wir mit kubectl auf den Workload-Cluster zugreifen:

Listing 10–12
Zugriff auf den Workload-Cluster

kubectl get nodes

NAME STATUS ROLES AGE VERSION

ip-10-0-168-232.ec2.internal Ready <none> 2d22h

v1.25.12-eks-8ccc7ba

Nun haben wir unseren Workload-Cluster erzeugt. Im nächsten Schritt bauen wir diesen Cluster in einen Management-Cluster um. Dabei wollen wir exakt den gleichen Aufbau wie in unserer lokalen Umgebung.

10.5.3Installation des Cluster API Operators

Um zu verstehen, warum der Cluster API Operator ein ideales Werkzeug für unsere Zwecke ist, müssen wir zuerst verstehen, wie clusterctl arbeitet.

Der Befehl clusterctl init installiert die Provider basierend auf einer standardmäßigen Konfiguration. Jeder Provider hat natürlich seine eigenen Ressourcen-Manifeste mit Platzhaltern für die entsprechenden Parameter. Diese Manifeste werden auf den jeweiligen Projektseiten veröffentlicht. Die CLI verwaltet diese in einem eigenen lokalen Repository.

Listing 10–13
Hinterlegte Repositories in der CLI

> clusterctl config repositories

NAME TYPE URL FILE

cluster-api CoreProvider

https://github.com/kubernetes-sigs/cluster-api/releases/latest/

core-components.yaml

kubeadm BootstrapProvider

https://github.com/kubernetes-sigs/cluster-api/releases/latest/

bootstrap-components.yaml

aws InfrastructureProvider

https://github.com/kubernetes-sigs/cluster-api-provider-aws/

releases/latest/

infrastructure-components.yaml

...

Wenn ein neuer Provider installiert wird, geschieht Folgendes:

Die CLI lädt das Ressourcen-Manifest des Providers in der spezifischen Version herunter.
Die Platzhalter werden durch unsere Parameter ersetzt.
Die Manifeste werden mit kubectl apply ausgeführt und die Ressourcen werden angelegt.

Wir können diese Manifeste mit dem Befehl clusterctl generate provider --infrastructure aws unter Berücksichtigung unserer Parameter exportieren und versionieren. Eine nachträgliche Anpassung unserer Parameter gestaltet sich jedoch als schwierig, da sie bereits eng mit den Manifesten verknüpft sind. Darüber hinaus sind die Manifeste auf eine bestimmte Version beschränkt, was ein Upgrade erschwert.

Die Absicht hinter dem Cluster API Operator ist es, den Lebenszyklus der Cluster API Provider deklarativ zu verwalten. Zu diesem Zweck installiert der Cluster API Operator einen Operator und führt ständig eine Reconciliation der Provider-Ressourcen durch. Die Provider-Ressourcen sind eigene CRDs und werden in CoreProvider, BootstrapProvider, ControlPlaneProvider und InfrastructureProvider unterteilt. Diese Ressourcen sind Wrapper für die eigentlichen Provider-Manifeste. Der Vorteil besteht darin, dass Modifikationen deklarativ vorgenommen werden können.

10.5.4Deklarative Installation des Management-Clusters

Für die Installation des Cluster API Operators ist der Cert-Manager erforderlich, während die Cluster API Provider den Cluster API Operator benötigen. Wir legen zunächst die Argo CD Application-Ressourcen an, führen sie jedoch nicht aus. Für den Cert-Manager definieren wir die folgende Ressource:

Listing 10–14
Anlegen der Cert-Manager-Ressourcen

apiVersion: argoproj.io/v1alpha1

kind: Application

metadata:

namespace: argocd

finalizers:

- resources-finalizer.argocd.argoproj.io

spec:

project: default

source:

repoURL: 'https://charts.jetstack.io'

targetRevision: v1.13.0

helm:

parameters:

- name: installCRDs

value: 'true'

chart: cert-manager

destination:

server: 'https://kubernetes.default.svc'

namespace: cert-manager

syncPolicy:

syncOptions:

- CreateNamespace=true

- ApplyOutOfSyncOnly=true

Danach erstellen wir die Ressource für den Cluster API Operator:

Listing 10–15
Cluster API Operator wird angelegt

apiVersion: argoproj.io/v1alpha1

kind: Application

metadata:

namespace: argocd

finalizers:

- resources-finalizer.argocd.argoproj.io

project: default

source:

repoURL: 'https://kubernetes-sigs.github.io/

cluster-api-operator'

targetRevision: 0.6.0

chart: cluster-api-operator

destination:

server: 'https://kubernetes.default.svc'

namespace: capi-operator-system

syncPolicy:

syncOptions:

- CreateNamespace=true

ignoreDifferences:

- group: apiextensions.k8s.io

kind: CustomResourceDefinition

jsonPointers:

- /spec/conversion/webhook/clientConfig/caBundle

Da das Zertifikat zur Laufzeit mithilfe des Cert-Managers generiert wird, entfernen wir das caBundle explizit aus der Reconciliation.

Nun müssen wir unsere Provider-Ressource anlegen. Um exakt unseren Management-Cluster nachzubilden, benötigen wir 4 Provider-Ressourcen und müssen eine kustomization.yaml erstellen, damit die Provider als Einheit deployt werden können. Exemplarisch legen wir folgenden Infrastructure-Provider für AWS.

Listing 10–16
Anlegen der Cluster API Provider

apiVersion: operator.cluster.x-k8s.io/v1alpha2

kind: InfrastructureProvider

metadata:

namespace: capa-system

spec:

version: v2.2.4

configSecret:

namespace: capa-system

manager:

featureGates:

EKS: true

EKSEnableIAM: true

EKSAllowAddRoles: true

EKSFargate: false

MachinePool: true

Über den Namen und die Version legen wir fest, welchen Provider wir benötigten. Zudem definieren wir Feature-Gates, damit benötigte Features aktiviert werden. Unsere kustomization.yaml ist wie folgt:

Listing 10–17
Wir fassen alle Ressourcen zu einer Einheit zusammen

apiVersion: kustomize.config.k8s.io/v1beta1

kind: Kustomization

resources:

- cluster-api-control-plane-provider.yaml

- cluster-api-bootstrap-provider.yaml

- cluster-api-core-provider.yaml

- cluster-api-infra-provider.yaml

Nun können wir diese Ressourcen wie folgt in Argo CD anlegen:

Listing 10–18
Wir legen eine Application-Ressource für die Provider an

apiVersion: argoproj.io/v1alpha1

kind: Application

metadata:

namespace: argocd

spec:

destination:

server: 'https://kubernetes.default.svc'

source:

path: management/operator/provider

repoURL: 'git@gitlab.com:gitops-book/

multi-cluster-config.git'

targetRevision: HEAD

sources: []

project: default

syncPolicy:

syncOptions:

- CreateNamespace=true

- ApplyOutOfSyncOnly=true

Wir pushen alle definierten Ressourcen auf Git. Nun wenden wir das bekannte App Of Apps-Pattern an. Dazu fassen wir die definierten Ressourcen in einer kustomization.yaml-Ressource zusammen.

Listing 10–19
Wir fassen nun alle Application Ressources zu einer Einheit zusammen

apiVersion: kustomize.config.k8s.io/v1beta1

kind: Kustomization

resources:

- cert-manager.yaml

- cluster-api-operator.yaml

- cluster-api-providers.yaml

Für Argo CD legen wir eine neue Application-Ressource an:

Listing 10–20
Definieren einer Application-Ressource für die App Of Apps-Konfiguration

apiVersion: argoproj.io/v1alpha1

kind: Application

metadata:

namespace: argocd

project: default

source:

repoURL: 'git@gitlab.com:gitops-book/multi-cluster-config.git'

path: management/operator

targetRevision: HEAD

destination:

server: 'https://kubernetes.default.svc'

syncPolicy:

syncOptions:

- CreateNamespace=true

- ApplyOutOfSyncOnly=true

Jedoch haben wir bisher unsere Abhängigkeit nicht gelöst. Hierzu setzen wir in Argo CD das Feature Sync Phases and Waves24 ein. Damit können wir eine aufsteigende Abfolge von Wellen definieren, die sicherstellt, dass Ressourcen »Healthy« sind, bevor die nachfolgenden Ressourcen synchronisiert werden. Allerdings beschränkt sich dieses Feature auf Kubernetes-Ressourcen. Mit einem »Hack« funktioniert diese Funktion auch für Application-Ressourcen 25. Wir verändern hierzu eine ConfigMap-Ressource argocd-cm wie folgt:

Listing 10–21
Anpassung der ConfigMap, damit Applications ebenfalls Sync-Waves verwenden können

apiVersion: v1

kind: ConfigMap

metadata:

namespace: argocd

labels:

app.kubernetes.io/name: argocd-cm

app.kubernetes.io/part-of: argocd

data:

resource.customizations: |

argoproj.io/Application:

health.lua: |

hs = {}

hs.status = "Progressing"

hs.message = ""

if obj.status ~= nil then

if obj.status.health ~= nil then

hs.status = obj.status.health.status

if obj.status.health.message ~= nil then

hs.message = obj.status.health.message

end

return hs

Dadurch wird sichergestellt, dass der Application-Controller den Zustand der Application-Ressource korrekt meldet. Nun definieren wir zu jeder Application die entsprechenden Wellen wie folgt:

Listing 10–22
Definition einer Sync-Wave

annotations:

argocd.argoproj.io/sync-wave: "1"

Für den Cert-Manager definieren wir »0«, für den Cluster API Operator eine »1«, für die Cluster API Provider eine »2«.

Wenn wir Application-Ressource cluster-api-config deployen und synchronisieren, werden alle Ressourcen nacheinander bereitgestellt. In Abb. 10–4 sehen wir den Cert-Manager, in Abb. 10–5 den Operator und schließlich auch den Provider in Abb. 10–6.

Nun können wir damit beginnen, unseren Workload vom Bootstrap-Cluster auf unseren Management-Cluster zu übertragen. Dazu verwenden wir das folgende Kommando:

Listing 10–23
Migration der Workloads auf einen Management-Cluster

> clusterctl move --to-kubeconfig=eks-kubeconfig.yaml

Discovering Cluster~API objects

Moving Cluster~API objects Clusters=1

Moving Cluster~API objects ClusterClasses=0

Creating objects in the target cluster

Deleting objects from the source cluster

Abb. 10–4
Installation des Cert-Managers

Abb. 10–5
Installation des Cluster API-Operators

Abb. 10–6
Installation des Cluster API-Providers

Wir überprüfen, ob sich tatsächlich keine Cluster mehr auf unserem Bootstrap-Cluster befinden:

Listing 10–24
Prüfen, ob auf dem Bootstrap-Cluster noch Cluster-Ressourcen vorhanden sind

> kubectl get cluster

No resources found in default namespace.

Nun ist es möglich, für den aktuellen Management-Cluster eine Argo CD Application-Ressource zu erstellen. Dafür referenzieren wir auf das zuvor definierte kustomization.yaml.

Listing 10–25
Application-Ressource für Management-Cluster

apiVersion: argoproj.io/v1alpha1

kind: Application

metadata:

namespace: argocd

project: default

source:

repoURL: 'git@gitlab.com:gitops-book/multi-cluster-config.git'

path: management/cluster

targetRevision: HEAD

destination:

server: 'https://kubernetes.default.svc'

Es ist zu erkennen, dass die Ressourcen nun durch Argo CD synchronisiert werden, wie in Abb. 10–7 dargestellt.

Abb. 10–7
Management-Cluster wird durch Argo CD synchronisiert

Für unseren Boostrap-Cluster gibt es keine Verwendung mehr. Wir können den Cluster nun abbauen.

10.6Verwaltung von Workload-Clustern mit Argo CD

In einer heterogenen Unternehmenslandschaft können Cluster unterschiedlicher Art, Größe und Zweck existieren. Ein Entwicklungsteam benötigt typischerweise drei Cluster: Entwicklung, Staging und Produktion. So findet die Entwicklung hauptsächlich im Development-Cluster statt, während Staging zum Testen und für den Preview-Zugang für Stakeholder genutzt wird und Production als Produktionsumgebung dient.

Im vorliegenden Fall liegt exakt der beschriebene Aufbau mit drei Clustern vor.

Abb. 10–8
Ordnerstruktur der Cluster

Im base-Ordner sind alle Grundeinstellungen der Cluster definiert. Der Ordner environments beinhaltet EKS-spezifischen Ausprägungen. Im Falle von EKS wird die Amazon VPC CNI als Add-on installiert 26.

Listing 10–26
Manifest für die AWSManagedControlPlane

apiVersion: controlplane.cluster.x-k8s.io/v1beta2

kind: AWSManagedControlPlane

metadata:

namespace: default

spec:

region: us-east-1

sshKeyName: capi-eks

endpointAccess:

public: false

private: true

addons:

- name: vpc-cni

version: v1.13.4-eksbuild.1

conflictResolution: overwrite

Schließlich enthält der Ordner overlays die Definition der Umgebungen und die entsprechenden Anpassungen. In dev ist festgelegt, dass Spot-VMs verwendet werden sollen.

Listing 10–27
Manifest für den AWSManagedMachinePool

apiVersion: infrastructure.cluster.x-k8s.io/v1beta2

kind: AWSManagedMachinePool

metadata:

namespace: default

spec:

capacityType: spot

Diese Struktur sowie weitere Environments wie Docker und EC2 sind in den Beispielen zu finden 27.

Die Frage ist, wie die Prinzipien von GitOps angewendet werden können, um Änderungen im Cluster vorzunehmen. Vorab muss Argo CD autorisiert werden, Cluster API-Ressourcen zu verwalten. Hierzu muss ein ClusterRoleBinding angelegt werden, um dem Service-Account von Argo CD die erforderlichen Berechtigungen zuzuordnen. Der Einfachheit halber fügen wir die Rolle cluster-admin dem Service-Account argocd-application-controller hinzu.

Listing 10–28
Zuweisung der Rolle zum Argo CD ServiceAccount

apiVersion: rbac.authorization.k8s.io/v1

kind: ClusterRoleBinding

metadata:

subjects:

- kind: ServiceAccount

namespace: default

roleRef:

apiGroup: rbac.authorization.k8s.io

kind: ClusterRole

Sowohl der Development-Cluster als auch der Staging-Cluster müssen als Application eingerichtet werden. Hierzu muss zuerst das Repository in Argo CD hinterlegt werden:

Listing 10–29
Anlage des Git-Repositorys als Argo CD Repo

argocd repo add \

git@gitlab.com:gitops-book/multi-cluster-config.git \

--[further Parameter]

Dann muss die jeweilige Umgebung als Application definiert werden:

Listing 10–30
Anlegen der Development-Umgebung als Application-Ressource in Argo CD

argocd app create acme-cluster-dev \

--project default \

--path overlays/dev \

--repo git@gitlab.com:gitops-book/multi-cluster-config.git \

--sync-policy auto \

--dest-namespace default \

--dest-server https://kubernetes.default.svc

Listing 10–31
Anlegen der Staging-Umgebung als Application-Ressource in Argo CD

argocd app create acme-cluster-staging \

--project default \

--path overlays/staging \

--repo git@gitlab.com:gitops-book/multi-cluster-config.git \

--sync-policy auto \

--dest-namespace default \

--dest-server https://kubernetes.default.svc

Im optimalen Fall sollte der Zustand in Argo CD als Healthy und Synced angezeigt werden, wie in Abb. 10–9 gezeigt.

Wir beabsichtigen, die Kubernetes-Cluster auf Version v1.27.3, sowohl in der Umgebung Entwicklung als auch in der Umgebung Staging, zu aktualisieren. Es ist wichtig, die Control Plane-Version und die Worker-Nodes entsprechend anzupassen. Zusätzlich zur Aktualisierung der Kubernetes-Version muss auch die korrekte CNI-Version für EKS installiert werden. Hierfür muss die Datei /base/control-plane-kubeadm.yaml im Verzeichnis base wie folgt angepasst werden:

Listing 10–32
Upgrade der Control Plane der Workload-Cluster

apiVersion: controlplane.cluster.x-k8s.io/v1beta1

kind: KubeadmControlPlane

metadata:

namespace: default

spec:

version: v1.27.3

Abb. 10–9
Sowohl Dev als auch Staging sind Healthy und Synced.

Für die Worker-Nodes muss eine Änderung in der MachinePool-Ressource in der Datei environments/aws-eks/resources/machine-pool. yamlvorgenommen werden.

Listing 10–33
Upgrade der Worker-Nodes der Workload-Cluster

apiVersion: cluster.x-k8s.io/v1beta1

kind: MachinePool

metadata:

namespace: default

spec:

clusterName: capi-cluster

replicas: 1

template:

spec:

** further configs

version: v1.27.3

Für das CNI müssen wir die Ressource environments/aws-eks/patches/aws-managed-control-plane.yaml wie folgt anpassen:

Listing 10–34
Upgrade der EKS CNI

apiVersion: controlplane.cluster.x-k8s.io/v1beta2

kind: AWSManagedControlPlane

metadata:

namespace: default

spec:

** further configs

addons:

- name: vpc-cni

version: v1.13.4-eksbuild.1

conflictResolution: overwrite

Die Änderungen müssen lediglich committet werden, damit die Reconciliation durch Argo CD durchgeführt werden kann. Die Einstellung auto-sync bewirkt den Apply der Änderungen auf dem Management-Cluster und startet somit das Upgrade beider Cluster, wie in Abb. 10–10 und Abb. 10–11 dargestellt.

Abb. 10–10
Apply auf Dev

Abb. 10–11
Upgrade des Dev-Clusters auf AWS

Nach dem Upgrade sollte die EKS-Version bei beiden Clustern jeweils in der Zielversion vorhanden sein, wie in Abb. 10–12 und Abb. 10–13 dargestellt.

Abb. 10–12
Der Stand nach dem Upgrade der Cluster

Abb. 10–13
Der Stand der Node Group nach dem Upgrade der Cluster

Zudem muss die AWS Node Group ebenfalls aktualisiert werden und in der gleichen Version vorliegen. Zur Überprüfung kann nochmals das clusterctl-Kommando abgesetzt werden.

Listing 10–35
Kontrolle nach Upgrade mit clusterctl

clusterctl describe cluster dev-capi-cluster

NAME READY SEVERITY REASON SINCE MESSAGE

Cluster/dev-capi-cluster True 34m

|-- ClusterInfrastructure - AWSManagedCluster

/dev-capi-cluster

|-- ControlPlane - AWSManagedControlPlane

/dev-capi-eks-control-plane True 34m

|-- Workers

|-- MachinePool/dev-capi-eks-pool True 26m

10.7Fazit

GitOps mit der Cluster API funktioniert einwandfrei. In diesem Beispiel konnten wir zeigen, dass die Verwaltung einer komplexen Cluster-Umgebung sicher und mit geringem Aufwand umsetzbar ist.