Skalierbarkeit erreicht man, indem man Anwendungen als Micro Services designt, in Containern betreibst und über Orchestration Plattformen wie Kubernetes verwaltet. Dadurch kann man einzelne Komponenten unabhängig voneinander je nach Bedarf skalieren. Wenn man Autoscaling auf CPU oder Memory Nutzung konfiguriert, passt sich die Umgebung automatisch an wechselnde Last an. Außerdem empfiehlt sich die Nutzung, wo möglich, von Stateless Services, damit sich Replikate einfach hinzufügen oder entfernen lassen. Monitoring und Observability Tools liefern Echtzeit-Einblicke in die Performance, damit man rechtzeitig nachsteuern und Kosten unter Kontrolle halten kannst.