Katharina ist 35 Jahre alt und arbeitet seit 2015 als Cloud Engineer bei der Telekom MMS. Gerade befindet sie sich außerdem auf dem Weg zur Cloud Architektin. Doch was macht man im Cloud Engineering eigentlich den ganzen Tag? Was hängt von ihrer Arbeit alles ab? Und was passiert, wenn es mal nicht so glatt läuft?

In der neuen Blogreihe unseres Portfolio-Clusters Agile Operations & Cloud (AOC) erhaltet ihr tiefere Einblicke in das heutige Arbeitsleben in unserem Cloud Engineering Team. Denn die Digitalisierung, die unser ganzes Leben beeinflusst, verändert auch die Arbeitsbedingungen. Kommt also mit, wenn unsere Mitarbeitenden ihre „virtuelle Bürotür“ öffnen.

Im heutigen Teil gibt uns Katharina Einblicke in die Aufgabenbereiche, für die sie verantwortlich ist, mit welchen Kolleg*innen sie dabei zusammenarbeitet und welche Tools sie dafür benutzt.

Hallo Katharina, könntest du uns verraten, was eigentlich dein Tätigkeitsbereich ist?

Mein Team unterstützt die Kolleg*innen des Kunden und ist dort mit der Pflege, Weiterentwicklung und Automatisierung der verschiedenen Systemlandschaften betraut, sowie Fehleranalyse. Die Systeme befinden sich mittlerweile vollständig in der Google Cloud. Das umfasst u.a. auch die Ausspielung und die Backends für eine große Plattform die Videobeiträge und Podcasts bereitstellt. Wir erbringen hierfür auch eine Rufbereitschaft. Die letzten Jahre waren dabei so ein bisschen Selbstfindungsphase für uns, weil sich mit dem Umzug in die Cloud einige Fragen rund um die Rolle »Betrieb« ergeben haben. Wir mussten uns da teilweise neu erfinden, »Betrieb« weicht nun eher sowas wie Site Reliability Engineering (SRE). SRE beinhaltet hauptsächlich Aufgaben aus dem Bereich Automatisierung und Stabilisierung mit dem Schwerpunkt auf komplexen skalierbaren Systemen. Wen das interessiert: Google hat hierzu mehrere kostenlose und sehr empfehlenswerte E-Books verfasst (Google – Site Reliability Engineering (sre.google)). Die Aufgabengebiete sind nun deutlich vielfältiger und dynamischer geworden, was ich richtig gut finde. Selten war die Arbeit spannender als das im Moment der Fall ist.

Mit welchen Kolleg*innen arbeitest du am häufigsten zusammen?

Neben dem unmittelbaren MMS-Team arbeite ich beim Kunden etwa zur Hälfte mit Entwickler*innen zusammen. Das hat mir sehr geholfen, viele Abläufe und Themen besser zu verstehen, weil ich aus dem klassischen OPS-Bereich komme und vorher z. B. nie mit SCRUM (eine Organisationsform für agile Softwareentwicklung die verschiedene Rollen und Regeltermine einführt) zu tun hatte. Auch die Arbeit in Sprints (kurzer, fest definierter Zeitraum, in dem ein Scrum-Team ein bestimmtes Arbeitskontingent erledigt) kannte ich nicht und meine Berührungspunkte mit Entwickler*innen waren generell bisher eher punktuell. Außerdem habe ich festgestellt, dass die Kolleg*innen wahnsinnig viele interessante Dinge machen, sodass ich mit Freude auch in andere Themen einsteige, wenn es sich ergibt. Die andere Hälfte an Menschen, mit denen ich zu tun habe, teilt sich in Leute, die ähnliche Themen machen wie ich, also Infrastruktur und Automatisierung. Dann wäre da noch eine bunte Mischung aus Projektleiter*innen, Manager*innen und externen Dienstleistern, die das restliche Viertel ausmachen. Das ist aber meiner übergreifenden Tätigkeit hin zur Cloud Architektin geschuldet. Als Cloud Engineer hat man mit diesen Gruppen nur punktuell zu tun, bzw. eher indirekt über den/die Service Manager*in.

Gab es heute auch herausfordernde Aufgaben für dich?

Wir hätten aufgrund fehlerhafter Alarmierungen fast ein ablaufendes SSL-Zertifikat übersehen. Das hat mich an ein Konzeptticket fürs Alerting (beschreibt die gezielte, proaktive Informationsversorgung aller Betroffenen eines Ereignisses oder prognostizierten Ereignisses mittels Benachrichtigung) erinnert, dass noch bei mir liegt und dringend bearbeitet werden möchte. Viele Leute nutzen das Monitoringtool des Kunden und können Sachen ändern. Das sorgt manchmal für Probleme, wenn es nicht abgestimmt ist.

Da musstest du sicher heute deine Arbeit schnell umplanen?

Ja, die Bestellung und der Wechsel des eben erwähnten Zertifikats musste zuerst sichergestellt werden, weil es in vier Tagen abläuft und an dieser Stelle noch manuell getauscht werden muss. Wir möchten unter allen Umständen eine Störung verhindern, die noch dazu mitten im Wochenende in der Bereitschaft aufgetreten wäre.

Stichwort Tools: Mit welchen Tools arbeitest du denn am liebsten?

Ich liebe Kubernetes (Open-Source-System zur Verwaltung von Container-Anwendungen). Zum Glück darf ich mittlerweile damit arbeiten und kenne mich recht gut aus. Aus meiner Sicht war und ist es an vielen Fronten ein ziemlicher Game-Changer. Die Cloud Infrastruktur wird in Terraform abgebildet. Da drumherum gebaut ist ein schöner Workflow in Gitlab-CI, der linting, dry-run usw. gleich mit übernimmt.
Alles innerhalb der Kubernetes Cluster wird mittels selbstgebauter Scripts und Pipelines ausgerollt. Das ist nicht mehr ganz aktuell und wird aktuell neu geplant und gebaut. Deployments und alle möglichen anderen automatisierten Vorgänge triggern wir derzeit über einen Jenkins. Mindestens für das Deployment wird sich das bald ändern und mehr in Richtung GitOps (automatisches Deployment getriggert durch Aktionen im Code-Repository) gehen. Das ist nur ein winziger Abriss an Tools, die ganzen Google Cloud spezifischen Tools habe ich hier noch gar nicht genannt. Es geht sehr in die Breite bei uns hinsichtlich Aufgaben, Wissen und Tools. Das ist mitunter sehr herausfordernd und man ist permanent am Lernen.

Vielen Dank für deine heutigen Einblicke, und bis nächste Woche.


Neugierig wie es weitergeht oder einen Teil verpasst?

Wenn euch das Interview neugierig gemacht hat, keine Sorge, wir haben noch mehr für euch:

> Jobs zum Anhören – die Cloud Architektur im Jobcast

oder alternativ auf:

> Spotifiy erfahren.

Du suchst nach neuen Herausforderungen als Cloud Engineer oder möchtest dich gerne weiterentwickeln, dann bewirb dich auf unsere offenen Jobs:

> Zur Stellenbörse