Site Reliability Engineers sorgen dafür, dass Apps und Websites reibungslos und zuverlässig funktionieren. Erfahren Sie mehr über diesen aufstrebenden Beruf und welche Fähigkeiten Sie für den Einstieg benötigen.
Read in English (Auf Englisch lesen).
Ein Site Reliability Engineer (SRE) sorgt für mehr Zuverlässigkeit, Effizienz und Skalierbarkeit von Websites. Er unterstützt bei der Entwicklung automatisierter Lösungen zur Verbesserung der betrieblichen Aspekte der Website. Da wir im Alltag immer mehr online gehen, wird es immer wichtiger, diese Technologien am Laufen zu halten. Werfen wir einen genaueren Blick auf diesen aufstrebenden Beruf und die Fähigkeiten, die Sie für den Einstieg benötigen.
Wussten Sie schon? SREs entstanden erstmals 2003, als Google ein Team von Softwareentwicklern zusammenstellte, dessen einziger Zweck darin bestand, die Zuverlässigkeit und Skalierbarkeit der Unternehmenswebsites zu verbessern. Der Ansatz war so effektiv, dass andere führende Technologieunternehmen wie Netflix und Amazon bald nachzogen.
Die SRE-Rolle stellt sicher, dass eine Site über die notwendigen Funktionen verfügt, um Benutzern die gewünschten Dienste bereitzustellen. In der heutigen automatisierten Welt umfasst dies die Entwicklung von Self-Service-Tools, die Benutzern mehr Verfügbarkeit, Leistung und Effizienz bieten.
Laut Ben Treynor, VP of Engineering bei Google, ist SRE „das, was passiert, wenn Sie einen Softwareentwickler bitten, eine Betriebsfunktion zu entwerfen.“ Die meisten SREs verbringen ihre Zeit mit Betriebsaufgaben und Entwicklungsprojekten (Entwicklung neuer Funktionen, Automatisierung von Prozessen, Skalierung von Systemen usw.).
Zu den Aufgaben und Pflichten eines Site Reliability Engineers können gehören:
Zusammenarbeit mit Softwareentwicklern, Ingenieuren und Betriebsteams
Überwachung von Websites und Software, um sicherzustellen, dass sie ordnungsgemäß funktionieren (einschließlich Bereitschaftsschichten)
Potentielle Probleme vorhersehen, bevor sie auftreten (und Lösungen finden)
Durchführen von Überprüfungen nach Vorfällen
Dokumentieren der Arbeit, um Erkenntnisse in wiederholbare Aktionen umzuwandeln
Codierungsautomatisierung innerhalb einer Site-Infrastruktur
Mentoring und Coaching von Nachwuchsingenieuren
Die Disziplinen SRE und DevOps überschneiden sich in vielerlei Hinsicht, weisen aber auch einen wesentlichen Unterschied auf. DevOps-Teams definieren, was getan werden muss, um Lücken zwischen Softwareentwicklung und -betrieb zu minimieren. SRE-Teams übersetzen die Säulen von DevOps in die Praxis. Während DevOps das „Was“ darstellt, ist SRE das „Wie“.
Um in dieser Rolle erfolgreich zu sein, ist es oft wichtig, proaktiv Probleme zu lösen und ein Auge für Softwareentwicklung zu haben. Folgende Fähigkeiten sind für diesen Job von Vorteil:
Verständnis für Entwicklung und Betrieb
Vertrautheit mit Produktionsüberwachungssystemen
Liebe zum Detail
Analytische Fähigkeiten und Problemlösungsfähigkeiten
Fähigkeit zur Zusammenarbeit in multifunktionalen Teams
Codierung in Java, Python, Perl oder Ruby
Technische Schreibfähigkeiten
Laut Glassdoor beträgt das geschätzte Gesamtgehalt eines Site Reliability Engineers in Deutschland € 74 500 pro Jahr [1].
Site Reliability Engineering ist typischerweise eine Position auf mittlerer Ebene – eine gute Option für Personen mit einigen Jahren Erfahrung als Systemadministrator oder Softwareentwickler. Die meisten Unternehmen setzen einen Bachelor-Abschluss in Informatik oder einem verwandten Fach voraus. Zusätzliche Zertifizierungen und Erfahrung mit verschiedenen Betriebs- und Programmiercodes sind ebenfalls von Vorteil.
Für Berufseinsteiger ist eine Junior-Position in einem Site-Reliability-Engineering-Team eine gute Möglichkeit, zu lernen und sich weiterzuentwickeln. In diesem Umfeld können Sie gemeinsam mit anderen Probleme lösen und gleichzeitig Ihre Fähigkeiten ausbauen. Mit zunehmender Erfahrung und technischem Wissen können Sie Ihre Karriere oft in höhere Positionen vorantreiben.
Erwerben Sie die Fähigkeiten auf, die Sie als SRE benötigen, mit Site Reliability Engineering: Messen und Verwalten der Zuverlässigkeit, angeboten von Google Cloud auf Coursera. Entwickeln Sie ein tieferes Verständnis dafür, wie Service Level Indicators (SLIs) und Service Level Objectives (SLOs) zur Verwaltung und Messung der Zuverlässigkeit eingesetzt werden. Nach Abschluss des Kurses erhalten Sie ein Zertifikat, das Sie in Ihrem Lebenslauf verwenden können.
Glassdoor. „Gehälter als Site Reliability Engineer in Deutschland, https://www.glassdoor.de/Geh%C3%A4lter/site-reliability-engineer-gehalt-SRCH_KO0,25.htm.“ Abgerufen am 31. März 2025.
Redaktion
Das Redaktionsteam von Coursera besteht aus äußerst erfahrenen professionellen Redakteuren, Autoren ...
Diese Inhalte dienen nur zu Informationszwecken. Den Lernenden wird empfohlen, eingehender zu recherchieren, ob Kurse und andere angestrebte Qualifikationen wirklich ihren persönlichen, beruflichen und finanziellen Vorstellungen entsprechen.