Die Automatisierung von Codeerstellung und -tests mit CI/CD ermöglicht es uns, Code häufig auszuliefern und dabei ein hohes Maß an Vertrauen zu haben, dass Fehler keine Auswirkungen auf Endbenutzer haben. Warum sind unsere CI/CD-Systeme dann aber immer noch oft quälend langsam, unzuverlässig und unsere Lieferfähigkeit häufig blockiert?
Site Reliability Engineering (SRE) hat zum Ziel, die Probleme zu reduzieren, die durch mangelhafte Plattformen und Prozesse entstehen, welche die Zuverlässigkeit und Stabilität von Produktionssystemen beeinträchtigen.
Begleiten Sie Mel Kaulfuss von Buildkite, wenn sie CI/CD aus der Perspektive von SRE betrachtet.
In dieser Sitzung lernen Sie, wie Sie SRE-Prinzipien und -Praktiken in CI/CD integrieren können, einschließlich:
- Definition aussagekräftiger SLOs (Service-Level-Ziele) und SLIs (Service-Level-Indikatoren)
- Systemleistung und Kennzahlen beobachten
- Fehlerbudgets zur Optimierung Ihrer Testsuiten und -pipelines verwenden
Indem Sie Ihre CI/CD-Infrastruktur und -Prozesse wie Ihre Produktionssysteme verwalten, mit einer SRE-Denkweise, können Sie schnell reagieren, wenn etwas schiefgeht, und die Kontrolle über große, langsame und unzuverlässige Build- und Deployment-Prozesse zurückgewinnen.
„Die PagerDuty Operations Cloud ist für TUI von entscheidender Bedeutung. Sie wird uns tatsächlich dabei helfen, als Unternehmen zu wachsen, wenn es darum geht, unseren Kunden qualitativ hochwertige Dienstleistungen zu bieten.“
- Yasin Quareshy, Leiter der Technologieabteilung bei TUI