Cloud Site Reliability Engineer Job at GBST (London)

Cloud Site Reliability Engineer

GBST

Location:
United Kingdom , London

Category:
IT - Software Development

Contract Type:
Not provided

Salary:

Not provided

Save Job

Apply Position

Job Description:

We’re now on the lookout for a Cloud Site Reliability Engineer to strengthen our Technology team that is working on delivering robust, scalable, and reliable cloud infrastructure and services. In your role as Cloud Site Reliability Engineer, you’ll work at the heart of our platform operations, ensuring high availability, reliability, and performance of our cloud-based systems. You’ll be responsible for automating infrastructure, implementing resilience strategies, and supporting our global client base with best-in-class reliability engineering. This is a London based role collaborates with production support, development, cloud platform, and architecture teams to deliver operational excellence and continuous improvement.

Job Responsibility:

Manage and optimise cloud infrastructure to ensure high availability and system reliability
Design, deploy, and maintain scalable infrastructure on AWS using Kubernetes, Docker, and Infrastructure as Code (Terraform, CloudFormation)
Implement and automate resilience testing strategies using chaos engineering tools (e.g., AWS Fault Injection, Gremlin, Chaos Monkey, LitmusChaos)
Monitor and observe systems using tools such as Prometheus, Grafana, Datadog, New Relic, and Elastic Stack
Automate operational processes using scripting languages (Python, Go, Shell, Ruby, Java)
Participate in incident response, triage, mitigation, and root cause analysis, ensuring minimal downtime and continuous improvement
Develop playbooks for common incidents, reducing Mean Time to Resolution (MTTR)
Design and test disaster recovery strategies, conduct DR drills, and implement multi-region failover and data replication
Define and manage Service Level Objectives (SLOs), Service Level Agreements (SLAs), and Service Level Indicators (SLIs)
Collaborate across teams to improve platform resilience and performance, and mentor others in SRE best practices
Ensure compliance with GBST policies, statutory requirements, and industry standards (e.g., PCI DSS, GDPR, ISO 27001)
Deliver 24/7 support via on-call rotation for after-hours issues

Requirements:

ITIL Foundation Certification
AWS Certified Cloud Practitioner (CCP)
Terraform Associate
Hands-on experience with AWS cloud administration and automation technologies
Skilled in observability tooling (infrastructure monitoring, log aggregation, analytics, APM, Synthetic/RUM)
Proficient with BitBucket (GIT source code management and CI)
Experience with observability suites (DataDog, New Relic, Dynatrace, Splunk, Sumo Logic)
Strong problem-solving and debugging abilities
Clear communicator and effective collaborator
Proactive, organised, and able to manage multiple priorities in a fast-paced team

Nice to have:

AWS SysOps Administrator Certification
Experience with zero-downtime deployment strategies
Background in highly available, secure, and performant production systems
Disaster recovery planning, failure injection, and mentoring experience

What we offer:

Flexible/hybrid working arrangements
Instant savings and discounts at major retailers across the country
Private Health Insurance including Dental and Optical Cover
Non-contributory Pension Scheme
Salary Sacrifice Schemes – Car, Cycle to Work, and Additional Pension Contributions
Additional GBST & U day off every year
Employee Assistance Program (EAP)
LinkedIn Learning access

Additional Information:

Job Posted:
March 13, 2026

Expiration:
March 31, 2026

Employment Type:

Fulltime

Work Type:

Hybrid work

GBST - All Job Offers

Job Link Share:

Cloud Site Reliability Engineer

GBST

Location:
United Kingdom , London

Category:
IT - Software Development

Contract Type:
Not provided

Salary:

Job Description:

Job Responsibility:

Requirements:

Nice to have:

Additional Information:

Job Posted:
March 13, 2026

Expiration:
March 31, 2026

Looking for more opportunities? Search for other job offers that match your skills and interests.

Similar Jobs for Cloud Site Reliability Engineer

Senior Site Reliability Engineer

Senior Site Reliability Engineer

Senior Site Reliability Engineer

Principal Site Reliability Engineer

Senior Site Reliability Engineer

Staff Site Reliability Engineer

Site Reliability Engineering Manager

Cloud Security Site Reliability Engineer

Cloud Site Reliability Engineer

GBST

Location:United Kingdom , London

Category:IT - Software Development

Contract Type:Not provided

Salary:

Job Description:

Job Responsibility:

Requirements:

Nice to have:

Additional Information:

Job Posted:March 13, 2026

Expiration:March 31, 2026

Looking for more opportunities? Search for other job offers that match your skills and interests.

Similar Jobs for Cloud Site Reliability Engineer

Senior Site Reliability Engineer

Senior Site Reliability Engineer

Senior Site Reliability Engineer

Principal Site Reliability Engineer

Senior Site Reliability Engineer

Staff Site Reliability Engineer

Site Reliability Engineering Manager

Cloud Security Site Reliability Engineer

Location:
United Kingdom , London

Category:
IT - Software Development

Contract Type:
Not provided

Job Posted:
March 13, 2026

Expiration:
March 31, 2026