CrawlJobs Logo

Site Reliability Engineer

France, Paris 52000.00 - 65000.00 EUR / Année · Offre publiée 24 décembre 2025
Postuler
Partager le lien de l'offre

Description du poste

As our Site Reliability Engineer you are responsible for implementing and maintaining scalable infrastructure and systems that ensure the reliability, performance, and security of our production environments. This hands-on position bridges the gap between development and operations, applying software engineering principles to infrastructure and operational challenges. This role involves close collaboration with Development teams, Security teams, and other stakeholders to build and maintain robust systems, implement automation, and support operational excellence through SLOs (Service Level Objectives) and observability. Additionally, you will contribute to incident management, capacity planning, and implementing infrastructure as code practices across the organization. You will report to the Platform Engineering Manager and you are integrated within the Platform Team.

Responsabilités

  • Implement and maintain scalable infrastructure and systems
  • Ensure reliability, performance, and security of production environments
  • Bridge the gap between development and operations
  • Apply software engineering principles to infrastructure and operational challenges
  • Collaborate with Development teams, Security teams, and other stakeholders
  • Build and maintain robust systems
  • Implement automation
  • Support operational excellence through SLOs and observability
  • Contribute to incident management
  • Contribute to capacity planning
  • Implement infrastructure as code practices
  • Report to the Platform Engineering Manager
  • Integrated within the Platform Team
  • Technical Leadership & System Design: Collaborate with Development teams on infrastructure architecture, deployment strategies, and operational requirements
  • Design and implement monitoring, alerting, and observability solutions
  • Contribute to infrastructure as code initiatives and maintain deployment automation pipelines
  • Implement security best practices in context and maintain compliance requirements
  • Design and maintain disaster recovery and backup strategies
  • Operational Excellence & Process Implementation: Contribute to incident response efforts and drive resolution of technical issues
  • Develop and maintain runbooks and documentation for operational procedures
  • Ensure proper logging and monitoring across all systems
  • Increase automation initiatives to reduce manual operations
  • Maintain and improve SRE practices across the organization
  • Cross-team Collaboration & Knowledge Sharing: Work with development teams to implement operational readiness requirements
  • Collaborate with Security teams on infrastructure security measures
  • Provide technical mentorship to developers on operational practices
  • Lead knowledge sharing sessions and documentation efforts
  • Partner with Engineering Managers to improve development workflows and tools

Exigences

  • At least 4 years of infrastructure/systems engineering experience
  • Strong hands-on technical focus
  • Comfortable building and maintaining large-scale distributed systems
  • Comfortable managing incident response according to SLA
  • Comfortable implementing automation and self-healing systems
  • Comfortable developing utility scripts and functions
  • Fluent in French and English
  • Strong problem-solving skills
  • Reliability-focused
  • Excellent communication skills
  • Experience with tech stack (Ruby, Elixir, React.js) is a significant advantage

Souhaitable

Experience with Ruby, Elixir, React.js

Ce que nous offrons

  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)

Looking for more opportunities?

Search for other job offers that match your skills and interests.

Emplois similaires pour

Site Reliability Engineer

8 matching positions

Site Reliability Engineer

Nous recherchons un Ingénieur Site Reliability Engineer afin d'assurer un haut n...
Emplacement
Emplacement
France , Sophia-Antipolis
Salaire
Salaire:
Non fourni
balzac-paris.com Logo
Balzac Paris
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Formation Ingénieur ou équivalent
  • Au moins 5 ans d'expérience en tant que SRE
  • Compétences en développement Java requises
  • Vous êtes familier avec le Cloud Public (GCP, AWS), les conteneurs et microservices (Docker, Kubernetes, Java), CI/CD et automatisation (Jenkins, GitLab, Helm), bases de données NoSQL
  • Vous êtes fluent en anglais
Responsabilités
Responsabilités
  • Automatisation & Infrastructure as Code
  • Disponibilité & Ingénierie de la Fiabilité
  • Gestion des Incidents & Support en Astreinte
  • Performance & Planification de la Capacité
  • Observabilité & Monitoring
  • Amélioration Continue & Postmortems
  • Sécurité & Conformité
  • Support de la relation client
  • Interface avec d’autres parties prenantes pour définir un plan d’amélioration de la solution
  • Vous aurez la responsabilité de la disponibilité du service de la solution
Ce que nous offrons
Ce que nous offrons
  • Package de rémunération attractif
  • Développement des compétences en continu
  • Environnement inclusif, bienveillant et respectant l’équilibre des collaborateurs
  • Engagement sociétal et environnemental reconnu
  • Horaires de travail flexibles
  • Subventions CSE (Sport, Culture,...)
  • Congés pour enfant malade
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

L’équipe Run est composée de 7 personnes, intervenant sur de la réaction à incid...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • une solide formation académique en école d’ingénieur
  • une 1ère expérience professionnelle avec les technologies infra / Cloud, et notamment Kubernetes
  • de la rigueur et une bonne gestion du stress, afin d’être capable de réagir vite et intervenir sur des environnements en production
Responsabilités
Responsabilités
  • assurer la stabilité et la disponibilité des infrastructures de nos clients
  • Réagir aux incidents en production et mener des investigations en cas de problèmes techniques
  • Réaliser les post-mortem et assurer la communication avec le client
  • Répondre aux interrogations de nos clients et leur fournir des recommandations pour améliorer la qualité de leur infrastructure
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié pour être associé à la réussite du groupe
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle (SideCare) prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Gymlib
  • Aides et places en crèche réservées
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Chez Theodo GovTech, nous accompagnons nos clients - ministères, collectivités t...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 5 ans minimum d’expérience en SRE sur des environnements on-premise ou cloud privé
  • Excellente maîtrise des concepts DevOps et web complexes
  • Très bonnes bases en conteneurisation et orchestration
  • Solides compétences en réseaux et systèmes Linux
  • Capacité à concevoir et expliquer une architecture claire
  • Exigence forte sur la qualité, la lisibilité et la maintenabilité
  • Pragmatisme
  • Esprit d’équipe
  • Curiosité et envie de progresser
  • Humilité
Responsabilités
Responsabilités
  • Concevoir des architectures d’infrastructure adaptées à des contextes contraints (sécurité, souveraineté, performance)
  • Builder et déployer des infrastructures from scratch ou en refonte
  • Diffuser l’approche DevOps au cœur de l’équipe agile (rituels, cadrage, documentation)
  • Challenger les choix techniques pour optimiser coûts, performance et maintenabilité
  • Analyser les défauts et incidents pour renforcer la robustesse du système
  • Expliquer, documenter et rendre lisibles des décisions techniques complexes
  • Former l’équipe “en situation de travail” aux bonnes pratiques DevOps
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Aides et places en crèche réservées
  • Accompagnement par un coach interne
  • Participation à des projets associatifs grâce à la Fondation Theodo
  • Soirées mensuelles, keynotes et week-end d’entreprise annuel
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Delair, leader mondial du drone professionnel, fournit des données basées sur l’...
Emplacement
Emplacement
France , Toulouse
Salaire
Salaire:
Non fourni
delair.aero Logo
Delair
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • De formation BAC+5 école d'ingénieur ou Universités, vous avez idéalement un profil Devops
  • Maitrise du Cloud, idéalement Google Cloud Plateforme, si pas possible, à minima avoir une expérience sur du Cloud comme AWS
  • Connaissance des "best practices" sur la sécurité
  • Maitrise de l'outil Terraform et GitLab
  • Pédagogue avec les utilisateurs, souvent des personnes de l'IT
  • Curieux(se)
  • Esprit d'équipe et sociable
  • Sens du service aux utilisateurs
Responsabilités
Responsabilités
  • Gestion et définition de l'architecture du Cloud Delair
  • Modes principalement Projet (gros de l'activité) et Run (dépannage, administration quotidienne...)
  • Monitoring de l'infrastructure Cloud : outils de monitoring à mettre en place
  • Maintien de projets dans le GitLab en rapport avec le Cloud (écriture de CI GitLab)
  • Gestion de la sécurité des applications déployées sur le Cloud
Ce que nous offrons
Ce que nous offrons
  • Tickets restaurants Swile
  • Mutuelle familiale
  • Forfait Mobilité durable (rémunération du trajet domicile/bureau en vélo)
  • Café, thé et fruits gratuits en libre service
  • Associations sportives entre midi et deux
  • Team Building et Workshop
  • Et de nombreux événements de cohésion interne : week-end corpo, barbecue tous les vendredis durant l'été, after work, Family Day, etc.
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Sopra Steria subsidiary CS specializes in critical systems design, integration, ...
Emplacement
Emplacement
France , Le Plessis-Robinson
Salaire
Salaire:
Non fourni
https://www.soprasteria.com Logo
Sopra Steria
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 6 years of experience including 3 years in Azure/SRE
  • proficiency in Python
  • ability to design and execute Chaos Engineering scenarios
  • expertise in DevOps tools (Terraform, Ansible)
  • mastery of Azure Monitor
  • excellent oral communication skills
  • sense of service
  • ability to work in a team
  • proactive and autonomous.
Responsabilités
Responsabilités
  • Define and implement observability mechanisms (Azure Monitor, KQL, Application Insights, Log Analytics, Container Insights) and multi-level alerting
  • set up dashboards and SLI/SLO/SLA for proactive supervision
  • contribute to resilience efforts (backups/restorations, DRP, regular tests)
  • execute scenarios of Chaos Engineering
  • optimize incident management (runbooks, Status Page, Teams/Jira webhooks, post-mortem)
  • automate via Terraform, Ansible, and CI/CD pipelines
  • propose solutions using AIOps/GenAI (observability, remediation).
Ce que nous offrons
Ce que nous offrons
  • Enriching employee experience with flexibility, autonomy, and well-being
  • comprehensive onboarding program
  • academy for skill development and career growth
  • strong societal commitment supporting over 3000 associations
  • active disability and inclusion policy
  • inspiring diversity initiatives.
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Stage de 6 mois. Nous recherchons un stagiaire SRE (Site Reliability Engineer) m...
Emplacement
Emplacement
France , Toulouse
Salaire
Salaire:
Non fourni
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Actuellement en formation dans le cadre d’une Licence, d’un Master ou équivalent
  • Connaissances de base en administration de systèmes Linux et en concept réseaux (TCP/IP, DNS, HTTP, répartition de charge/load balancing)
  • Bonne compréhension des concepts de conteneurs et d’orchestration (Docker, Kubernetes ou équivalent)
  • Bonne compréhension des principes de CI/CD (pipelines, tests automatisés, déploiements)
  • Capacités d’analyse, de résolution de problèmes et de troubleshooting
  • Intérêt pour les sujets Platform Engineering / SRE / DevOps (automatisation, fiabilité, observabilité, expérience développeur)
  • Niveau d’anglais professionnel (capacité à lire et rédiger de la documentation technique en anglais)
  • Bon esprit d’équipe, savoir communiquer et travailler en équipe
Responsabilités
Responsabilités
  • Étude et benchmark des Internal Developer Platforms
  • Conception de l’architecture d’une Internal Developer Platform
  • Implémentation d’une preuve de concept (PoC)
  • Documentation, transfert et recommandations
Ce que nous offrons
Ce que nous offrons
  • Travailler dans le centre-ville de Toulouse, avec des équipes à l’international
  • Développer votre potentiel en participant à des conférences, des événements (DevFest, French Tech…), des cours en ligne (Udemy), le FedEx Day : 24 heures d’innovation en équipe, ou encore la promotion interne
  • Profiter d’activités uniques de team building
  • Célébrer les réussites par des fêtes incroyables et des after-work au bar du coin à la moindre occasion
  • Être accueilli par un binôme pour assurer une transition en douceur dans notre environnement de travail
  • Avoir une mascotte : Viktor, un ours polaire de 2 mètres de haut qui veille sur nous
  • Entre 1-2 jours de télétravail
  • Restaurant d’entreprise / Cuisine pour les employés
  • RTT / Jour de repos
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer (SRE) – GCP

Emplacement
Emplacement
France , Massy
Salaire
Salaire:
Non fourni
cyclad.pl Logo
Cyclad Sp. z o.o.
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Expérience significative en SRE ou DevOps
  • Excellente maîtrise de GCP
  • Bonne connaissance de Kubernetes et Terraform
  • Culture automatisation, fiabilité et amélioration continue
Responsabilités
Responsabilités
  • Garantir la disponibilité et la performance des plateformes cloud
  • Automatiser les déploiements et les opérations
  • Améliorer la fiabilité et l'observabilité des services
  • Participer à l'industrialisation des infrastructures
  • Collaborer avec les équipes DevOps, Cloud et Développement4
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer - Apprenticeship

The SRE Intern will join the Platform Team to discover and contribute to the inf...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Student in a Computer Science / Engineering program
  • Looking for a 5-to-6-month internship (convention de stage required)
  • Solid fundamentals in systems
  • Familiarity or curiosity about AWS, Kubernetes, Terraform/Terragrunt, ArgoCD, CircleCI, OpenTelemetry & Datadog, GNU/Linux systems like Debian
  • Comfortable or eager to learn: Working with Linux/Unix systems
  • Understanding distributed systems fundamentals and cloud architectures
  • Writing scripts (Bash, Python or equivalent) to automate tasks
  • Learning incident response practices and structured troubleshooting
  • Working in both French and English, in a hybrid/remote context
  • Strong problem-solving skills and a methodical approach to understanding how systems work
Responsabilités
Responsabilités
  • Participate alongside Development teams in infrastructure discussions, deployment processes, and operational requirements
  • Contribute to monitoring, alerting, and observability improvements (dashboards, alerts, log hygiene)
  • Write and review Terraform / Terragrunt modules under supervision, learning Infrastructure-as-Code best practices
  • Contribute to disaster recovery documentation and backup verification procedures
  • Shadow and progressively contribute to incident response efforts, learning root cause analysis methodology
  • Develop and improve runbooks and documentation for operational procedures
  • Help ensure proper logging and monitoring coverage across systems
  • Contribute to automation initiatives to reduce manual operations (scripts, tooling, pipeline improvements)
  • Learn and apply SRE practices (SLOs, error budgets, toil reduction) in day-to-day work
  • Work with development teams to understand and support operational readiness requirements
Ce que nous offrons
Ce que nous offrons
  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)
  • Temps plein
Lire la suite
Arrow Right