CrawlJobs Logo

Site Reliability Engineer - SRE

balzac-paris.com Logo

Balzac Paris

Location Icon

Emplacement:
France , Sophia-Antipolis

Category Icon

Job Type Icon

Type de contrat:
Non fourni

Salary Icon

Salaire:

Non fourni
Enregistrer l'offre
Save Icon
Postuler

Description du poste:

Rattaché au responsable de l'équipe SRE (Site Reliability Engineering), vous gérez la production opérationnelle d'applications critiques en haute disponibilité. Vous assurez la gestion du quotidien de la production, des évolutions techniques et fonctionnelles, des incidents, et le reporting dans le respect des SLA. Enfin, vous vous intégrez dans une démarche d'anticipation et d'industrialisation des processus et outils.

Responsabilités:

  • Participer à la maintenance et l'évolution des plates-formes dans un contexte Kubernetes/Docker
  • Gérer différents environnements DC privé & Cloud
  • Sécuriser les plates-formes (Design, implémentation, configuration) et développer des outils ou adaptation de solutions en relation avec la production de services
  • Piloter et maintenir en condition opérationnelle les plates-formes en s'assurant de leur disponibilité et performance
  • Fournir une expertise technique sur les produits développés par DTS et fournir le support adéquat aux clients internes/externes
  • Fournir un support et une assistance continue aux clients ( Participation aux rotation d'astreintes 24/7)
  • Valider la mise en production des livrables au travers du développement, exécution et vérification de tests automatisés/unitaires/fonctionnels des logiciels critiques (“Smoke Test”)

Exigences:

  • Issu de formation supérieure, vous justifiez d'une expérience de 5 ans minimum dans le déploiement et les opérations en production de solutions digitales
  • Logiciels et outils de l'infrastructure UNIX
  • Bash
  • Architecture et principe réseau distribué
  • Processus de développement, test et déploiement logiciels
  • AWS
  • Git/Jenkins/Ansible/Saltstack
  • Docker/Kubernetes (certification CKA appréciée)
  • PKI/cryptographie/Certificats/HSM

Souhaitable:

  • Grafana / ELK
  • Java
  • SQL
  • Architecture API
  • Pratique ITIL/norme de sécurité SI (ISO 27K)
Ce que nous offrons:
  • Jours de bénévolat offerts
  • Prime de cooptation

Informations supplémentaires:

Offre publiée:
06 février 2026

Type d'emploi:
Temps plein
Partager le lien de l'offre:

Vous cherchez plus d'opportunités ? Recherchez d'autres offres d'emploi qui correspondent à vos compétences et à vos intérêts.

Briefcase Icon

Emplois similaires pour Site Reliability Engineer - SRE

Site Reliability Engineer

Chez Theodo GovTech, nous accompagnons nos clients - ministères, collectivités t...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 5 ans minimum d’expérience en SRE sur des environnements on-premise ou cloud privé
  • Excellente maîtrise des concepts DevOps et web complexes
  • Très bonnes bases en conteneurisation et orchestration
  • Solides compétences en réseaux et systèmes Linux
  • Capacité à concevoir et expliquer une architecture claire
  • Exigence forte sur la qualité, la lisibilité et la maintenabilité
  • Pragmatisme
  • Esprit d’équipe
  • Curiosité et envie de progresser
  • Humilité
Responsabilités
Responsabilités
  • Concevoir des architectures d’infrastructure adaptées à des contextes contraints (sécurité, souveraineté, performance)
  • Builder et déployer des infrastructures from scratch ou en refonte
  • Diffuser l’approche DevOps au cœur de l’équipe agile (rituels, cadrage, documentation)
  • Challenger les choix techniques pour optimiser coûts, performance et maintenabilité
  • Analyser les défauts et incidents pour renforcer la robustesse du système
  • Expliquer, documenter et rendre lisibles des décisions techniques complexes
  • Former l’équipe “en situation de travail” aux bonnes pratiques DevOps
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Aides et places en crèche réservées
  • Accompagnement par un coach interne
  • Participation à des projets associatifs grâce à la Fondation Theodo
  • Soirées mensuelles, keynotes et week-end d’entreprise annuel
  • Temps plein
Lire la suite
Arrow Right

Senior Site Reliability Engineer

Nous vivons une époque passionnante, où la technologie et la transformation digi...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
kbrw.com Logo
KBRW
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 7+ ans d’expérience en tant qu’administrateur système, SRE, Ops ou DevOps (un diplôme en informatique ou équivalent est un plus)
  • Solide expérience dans un environnement Linux et dans la gestion de serveurs bare metal
  • Aisance dans la gestion de conteneurs, en particulier LXC
  • Excellentes compétences en gestion réseau
  • Proactif(ve) et déterminé(e), avec une grande flexibilité d’esprit et un bon esprit d’équipe
  • Maîtrise du français et de l’anglais
Responsabilités
Responsabilités
  • Participer à la conception, la construction et le déploiement des futures évolutions de notre plateforme cloud et de notre infrastructure
  • Gérer notre cluster de serveurs, tout en participant à la gestion de la relation avec notre partenaire d’hébergement
  • Administrer notre plateforme cloud via notre stack Infrastructure as Code en constante amélioration
  • Mener des opérations afin de garantir la meilleure qualité de service possible
  • Travailler à l’amélioration continue de notre stack d’orchestration de conteneurs LXC et de réseau (VLAN, firewall, DNS, etc.)
  • Gérer l’infrastructure de sauvegarde pour soutenir notre plan de reprise après sinistre à grande échelle
  • Accompagner les utilisateurs de la plateforme cloud de Kbrw afin de leur permettre de tirer le meilleur parti de notre infrastructure et de les aider à surmonter leurs blocages
  • Collaborer avec les autres équipes Product & Engineering pour faire émerger les meilleures pratiques et améliorer notre offre produit à destination de nos clients
  • Gérer l'astreinte au moins une semaine par mois
Ce que nous offrons
Ce que nous offrons
  • Participation aux bénéfices en France
  • Possibilité de primes basées sur tes résultats
  • politique de télétravail flexible 12 jours de télétravail par mois
  • Ticket Restaurant avec Swile (9,5 € par jour)
  • Assurance santé privée fournie par AXA (100 % prise en charge par Kbrw)
  • Accès aux avantages Leeto : théâtre, opéra, clubs de sport, concerts, festivals, salons professionnels, etc.
  • Plan de développement personnel
  • Formation des managers
  • Un processus de management structuré et mature
  • Opportunités de croissance rapide
  • Temps plein
Lire la suite
Arrow Right

Senior Site Reliability Engineer

L’équipe SR Hornetsecurity gère une infrastructure critique métier, hautement so...
Emplacement
Emplacement
France , Hem
Salaire
Salaire:
Non fourni
hornetsecurity.com Logo
Hornetsecurity
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Capable de prendre des décisions
  • 5 à 10 ans d’expérience en administration Linux et environnements d’infrastructure
  • Maîtrise du français et de l’anglais
  • Maîtrise de Linux
  • Rigueur
  • Curiosité
  • Esprit d’équipe
  • Aisance relationnelle
  • Communication claire
  • Adaptabilité
Responsabilités
Responsabilités
  • Être le référent SRE pour une ou plusieurs équipes produit et aux comités de coordination technique
  • Traduire les besoins de fiabilité et de performance en fonctionnalités produit concrètes
  • Travailler directement avec les équipes métiers pour assurer la cohérence entre besoins fonctionnels et implémentations techniques
  • Être force d’évangélisation sur les bonnes pratiques SRE (performance, résilience, automatisation)
  • Définir, suivre et optimiser SLIs / SLOs / SLAs
  • Analyser les incidents (root cause analysis), mener les post-mortems et stimuler l’amélioration continue
  • Identifier proactivement les risques de fiabilité avant toute mise en production
  • Proposer et valider des évolutions d’architecture permettant de supporter une forte volumétrie d’utilisateurs et de serveurs
  • Documenter les architectures, runbooks et procédures et maintenir une documentation technique à jour
  • Automatiser les processus et aider à améliorer et faire évoluer les produits et outils nécessaires à l’activité
Ce que nous offrons
Ce que nous offrons
  • Statut: Cadre
  • Régime horaire: forfait heure
  • Congés: 5 semaines de congés légaux + RTT
  • Tickets restaurant: valeur du ticket 10€ (dont 5.92€ de participation par Hornetsecurity)
  • Prise en charge à 100 % des frais de transport en commun
  • Prévoyance & Mutuelle santé (Axa)
  • Avantages liés au sport et au bien-être (subvention)
  • Crêche interentreprise
  • Programme d’échange international
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer - Apprenticeship

The SRE Intern will join the Platform Team to discover and contribute to the inf...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Student in a Computer Science / Engineering program
  • Looking for a 5-to-6-month internship (convention de stage required)
  • Solid fundamentals in systems
  • Familiarity or curiosity about AWS, Kubernetes, Terraform/Terragrunt, ArgoCD, CircleCI, OpenTelemetry & Datadog, GNU/Linux systems like Debian
  • Comfortable or eager to learn: Working with Linux/Unix systems
  • Understanding distributed systems fundamentals and cloud architectures
  • Writing scripts (Bash, Python or equivalent) to automate tasks
  • Learning incident response practices and structured troubleshooting
  • Working in both French and English, in a hybrid/remote context
  • Strong problem-solving skills and a methodical approach to understanding how systems work
Responsabilités
Responsabilités
  • Participate alongside Development teams in infrastructure discussions, deployment processes, and operational requirements
  • Contribute to monitoring, alerting, and observability improvements (dashboards, alerts, log hygiene)
  • Write and review Terraform / Terragrunt modules under supervision, learning Infrastructure-as-Code best practices
  • Contribute to disaster recovery documentation and backup verification procedures
  • Shadow and progressively contribute to incident response efforts, learning root cause analysis methodology
  • Develop and improve runbooks and documentation for operational procedures
  • Help ensure proper logging and monitoring coverage across systems
  • Contribute to automation initiatives to reduce manual operations (scripts, tooling, pipeline improvements)
  • Learn and apply SRE practices (SLOs, error budgets, toil reduction) in day-to-day work
  • Work with development teams to understand and support operational readiness requirements
Ce que nous offrons
Ce que nous offrons
  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

L’équipe Run est composée de 7 personnes, intervenant sur de la réaction à incid...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • une solide formation académique en école d’ingénieur
  • une 1ère expérience professionnelle avec les technologies infra / Cloud, et notamment Kubernetes
  • de la rigueur et une bonne gestion du stress, afin d’être capable de réagir vite et intervenir sur des environnements en production
Responsabilités
Responsabilités
  • assurer la stabilité et la disponibilité des infrastructures de nos clients
  • Réagir aux incidents en production et mener des investigations en cas de problèmes techniques
  • Réaliser les post-mortem et assurer la communication avec le client
  • Répondre aux interrogations de nos clients et leur fournir des recommandations pour améliorer la qualité de leur infrastructure
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié pour être associé à la réussite du groupe
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle (SideCare) prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Gymlib
  • Aides et places en crèche réservées
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Sopra Steria subsidiary CS specializes in critical systems design, integration, ...
Emplacement
Emplacement
France , Le Plessis-Robinson
Salaire
Salaire:
Non fourni
https://www.soprasteria.com Logo
Sopra Steria
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 6 years of experience including 3 years in Azure/SRE
  • proficiency in Python
  • ability to design and execute Chaos Engineering scenarios
  • expertise in DevOps tools (Terraform, Ansible)
  • mastery of Azure Monitor
  • excellent oral communication skills
  • sense of service
  • ability to work in a team
  • proactive and autonomous.
Responsabilités
Responsabilités
  • Define and implement observability mechanisms (Azure Monitor, KQL, Application Insights, Log Analytics, Container Insights) and multi-level alerting
  • set up dashboards and SLI/SLO/SLA for proactive supervision
  • contribute to resilience efforts (backups/restorations, DRP, regular tests)
  • execute scenarios of Chaos Engineering
  • optimize incident management (runbooks, Status Page, Teams/Jira webhooks, post-mortem)
  • automate via Terraform, Ansible, and CI/CD pipelines
  • propose solutions using AIOps/GenAI (observability, remediation).
Ce que nous offrons
Ce que nous offrons
  • Enriching employee experience with flexibility, autonomy, and well-being
  • comprehensive onboarding program
  • academy for skill development and career growth
  • strong societal commitment supporting over 3000 associations
  • active disability and inclusion policy
  • inspiring diversity initiatives.
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

As our Site Reliability Engineer you are responsible for implementing and mainta...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
52000.00 - 65000.00 EUR / Année
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 4 years of infrastructure/systems engineering experience
  • Strong hands-on technical focus
  • Comfortable building and maintaining large-scale distributed systems
  • Comfortable managing incident response according to SLA
  • Comfortable implementing automation and self-healing systems
  • Comfortable developing utility scripts and functions
  • Fluent in French and English
  • Strong problem-solving skills
  • Reliability-focused
  • Excellent communication skills
Responsabilités
Responsabilités
  • Implement and maintain scalable infrastructure and systems
  • Ensure reliability, performance, and security of production environments
  • Bridge the gap between development and operations
  • Apply software engineering principles to infrastructure and operational challenges
  • Collaborate with Development teams, Security teams, and other stakeholders
  • Build and maintain robust systems
  • Implement automation
  • Support operational excellence through SLOs and observability
  • Contribute to incident management
  • Contribute to capacity planning
Ce que nous offrons
Ce que nous offrons
  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Stage de 6 mois. Nous recherchons un stagiaire SRE (Site Reliability Engineer) m...
Emplacement
Emplacement
France , Toulouse
Salaire
Salaire:
Non fourni
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Actuellement en formation dans le cadre d’une Licence, d’un Master ou équivalent
  • Connaissances de base en administration de systèmes Linux et en concept réseaux (TCP/IP, DNS, HTTP, répartition de charge/load balancing)
  • Bonne compréhension des concepts de conteneurs et d’orchestration (Docker, Kubernetes ou équivalent)
  • Bonne compréhension des principes de CI/CD (pipelines, tests automatisés, déploiements)
  • Capacités d’analyse, de résolution de problèmes et de troubleshooting
  • Intérêt pour les sujets Platform Engineering / SRE / DevOps (automatisation, fiabilité, observabilité, expérience développeur)
  • Niveau d’anglais professionnel (capacité à lire et rédiger de la documentation technique en anglais)
  • Bon esprit d’équipe, savoir communiquer et travailler en équipe
Responsabilités
Responsabilités
  • Étude et benchmark des Internal Developer Platforms
  • Conception de l’architecture d’une Internal Developer Platform
  • Implémentation d’une preuve de concept (PoC)
  • Documentation, transfert et recommandations
Ce que nous offrons
Ce que nous offrons
  • Travailler dans le centre-ville de Toulouse, avec des équipes à l’international
  • Développer votre potentiel en participant à des conférences, des événements (DevFest, French Tech…), des cours en ligne (Udemy), le FedEx Day : 24 heures d’innovation en équipe, ou encore la promotion interne
  • Profiter d’activités uniques de team building
  • Célébrer les réussites par des fêtes incroyables et des after-work au bar du coin à la moindre occasion
  • Être accueilli par un binôme pour assurer une transition en douceur dans notre environnement de travail
  • Avoir une mascotte : Viktor, un ours polaire de 2 mètres de haut qui veille sur nous
  • Entre 1-2 jours de télétravail
  • Restaurant d’entreprise / Cuisine pour les employés
  • RTT / Jour de repos
  • Temps plein
Lire la suite
Arrow Right