CrawlJobs Logo

Site Reliability Engineer

theodo.co.uk Logo

Theodo

Location Icon

Emplacement:
France , Paris

Category Icon

Job Type Icon

Type de contrat:
Non fourni

Salary Icon

Salaire:

Non fourni
Enregistrer l'offre
Save Icon
Postuler

Description du poste:

L’équipe Run est composée de 7 personnes, intervenant sur de la réaction à incident, du maintien en conditions opérationnelles des infrastructures et des optimisations. Ce poste est idéal pour les personnes qui sont curieuses et souhaitent progresser vite : il offre l’opportunité de travailler sur un large panel d’infrastructures et d’outils. C’est l’assurance de ne jamais s’ennuyer et d’avoir à résoudre des bugs complexes en production.

Responsabilités:

  • assurer la stabilité et la disponibilité des infrastructures de nos clients
  • Réagir aux incidents en production et mener des investigations en cas de problèmes techniques
  • Réaliser les post-mortem et assurer la communication avec le client
  • Répondre aux interrogations de nos clients et leur fournir des recommandations pour améliorer la qualité de leur infrastructure

Exigences:

  • une solide formation académique en école d’ingénieur
  • une 1ère expérience professionnelle avec les technologies infra / Cloud, et notamment Kubernetes
  • de la rigueur et une bonne gestion du stress, afin d’être capable de réagir vite et intervenir sur des environnements en production
Ce que nous offrons:
  • Actionnariat salarié pour être associé à la réussite du groupe
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle (SideCare) prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Gymlib
  • Aides et places en crèche réservées

Informations supplémentaires:

Offre publiée:
18 février 2026

Type d'emploi:
Temps plein
Type de travail:
Travail hybride
Partager le lien de l'offre:

Vous cherchez plus d'opportunités ? Recherchez d'autres offres d'emploi qui correspondent à vos compétences et à vos intérêts.

Briefcase Icon

Emplois similaires pour Site Reliability Engineer

Nouveau

Site Reliability Engineer

Chez Theodo GovTech, nous accompagnons nos clients - ministères, collectivités t...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 5 ans minimum d’expérience en SRE sur des environnements on-premise ou cloud privé
  • Excellente maîtrise des concepts DevOps et web complexes
  • Très bonnes bases en conteneurisation et orchestration
  • Solides compétences en réseaux et systèmes Linux
  • Capacité à concevoir et expliquer une architecture claire
  • Exigence forte sur la qualité, la lisibilité et la maintenabilité
  • Pragmatisme
  • Esprit d’équipe
  • Curiosité et envie de progresser
  • Humilité
Responsabilités
Responsabilités
  • Concevoir des architectures d’infrastructure adaptées à des contextes contraints (sécurité, souveraineté, performance)
  • Builder et déployer des infrastructures from scratch ou en refonte
  • Diffuser l’approche DevOps au cœur de l’équipe agile (rituels, cadrage, documentation)
  • Challenger les choix techniques pour optimiser coûts, performance et maintenabilité
  • Analyser les défauts et incidents pour renforcer la robustesse du système
  • Expliquer, documenter et rendre lisibles des décisions techniques complexes
  • Former l’équipe “en situation de travail” aux bonnes pratiques DevOps
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Aides et places en crèche réservées
  • Accompagnement par un coach interne
  • Participation à des projets associatifs grâce à la Fondation Theodo
  • Soirées mensuelles, keynotes et week-end d’entreprise annuel
  • Temps plein
Lire la suite
Arrow Right
Nouveau

Site Reliability Engineer

Delair, leader mondial du drone professionnel, fournit des données basées sur l’...
Emplacement
Emplacement
France , Toulouse
Salaire
Salaire:
Non fourni
delair.aero Logo
Delair
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • De formation BAC+5 école d'ingénieur ou Universités, vous avez idéalement un profil Devops
  • Maitrise du Cloud, idéalement Google Cloud Plateforme, si pas possible, à minima avoir une expérience sur du Cloud comme AWS
  • Connaissance des "best practices" sur la sécurité
  • Maitrise de l'outil Terraform et GitLab
  • Pédagogue avec les utilisateurs, souvent des personnes de l'IT
  • Curieux(se)
  • Esprit d'équipe et sociable
  • Sens du service aux utilisateurs
Responsabilités
Responsabilités
  • Gestion et définition de l'architecture du Cloud Delair
  • Modes principalement Projet (gros de l'activité) et Run (dépannage, administration quotidienne...)
  • Monitoring de l'infrastructure Cloud : outils de monitoring à mettre en place
  • Maintien de projets dans le GitLab en rapport avec le Cloud (écriture de CI GitLab)
  • Gestion de la sécurité des applications déployées sur le Cloud
Ce que nous offrons
Ce que nous offrons
  • Tickets restaurants Swile
  • Mutuelle familiale
  • Forfait Mobilité durable (rémunération du trajet domicile/bureau en vélo)
  • Café, thé et fruits gratuits en libre service
  • Associations sportives entre midi et deux
  • Team Building et Workshop
  • Et de nombreux événements de cohésion interne : week-end corpo, barbecue tous les vendredis durant l'été, after work, Family Day, etc.
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer - SRE

Rattaché au responsable de l'équipe SRE (Site Reliability Engineering), vous gér...
Emplacement
Emplacement
France , Sophia-Antipolis
Salaire
Salaire:
Non fourni
balzac-paris.com Logo
Balzac Paris
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Issu de formation supérieure, vous justifiez d'une expérience de 5 ans minimum dans le déploiement et les opérations en production de solutions digitales
  • Logiciels et outils de l'infrastructure UNIX
  • Bash
  • Architecture et principe réseau distribué
  • Processus de développement, test et déploiement logiciels
  • AWS
  • Git/Jenkins/Ansible/Saltstack
  • Docker/Kubernetes (certification CKA appréciée)
  • PKI/cryptographie/Certificats/HSM
Responsabilités
Responsabilités
  • Participer à la maintenance et l'évolution des plates-formes dans un contexte Kubernetes/Docker
  • Gérer différents environnements DC privé & Cloud
  • Sécuriser les plates-formes (Design, implémentation, configuration) et développer des outils ou adaptation de solutions en relation avec la production de services
  • Piloter et maintenir en condition opérationnelle les plates-formes en s'assurant de leur disponibilité et performance
  • Fournir une expertise technique sur les produits développés par DTS et fournir le support adéquat aux clients internes/externes
  • Fournir un support et une assistance continue aux clients ( Participation aux rotation d'astreintes 24/7)
  • Valider la mise en production des livrables au travers du développement, exécution et vérification de tests automatisés/unitaires/fonctionnels des logiciels critiques (“Smoke Test”)
Ce que nous offrons
Ce que nous offrons
  • Jours de bénévolat offerts
  • Prime de cooptation
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Sopra Steria subsidiary CS specializes in critical systems design, integration, ...
Emplacement
Emplacement
France , Le Plessis-Robinson
Salaire
Salaire:
Non fourni
https://www.soprasteria.com Logo
Sopra Steria
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 6 years of experience including 3 years in Azure/SRE
  • proficiency in Python
  • ability to design and execute Chaos Engineering scenarios
  • expertise in DevOps tools (Terraform, Ansible)
  • mastery of Azure Monitor
  • excellent oral communication skills
  • sense of service
  • ability to work in a team
  • proactive and autonomous.
Responsabilités
Responsabilités
  • Define and implement observability mechanisms (Azure Monitor, KQL, Application Insights, Log Analytics, Container Insights) and multi-level alerting
  • set up dashboards and SLI/SLO/SLA for proactive supervision
  • contribute to resilience efforts (backups/restorations, DRP, regular tests)
  • execute scenarios of Chaos Engineering
  • optimize incident management (runbooks, Status Page, Teams/Jira webhooks, post-mortem)
  • automate via Terraform, Ansible, and CI/CD pipelines
  • propose solutions using AIOps/GenAI (observability, remediation).
Ce que nous offrons
Ce que nous offrons
  • Enriching employee experience with flexibility, autonomy, and well-being
  • comprehensive onboarding program
  • academy for skill development and career growth
  • strong societal commitment supporting over 3000 associations
  • active disability and inclusion policy
  • inspiring diversity initiatives.
  • Temps plein
Lire la suite
Arrow Right

Senior Site Reliability Engineer

Nous vivons une époque passionnante, où la technologie et la transformation digi...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
kbrw.com Logo
KBRW
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 7+ ans d’expérience en tant qu’administrateur système, SRE, Ops ou DevOps (un diplôme en informatique ou équivalent est un plus)
  • Solide expérience dans un environnement Linux et dans la gestion de serveurs bare metal
  • Aisance dans la gestion de conteneurs, en particulier LXC
  • Excellentes compétences en gestion réseau
  • Proactif(ve) et déterminé(e), avec une grande flexibilité d’esprit et un bon esprit d’équipe
  • Maîtrise du français et de l’anglais
Responsabilités
Responsabilités
  • Participer à la conception, la construction et le déploiement des futures évolutions de notre plateforme cloud et de notre infrastructure
  • Gérer notre cluster de serveurs, tout en participant à la gestion de la relation avec notre partenaire d’hébergement
  • Administrer notre plateforme cloud via notre stack Infrastructure as Code en constante amélioration
  • Mener des opérations afin de garantir la meilleure qualité de service possible
  • Travailler à l’amélioration continue de notre stack d’orchestration de conteneurs LXC et de réseau (VLAN, firewall, DNS, etc.)
  • Gérer l’infrastructure de sauvegarde pour soutenir notre plan de reprise après sinistre à grande échelle
  • Accompagner les utilisateurs de la plateforme cloud de Kbrw afin de leur permettre de tirer le meilleur parti de notre infrastructure et de les aider à surmonter leurs blocages
  • Collaborer avec les autres équipes Product & Engineering pour faire émerger les meilleures pratiques et améliorer notre offre produit à destination de nos clients
  • Gérer l'astreinte au moins une semaine par mois
Ce que nous offrons
Ce que nous offrons
  • Participation aux bénéfices en France
  • Possibilité de primes basées sur tes résultats
  • politique de télétravail flexible 12 jours de télétravail par mois
  • Ticket Restaurant avec Swile (9,5 € par jour)
  • Assurance santé privée fournie par AXA (100 % prise en charge par Kbrw)
  • Accès aux avantages Leeto : théâtre, opéra, clubs de sport, concerts, festivals, salons professionnels, etc.
  • Plan de développement personnel
  • Formation des managers
  • Un processus de management structuré et mature
  • Opportunités de croissance rapide
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

As our Site Reliability Engineer you are responsible for implementing and mainta...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
52000.00 - 65000.00 EUR / Année
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 4 years of infrastructure/systems engineering experience
  • Strong hands-on technical focus
  • Comfortable building and maintaining large-scale distributed systems
  • Comfortable managing incident response according to SLA
  • Comfortable implementing automation and self-healing systems
  • Comfortable developing utility scripts and functions
  • Fluent in French and English
  • Strong problem-solving skills
  • Reliability-focused
  • Excellent communication skills
Responsabilités
Responsabilités
  • Implement and maintain scalable infrastructure and systems
  • Ensure reliability, performance, and security of production environments
  • Bridge the gap between development and operations
  • Apply software engineering principles to infrastructure and operational challenges
  • Collaborate with Development teams, Security teams, and other stakeholders
  • Build and maintain robust systems
  • Implement automation
  • Support operational excellence through SLOs and observability
  • Contribute to incident management
  • Contribute to capacity planning
Ce que nous offrons
Ce que nous offrons
  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)
  • Temps plein
Lire la suite
Arrow Right

Senior Site Reliability Engineer

L’équipe SR Hornetsecurity gère une infrastructure critique métier, hautement so...
Emplacement
Emplacement
France , Hem
Salaire
Salaire:
Non fourni
hornetsecurity.com Logo
Hornetsecurity
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Capable de prendre des décisions
  • 5 à 10 ans d’expérience en administration Linux et environnements d’infrastructure
  • Maîtrise du français et de l’anglais
  • Maîtrise de Linux
  • Rigueur
  • Curiosité
  • Esprit d’équipe
  • Aisance relationnelle
  • Communication claire
  • Adaptabilité
Responsabilités
Responsabilités
  • Être le référent SRE pour une ou plusieurs équipes produit et aux comités de coordination technique
  • Traduire les besoins de fiabilité et de performance en fonctionnalités produit concrètes
  • Travailler directement avec les équipes métiers pour assurer la cohérence entre besoins fonctionnels et implémentations techniques
  • Être force d’évangélisation sur les bonnes pratiques SRE (performance, résilience, automatisation)
  • Définir, suivre et optimiser SLIs / SLOs / SLAs
  • Analyser les incidents (root cause analysis), mener les post-mortems et stimuler l’amélioration continue
  • Identifier proactivement les risques de fiabilité avant toute mise en production
  • Proposer et valider des évolutions d’architecture permettant de supporter une forte volumétrie d’utilisateurs et de serveurs
  • Documenter les architectures, runbooks et procédures et maintenir une documentation technique à jour
  • Automatiser les processus et aider à améliorer et faire évoluer les produits et outils nécessaires à l’activité
Ce que nous offrons
Ce que nous offrons
  • Statut: Cadre
  • Régime horaire: forfait heure
  • Congés: 5 semaines de congés légaux + RTT
  • Tickets restaurant: valeur du ticket 10€ (dont 5.92€ de participation par Hornetsecurity)
  • Prise en charge à 100 % des frais de transport en commun
  • Prévoyance & Mutuelle santé (Axa)
  • Avantages liés au sport et au bien-être (subvention)
  • Crêche interentreprise
  • Programme d’échange international
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Stage de 6 mois. Nous recherchons un stagiaire SRE (Site Reliability Engineer) m...
Emplacement
Emplacement
France , Toulouse
Salaire
Salaire:
Non fourni
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Actuellement en formation dans le cadre d’une Licence, d’un Master ou équivalent
  • Connaissances de base en administration de systèmes Linux et en concept réseaux (TCP/IP, DNS, HTTP, répartition de charge/load balancing)
  • Bonne compréhension des concepts de conteneurs et d’orchestration (Docker, Kubernetes ou équivalent)
  • Bonne compréhension des principes de CI/CD (pipelines, tests automatisés, déploiements)
  • Capacités d’analyse, de résolution de problèmes et de troubleshooting
  • Intérêt pour les sujets Platform Engineering / SRE / DevOps (automatisation, fiabilité, observabilité, expérience développeur)
  • Niveau d’anglais professionnel (capacité à lire et rédiger de la documentation technique en anglais)
  • Bon esprit d’équipe, savoir communiquer et travailler en équipe
Responsabilités
Responsabilités
  • Étude et benchmark des Internal Developer Platforms
  • Conception de l’architecture d’une Internal Developer Platform
  • Implémentation d’une preuve de concept (PoC)
  • Documentation, transfert et recommandations
Ce que nous offrons
Ce que nous offrons
  • Travailler dans le centre-ville de Toulouse, avec des équipes à l’international
  • Développer votre potentiel en participant à des conférences, des événements (DevFest, French Tech…), des cours en ligne (Udemy), le FedEx Day : 24 heures d’innovation en équipe, ou encore la promotion interne
  • Profiter d’activités uniques de team building
  • Célébrer les réussites par des fêtes incroyables et des after-work au bar du coin à la moindre occasion
  • Être accueilli par un binôme pour assurer une transition en douceur dans notre environnement de travail
  • Avoir une mascotte : Viktor, un ours polaire de 2 mètres de haut qui veille sur nous
  • Entre 1-2 jours de télétravail
  • Restaurant d’entreprise / Cuisine pour les employés
  • RTT / Jour de repos
  • Temps plein
Lire la suite
Arrow Right