CrawlJobs Logo

Site Reliability Engineer

beamy.io Logo

Beamy

Location Icon

Emplacement:
France , Toulouse

Category Icon

Job Type Icon

Type de contrat:
Non fourni

Salary Icon

Salaire:

Non fourni
Enregistrer l'offre
Save Icon
Postuler

Description du poste:

Stage de 6 mois. Nous recherchons un stagiaire SRE (Site Reliability Engineer) motivé et curieux techniquement pour nous aider à étudier, concevoir et mettre en œuvre une première itération d’une plateforme interne pour développeurs (Internal Developer Platform – IDP). Ce stage est une excellente opportunité d’acquérir une expérience pratique en Site Reliability Engineering et de découvrir les pratiques modernes de platform engineering dans un environnement cloud‑native. Vous travaillerez en étroite collaboration avec les équipes SRE et les équipes de développement pour explorer différentes architectures possibles, évaluer des outils et construire une première version fonctionnelle de notre Internal Developer Platform.

Responsabilités:

  • Étude et benchmark des Internal Developer Platforms
  • Conception de l’architecture d’une Internal Developer Platform
  • Implémentation d’une preuve de concept (PoC)
  • Documentation, transfert et recommandations

Exigences:

  • Actuellement en formation dans le cadre d’une Licence, d’un Master ou équivalent
  • Connaissances de base en administration de systèmes Linux et en concept réseaux (TCP/IP, DNS, HTTP, répartition de charge/load balancing)
  • Bonne compréhension des concepts de conteneurs et d’orchestration (Docker, Kubernetes ou équivalent)
  • Bonne compréhension des principes de CI/CD (pipelines, tests automatisés, déploiements)
  • Capacités d’analyse, de résolution de problèmes et de troubleshooting
  • Intérêt pour les sujets Platform Engineering / SRE / DevOps (automatisation, fiabilité, observabilité, expérience développeur)
  • Niveau d’anglais professionnel (capacité à lire et rédiger de la documentation technique en anglais)
  • Bon esprit d’équipe, savoir communiquer et travailler en équipe

Souhaitable:

  • Expérience avec au moins un fournisseur de cloud public (AWS, GCP, Azure, etc.)
  • Expérience avec des outils d’infrastructure as code (Terraform, Ansible, Helm, etc.)
  • Expérience avec des outils de monitoring / logging
  • Connaissance du développement logiciel dans au moins un langage (Python, Go, Java, JavaScript/TypeScript, etc.)
  • Première exposition aux pratiques SRE / DevOps (dans un projet scolaire ou un projet personnel)
Ce que nous offrons:
  • Travailler dans le centre-ville de Toulouse, avec des équipes à l’international
  • Développer votre potentiel en participant à des conférences, des événements (DevFest, French Tech…), des cours en ligne (Udemy), le FedEx Day : 24 heures d’innovation en équipe, ou encore la promotion interne
  • Profiter d’activités uniques de team building
  • Célébrer les réussites par des fêtes incroyables et des after-work au bar du coin à la moindre occasion
  • Être accueilli par un binôme pour assurer une transition en douceur dans notre environnement de travail
  • Avoir une mascotte : Viktor, un ours polaire de 2 mètres de haut qui veille sur nous
  • Entre 1-2 jours de télétravail
  • Restaurant d’entreprise / Cuisine pour les employés
  • RTT / Jour de repos

Informations supplémentaires:

Offre publiée:
19 janvier 2026

Type d'emploi:
Temps plein
Type de travail:
Travail sur site
Partager le lien de l'offre:

Vous cherchez plus d'opportunités ? Recherchez d'autres offres d'emploi qui correspondent à vos compétences et à vos intérêts.

Briefcase Icon

Emplois similaires pour Site Reliability Engineer

Nouveau

Site Reliability Engineer - Apprenticeship

The SRE Intern will join the Platform Team to discover and contribute to the inf...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Student in a Computer Science / Engineering program
  • Looking for a 5-to-6-month internship (convention de stage required)
  • Solid fundamentals in systems
  • Familiarity or curiosity about AWS, Kubernetes, Terraform/Terragrunt, ArgoCD, CircleCI, OpenTelemetry & Datadog, GNU/Linux systems like Debian
  • Comfortable or eager to learn: Working with Linux/Unix systems
  • Understanding distributed systems fundamentals and cloud architectures
  • Writing scripts (Bash, Python or equivalent) to automate tasks
  • Learning incident response practices and structured troubleshooting
  • Working in both French and English, in a hybrid/remote context
  • Strong problem-solving skills and a methodical approach to understanding how systems work
Responsabilités
Responsabilités
  • Participate alongside Development teams in infrastructure discussions, deployment processes, and operational requirements
  • Contribute to monitoring, alerting, and observability improvements (dashboards, alerts, log hygiene)
  • Write and review Terraform / Terragrunt modules under supervision, learning Infrastructure-as-Code best practices
  • Contribute to disaster recovery documentation and backup verification procedures
  • Shadow and progressively contribute to incident response efforts, learning root cause analysis methodology
  • Develop and improve runbooks and documentation for operational procedures
  • Help ensure proper logging and monitoring coverage across systems
  • Contribute to automation initiatives to reduce manual operations (scripts, tooling, pipeline improvements)
  • Learn and apply SRE practices (SLOs, error budgets, toil reduction) in day-to-day work
  • Work with development teams to understand and support operational readiness requirements
Ce que nous offrons
Ce que nous offrons
  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

L’équipe Run est composée de 7 personnes, intervenant sur de la réaction à incid...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • une solide formation académique en école d’ingénieur
  • une 1ère expérience professionnelle avec les technologies infra / Cloud, et notamment Kubernetes
  • de la rigueur et une bonne gestion du stress, afin d’être capable de réagir vite et intervenir sur des environnements en production
Responsabilités
Responsabilités
  • assurer la stabilité et la disponibilité des infrastructures de nos clients
  • Réagir aux incidents en production et mener des investigations en cas de problèmes techniques
  • Réaliser les post-mortem et assurer la communication avec le client
  • Répondre aux interrogations de nos clients et leur fournir des recommandations pour améliorer la qualité de leur infrastructure
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié pour être associé à la réussite du groupe
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle (SideCare) prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Gymlib
  • Aides et places en crèche réservées
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Chez Theodo GovTech, nous accompagnons nos clients - ministères, collectivités t...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
theodo.co.uk Logo
Theodo
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 5 ans minimum d’expérience en SRE sur des environnements on-premise ou cloud privé
  • Excellente maîtrise des concepts DevOps et web complexes
  • Très bonnes bases en conteneurisation et orchestration
  • Solides compétences en réseaux et systèmes Linux
  • Capacité à concevoir et expliquer une architecture claire
  • Exigence forte sur la qualité, la lisibilité et la maintenabilité
  • Pragmatisme
  • Esprit d’équipe
  • Curiosité et envie de progresser
  • Humilité
Responsabilités
Responsabilités
  • Concevoir des architectures d’infrastructure adaptées à des contextes contraints (sécurité, souveraineté, performance)
  • Builder et déployer des infrastructures from scratch ou en refonte
  • Diffuser l’approche DevOps au cœur de l’équipe agile (rituels, cadrage, documentation)
  • Challenger les choix techniques pour optimiser coûts, performance et maintenabilité
  • Analyser les défauts et incidents pour renforcer la robustesse du système
  • Expliquer, documenter et rendre lisibles des décisions techniques complexes
  • Former l’équipe “en situation de travail” aux bonnes pratiques DevOps
Ce que nous offrons
Ce que nous offrons
  • Actionnariat salarié
  • Prime d’intéressement indexée sur la croissance de Theodo
  • Budget matériel pour t’équiper (ordinateur, smartphone, écouteurs…)
  • 5 semaines + 8 à 12 RTT/an
  • Mutuelle prise en charge à 50%
  • Carte ticket-restaurants Swile
  • Aides et places en crèche réservées
  • Accompagnement par un coach interne
  • Participation à des projets associatifs grâce à la Fondation Theodo
  • Soirées mensuelles, keynotes et week-end d’entreprise annuel
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Delair, leader mondial du drone professionnel, fournit des données basées sur l’...
Emplacement
Emplacement
France , Toulouse
Salaire
Salaire:
Non fourni
delair.aero Logo
Delair
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • De formation BAC+5 école d'ingénieur ou Universités, vous avez idéalement un profil Devops
  • Maitrise du Cloud, idéalement Google Cloud Plateforme, si pas possible, à minima avoir une expérience sur du Cloud comme AWS
  • Connaissance des "best practices" sur la sécurité
  • Maitrise de l'outil Terraform et GitLab
  • Pédagogue avec les utilisateurs, souvent des personnes de l'IT
  • Curieux(se)
  • Esprit d'équipe et sociable
  • Sens du service aux utilisateurs
Responsabilités
Responsabilités
  • Gestion et définition de l'architecture du Cloud Delair
  • Modes principalement Projet (gros de l'activité) et Run (dépannage, administration quotidienne...)
  • Monitoring de l'infrastructure Cloud : outils de monitoring à mettre en place
  • Maintien de projets dans le GitLab en rapport avec le Cloud (écriture de CI GitLab)
  • Gestion de la sécurité des applications déployées sur le Cloud
Ce que nous offrons
Ce que nous offrons
  • Tickets restaurants Swile
  • Mutuelle familiale
  • Forfait Mobilité durable (rémunération du trajet domicile/bureau en vélo)
  • Café, thé et fruits gratuits en libre service
  • Associations sportives entre midi et deux
  • Team Building et Workshop
  • Et de nombreux événements de cohésion interne : week-end corpo, barbecue tous les vendredis durant l'été, after work, Family Day, etc.
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer - SRE

Rattaché au responsable de l'équipe SRE (Site Reliability Engineering), vous gér...
Emplacement
Emplacement
France , Sophia-Antipolis
Salaire
Salaire:
Non fourni
balzac-paris.com Logo
Balzac Paris
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • Issu de formation supérieure, vous justifiez d'une expérience de 5 ans minimum dans le déploiement et les opérations en production de solutions digitales
  • Logiciels et outils de l'infrastructure UNIX
  • Bash
  • Architecture et principe réseau distribué
  • Processus de développement, test et déploiement logiciels
  • AWS
  • Git/Jenkins/Ansible/Saltstack
  • Docker/Kubernetes (certification CKA appréciée)
  • PKI/cryptographie/Certificats/HSM
Responsabilités
Responsabilités
  • Participer à la maintenance et l'évolution des plates-formes dans un contexte Kubernetes/Docker
  • Gérer différents environnements DC privé & Cloud
  • Sécuriser les plates-formes (Design, implémentation, configuration) et développer des outils ou adaptation de solutions en relation avec la production de services
  • Piloter et maintenir en condition opérationnelle les plates-formes en s'assurant de leur disponibilité et performance
  • Fournir une expertise technique sur les produits développés par DTS et fournir le support adéquat aux clients internes/externes
  • Fournir un support et une assistance continue aux clients ( Participation aux rotation d'astreintes 24/7)
  • Valider la mise en production des livrables au travers du développement, exécution et vérification de tests automatisés/unitaires/fonctionnels des logiciels critiques (“Smoke Test”)
Ce que nous offrons
Ce que nous offrons
  • Jours de bénévolat offerts
  • Prime de cooptation
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

Sopra Steria subsidiary CS specializes in critical systems design, integration, ...
Emplacement
Emplacement
France , Le Plessis-Robinson
Salaire
Salaire:
Non fourni
https://www.soprasteria.com Logo
Sopra Steria
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 6 years of experience including 3 years in Azure/SRE
  • proficiency in Python
  • ability to design and execute Chaos Engineering scenarios
  • expertise in DevOps tools (Terraform, Ansible)
  • mastery of Azure Monitor
  • excellent oral communication skills
  • sense of service
  • ability to work in a team
  • proactive and autonomous.
Responsabilités
Responsabilités
  • Define and implement observability mechanisms (Azure Monitor, KQL, Application Insights, Log Analytics, Container Insights) and multi-level alerting
  • set up dashboards and SLI/SLO/SLA for proactive supervision
  • contribute to resilience efforts (backups/restorations, DRP, regular tests)
  • execute scenarios of Chaos Engineering
  • optimize incident management (runbooks, Status Page, Teams/Jira webhooks, post-mortem)
  • automate via Terraform, Ansible, and CI/CD pipelines
  • propose solutions using AIOps/GenAI (observability, remediation).
Ce que nous offrons
Ce que nous offrons
  • Enriching employee experience with flexibility, autonomy, and well-being
  • comprehensive onboarding program
  • academy for skill development and career growth
  • strong societal commitment supporting over 3000 associations
  • active disability and inclusion policy
  • inspiring diversity initiatives.
  • Temps plein
Lire la suite
Arrow Right

Senior Site Reliability Engineer

Nous vivons une époque passionnante, où la technologie et la transformation digi...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
Non fourni
kbrw.com Logo
KBRW
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • 7+ ans d’expérience en tant qu’administrateur système, SRE, Ops ou DevOps (un diplôme en informatique ou équivalent est un plus)
  • Solide expérience dans un environnement Linux et dans la gestion de serveurs bare metal
  • Aisance dans la gestion de conteneurs, en particulier LXC
  • Excellentes compétences en gestion réseau
  • Proactif(ve) et déterminé(e), avec une grande flexibilité d’esprit et un bon esprit d’équipe
  • Maîtrise du français et de l’anglais
Responsabilités
Responsabilités
  • Participer à la conception, la construction et le déploiement des futures évolutions de notre plateforme cloud et de notre infrastructure
  • Gérer notre cluster de serveurs, tout en participant à la gestion de la relation avec notre partenaire d’hébergement
  • Administrer notre plateforme cloud via notre stack Infrastructure as Code en constante amélioration
  • Mener des opérations afin de garantir la meilleure qualité de service possible
  • Travailler à l’amélioration continue de notre stack d’orchestration de conteneurs LXC et de réseau (VLAN, firewall, DNS, etc.)
  • Gérer l’infrastructure de sauvegarde pour soutenir notre plan de reprise après sinistre à grande échelle
  • Accompagner les utilisateurs de la plateforme cloud de Kbrw afin de leur permettre de tirer le meilleur parti de notre infrastructure et de les aider à surmonter leurs blocages
  • Collaborer avec les autres équipes Product & Engineering pour faire émerger les meilleures pratiques et améliorer notre offre produit à destination de nos clients
  • Gérer l'astreinte au moins une semaine par mois
Ce que nous offrons
Ce que nous offrons
  • Participation aux bénéfices en France
  • Possibilité de primes basées sur tes résultats
  • politique de télétravail flexible 12 jours de télétravail par mois
  • Ticket Restaurant avec Swile (9,5 € par jour)
  • Assurance santé privée fournie par AXA (100 % prise en charge par Kbrw)
  • Accès aux avantages Leeto : théâtre, opéra, clubs de sport, concerts, festivals, salons professionnels, etc.
  • Plan de développement personnel
  • Formation des managers
  • Un processus de management structuré et mature
  • Opportunités de croissance rapide
  • Temps plein
Lire la suite
Arrow Right

Site Reliability Engineer

As our Site Reliability Engineer you are responsible for implementing and mainta...
Emplacement
Emplacement
France , Paris
Salaire
Salaire:
52000.00 - 65000.00 EUR / Année
beamy.io Logo
Beamy
Date d'expiration
Jusqu'à nouvel ordre
Flip Icon
Exigences
Exigences
  • At least 4 years of infrastructure/systems engineering experience
  • Strong hands-on technical focus
  • Comfortable building and maintaining large-scale distributed systems
  • Comfortable managing incident response according to SLA
  • Comfortable implementing automation and self-healing systems
  • Comfortable developing utility scripts and functions
  • Fluent in French and English
  • Strong problem-solving skills
  • Reliability-focused
  • Excellent communication skills
Responsabilités
Responsabilités
  • Implement and maintain scalable infrastructure and systems
  • Ensure reliability, performance, and security of production environments
  • Bridge the gap between development and operations
  • Apply software engineering principles to infrastructure and operational challenges
  • Collaborate with Development teams, Security teams, and other stakeholders
  • Build and maintain robust systems
  • Implement automation
  • Support operational excellence through SLOs and observability
  • Contribute to incident management
  • Contribute to capacity planning
Ce que nous offrons
Ce que nous offrons
  • Semaine de 4 jours
  • Plan de développement professionnel
  • Congés pour enfant malade
  • Solution de prévention santé mentale
  • Employee Resource Groups (ERG)
  • Temps plein
Lire la suite
Arrow Right