Cette liste contient uniquement les pays pour lesquels des offres d'emploi ont été publiées dans la langue sélectionnée (par exemple, dans la version française, seules les offres rédigées en français sont affichées, et dans la version anglaise, uniquement celles en anglais).
Vous rejoignez une entreprise technologique en forte croissance qui développe une plateforme avancée de data science dédiée à l’automatisation et à l’industrialisation de cas d’usage sur données structurées. Le produit s’appuie sur un modèle de fondation appliqué aux données tabulaires, conçu pour être déployable rapidement en production, avec un haut niveau d’exigence sur la performance, la robustesse et la transférabilité. Dans un environnement de recherche appliquée, vous intervenez au cœur de la nouvelle génération de modèles. Vous travaillez en proximité avec des équipes engineering et data, ainsi qu’avec des partenaires académiques et industriels, sur des problématiques à la fois scientifiques et directement actionnables.
Responsabilités
Concevoir et améliorer des algorithmes de représentation et d’embeddings pour données tabulaires, intégrés au cœur du produit
Définir des protocoles d’évaluation et des métriques adaptées aux cas d’usage réels, puis optimiser performance et scalabilité
Contribuer aux stratégies d’active learning, à la sélection d’échantillons et à la consolidation des datasets train et eval
Concevoir et enrichir des datasets favorisant représentation et transfer learning, notamment via l’usage de données synthétiques
Analyser les mécanismes d’apprentissage afin d’orienter les itérations de recherche et les choix techniques
Assurer une veille scientifique active et proposer des axes de recherche pertinents
Collaborer avec ML Engineers et Data Scientists pour livrer des modèles pré entraînés et des adaptations ciblées
Exigences
Doctorat terminé en IA, machine learning ou domaine connexe
Publications dans au moins une conférence scientifique de premier plan
Expérience concrète d’entraînement de modèles à l’échelle sur cloud ou cluster privé
Très bon niveau de code, capacité à prototyper et à industrialiser
Anglais courant
Autonomie, rigueur et forte appétence pour la recherche appliquée
Souhaitable
Expérience d’entraînement distribué et calcul intensif
Contributions open source ou compétitions data science
Capacité à démontrer l’impact opérationnel de travaux de recherche
Nous utilisons des cookies pour améliorer votre expérience de navigation, analyser le trafic et proposer du contenu personnalisé. En cliquant sur « Accepter », vous consentez à l'utilisation des cookies.
Connectez-vous pour postuler
Créez un compte gratuit ou connectez-vous pour accéder à la page de candidature de cette offre.
Postulez et suivez toutes vos candidatures au même endroit
Enregistrez des offres et ne perdez aucune opportunité intéressante