Remote
Descripcion del puesto
Rejoignez Tether, une start‑up innovante spécialisée dans les modèles d’intelligence artificielle de nouvelle génération. En tant qu’Ingénieur Recherche IA dédié à la pré‑formation, vous intégrerez l’équipe « Modèles IA » et contribuerez à la conception, l’optimisation et le déploiement de modèles de grande taille, incluant des architectures multimodales (texte‑image, texte‑audio, etc.). Vous serez au cœur de la chaîne de valeur IA, depuis la curation massive de jeux de données jusqu’à l’exécution de pré‑formations sur des clusters de serveurs distribués à l’échelle du cloud.
**Missions principales**
- Concevoir et itérer des architectures de modèles de grande taille (LLM, vision‑langage, etc.) en s’appuyant sur les dernières avancées de la recherche (transformers, MoE, sparsity, etc.).
- Mettre en place des pipelines de pré‑entraînement robustes, automatisés et scalables sur des infrastructures distribuées (GPU/TPU, clusters Kubernetes, systèmes de fichiers parallèles).
- Gérer la curation, le nettoyage et l’enrichissement de jeux de données massifs (terabytes), en veillant à la qualité, la diversité et le respect des exigences légales (RGPD, licences).
- Optimiser les performances d’entraînement : réduction des goulets d’étranglement, amélioration du throughput, gestion de la mémoire et du parallélisme (pipeline, data‑parallel, model‑parallel).
- Contribuer à la recherche appliquée : prototyper de nouvelles techniques de pré‑formation, publier des rapports internes et, le cas échéant, des articles scientifiques.
- Collaborer étroitement avec les équipes produit, data‑science et infrastructure pour aligner les modèles sur les besoins business et garantir une mise en production fluide.
**Profil recherché**
- Diplôme d’ingénieur ou master en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle en recherche ou ingénierie IA, avec un focus sur les modèles de grande taille et le pré‑entraînement.
- Maîtrise des frameworks deep learning (PyTorch, TensorFlow) et des bibliothèques de pointe (DeepSpeed, Megatron‑LM, HuggingFace Transformers).
- Expérience avérée sur des environnements distribués (MPI, NCCL, Horovod) et sur l’optimisation de l’utilisation de GPU/TPU à grande échelle.
- Solides compétences en programmation Python et en scripting Bash/PowerShell.
- Connaissances en gestion de données massives (Spark, Dask, Hadoop) et en pipelines de données (Airflow, Prefect).
- Capacité à analyser des performances, identifier des goulots d’étranglement et proposer des solutions innovantes.
- Bonnes aptitudes à la communication écrite et orale en anglais ; le français est un plus.
**Ce que nous offrons**
- Contrat CDI à temps plein, 100 % télétravail avec flexibilité horaire.
- Accès à des ressources de calcul de pointe (GPU A100, TPU v4) et à un budget dédié à la recherche.
- Environnement de travail stimulant, culture d’innovation et d’autonomie.
- Programme de formation continue (conférences, cours en ligne, publications).
- Participation aux bénéfices de l’entreprise et stock‑options.
- Assurance santé internationale, congés illimités et politique de bien‑être.
Si vous êtes passionné(e) par les défis techniques de la prochaine génération de modèles IA et que vous souhaitez évoluer dans un cadre entièrement remote, rejoignez Tether et participez à façonner le futur de l’intelligence artificielle.