Architecte Systemes IA / Lead MLOps
Le contexte
Mentivis conçoit et opere des systemes d'intelligence artificielle appliques a l'education, la formation professionnelle et la transformation des competences. Nous ne sommes ni un cabinet de conseil, ni un integrateur generique : nous construisons des infrastructures IA souveraines, en production, pour des institutions publiques, des grands comptes et des operateurs de formation a forte volumetrie.
Dans le cadre du deploiement de MentivisOS, notre plateforme d'IA appliquee a l'education, nous recrutons un(e) Architecte Systemes IA charge(e) de concevoir, industrialiser et operer nos pipelines multi-LLM en environnement souverain.
Ce poste n'est pas un role de prototypage. Il s'agit de faire tourner des systemes en production, avec des engagements de fiabilite, de traçabilite et de conformite reglementaire aupres de clients institutionnels.
La mission
Orchestration multi-LLM et industrialisation
Concevoir et maintenir une architecture d'orchestration multi-modeles capable de router, chainer et fallback entre plusieurs LLM selon le contexte, le cout, la latence et les contraintes de souverainete. La stack repose sur LangChain / LangGraph pour le chainage agentique, avec une couche d'abstraction permettant le swap de modeles sans refactoring applicatif.
Mettre en place et operer les pipelines MLOps de bout en bout : versioning de modeles (MLflow, Weights & Biases), orchestration d'entrainement et de fine-tuning (Ray, DeepSpeed, LoRA/QLoRA pour l'adaptation parametrique), registre de modeles avec lineage, deploiement canary et blue-green sur infrastructure GPU (NVIDIA A100/H100, ou equivalent cloud souverain OVHcloud, Scaleway, Outscale).
Guardrails, fiabilite et gouvernance
Implementer une couche systematique de guardrails sur l'ensemble des sorties LLM : detection de hallucinations via NLI (Natural Language Inference), filtrage de contenu (Guardrails AI, NeMo Guardrails de NVIDIA), validation structurelle des outputs (Pydantic, JSON Schema enforcement), et monitoring de derive semantique en production (LangSmith, Langfuse, Arize Phoenix).
Mettre en place une infrastructure de tests automatises pour les systemes IA : evaluations de regression sur benchmarks proprietaires, red-teaming automatise, scoring de coherence et de fidelite factuelle, avec alerting et circuit-breaker en cas de degradation.
Assurer la conformite reglementaire (AI Act europeen, RGPD, referentiels ANSSI) et produire la documentation technique necessaire aux audits clients et aux certifications.
Integration entreprise : LearningOS et TalentOS API
Concevoir et maintenir les connecteurs API vers les ecosystemes LearningOS (LMS/LXP : 360Learning, Cornerstone, Moodle, OpenEdX) et TalentOS (SIRH/Talent Management : Workday, SAP SuccessFactors, Talentsoft/Cegid) pour les deploiements grands comptes.
Cela couvre : l'ingestion bidirectionnelle de donnees apprenant (parcours, completions, evaluations, certifications), la synchronisation des referentiels de competences (ROME, ESCO, referentiels clients), l'alimentation en temps reel des moteurs de recommandation IA depuis les donnees RH, et la generation automatisee de contenus pedagogiques contextualises (adaptive learning paths, assessments generes, remediation automatique).
Developper les SDK et la documentation technique permettant aux DSI clients d'integrer nos services IA dans leurs architectures existantes (REST, GraphQL, webhooks, SSO/SAML).
Infrastructure et observabilite
Operer l'infrastructure de serving des modeles (vLLM, TensorRT-LLM, Triton Inference Server) avec autoscaling, gestion de la concurrence et optimisation du throughput (batching dynamique, quantification INT8/FP8, speculative decoding).
Mettre en place l'observabilite complete : tracing distribue (OpenTelemetry), metriques de performance des inferences (latence P50/P95/P99, tokens/seconde, cout par requete), dashboards operationnels (Grafana, Datadog), et alerting proactif.
Le profil
Formation d'ingenieur ou equivalent, avec au minimum 5 ans d'experience en production sur des systemes ML/IA, dont une partie significative sur des architectures LLM.
Maitrise attendue :
Python avance (asyncio, typing strict, packaging), TypeScript pour les couches API. Ecosysteme LangChain/LangGraph, ou equivalent (Semantic Kernel, Haystack). Techniques de fine-tuning et d'adaptation de modeles (LoRA, QLoRA, RLHF, DPO). Infrastructure de serving GPU et optimisation d'inference. Kubernetes, Docker, CI/CD sur des pipelines ML. Au moins un cloud souverain europeen (OVHcloud, Scaleway, Outscale, 3DS Outscale).
Forte valeur ajoutee :
Experience sur des projets conformes AI Act ou certifies (ISO 27001, SecNumCloud). Connaissance du secteur education/formation et des standards associes (xAPI, LTI, SCORM, CMI5). Experience d'integration avec des SIRH ou LMS d'entreprise. Contribution a des projets open source dans l'ecosysteme IA.
Ce que nous offrons
Un poste a impact reel dans un operateur qui deploie des systemes IA en production pour des clients institutionnels et grands comptes, pas dans un lab de recherche deconnecte du terrain. Une equipe resserree ou les decisions techniques sont prises par ceux qui construisent. Un ancrage a Marseille, au coeur de l'ecosysteme Campus Cyber.AI Euromed, avec une exposition directe aux enjeux de souverainete numerique europeenne.
Remuneration : selon profil et experience, avec une composante variable indexee sur les resultats des projets deployes.
Démarrer un projet, c'est simple
Premier échange sans engagement, analyse de votre besoin et positionnement clair sur notre capacité à vous accompagner.