
Chief Technology Officer — Yelema
- Sur site, Hybride
- Abidjan, Abidjan, Côte d'Ivoire
- Startups
CTO fondateur(rice) chez Yelema, tu conçois et pilotes l'infrastructure technique d'un studio d'agents IA B2B en UEMOA : de la mise en production à l'opération continue sous SLA.
Description de l'offre d'emploi
📝 DESCRIPTION
À propos de Yelema
Yelema est un studio d'agents IA en Build & Operate, dédié aux entreprises et institutions d'Afrique francophone. Notre mission : rendre l'intelligence artificielle accessible aux entreprises et institutions africaines.
Nous déployons et opérons des agents IA métier clé en main — en semaines, pas en mois — entièrement conçus pour les réalités du continent : droit OHADA, réglementation BCEAO, langues locales, mobile-first, intégration WhatsApp et USSD. Notre catalogue couvre les fonctions Finance, RH, Juridique, Compliance, Gestion des investissements et bien d'autres.
Premier studio d'agents IA packagés d'Afrique francophone, Yelema s'appuie sur un catalogue de plus de 100 agents IA déjà construits et sur le modèle Build & Operate qui nous distingue fondamentalement : nous ne livrons pas un outil, nous co-pilotons sa performance dans la durée. Yelema est porté par Mstudio, studio de startups tech d'Afrique francophone.
Mission du poste
Rattaché(e) directement au CEO, tu seras le/la CTO fondateur(rice) de Yelema. Tu conçois l'architecture de notre plateforme d'agents IA, tu supervises le déploiement et l'opération des agents en production, et tu poses les fondations d'une organisation technique scalable.
C'est un rôle hybride : architecte, builder et leader technique IA. Tu codes, tu décides, tu recrutes. La performance des agents IA en production — donc la satisfaction de nos clients — repose directement sur tes choix.
Responsabilités
🧠 Plateforme d'agents IA & intelligence
Concevoir le cœur IA de Yelema : orchestration multi-agents, pipelines RAG avancés, tool-use, gestion de la mémoire et du contexte
Mettre en place l'évaluation et l'observabilité des agents : qualité des réponses, détection des hallucinations, tests de non-régression, scoring de performance en continu
Définir la stratégie de modèles : sélection et routing des LLMs, fine-tuning / distillation, arbitrage coût / latence / qualité selon les cas d'usage
Garantir la fiabilité des agents : guardrails, sécurité et maîtrise des comportements en production (prompt injection, fuite de données)
🏗️ Architecture & infrastructure
Concevoir et faire évoluer l'architecture technique globale : plateforme d'agents, APIs, intégrations omnicanales (WhatsApp Business API, USSD, web, Slack)
Maîtriser l'économie de l'inférence : compréhension fine des coûts et des contraintes GPU / NPU, optimisation de la latence et des coûts à l'échelle
Évaluer et déployer des modèles souverains / self-hosted et des options d'inférence edge / on-device (quantization, modèles légers) adaptées à la faible connectivité et aux exigences de souveraineté des données
Construire une infrastructure scalable et réplicable permettant de déployer un nouvel agent rapidement et de servir plusieurs clients simultanément
Garantir la sécurité, la souveraineté des données et la conformité (OHADA, BCEAO) attendues par des clients institutionnels et corporate
⚙️ Déploiement, opération & SLA
Piloter techniquement le déploiement des agents chez les clients : configuration, intégration aux systèmes existants, tests, mise en production
Assurer le monitoring continu des agents en production : performance, qualité des outputs, disponibilité, alertes
Garantir le respect des SLA contractuels et mettre en place les processus de remédiation en cas d'incident
Superviser l'amélioration continue des agents : itération sur les prompts, mise à jour des modèles, ré-évaluation des performances
👥 Leadership technique & roadmap
Définir et piloter la roadmap technique en lien direct avec les priorités business
Recruter, encadrer et faire grandir l'équipe technique (ingénieurs IA, développeurs, DevOps / MLOps)
Collaborer avec les équipes Produit et Commercial pour transformer les besoins clients en solutions robustes
Identifier les leviers d'industrialisation et d'automatisation pour réduire le time-to-deploy et augmenter les marges opérationnelles
Pourquoi rejoindre Yelema ?
🚀 Un rôle technique fondateur
Tu arrives avant l'équipe, avant les process. Les choix d'architecture que tu fais aujourd'hui définiront la plateforme Yelema pour les années à venir. Trajectoire directe vers CTO d'une société en croissance.
🤖 Un terrain d'IA appliquée, en vrai
Des agents IA en production réelle, des clients exigeants, des secteurs variés (Finance, RH, Legal, Compliance…). Pas de POC qui s'éternisent : tu mesures l'impact de tes choix en semaines.
🌍 Des défis techniques uniques
Mobile-first, WhatsApp, USSD, faible connectivité, multilinguisme, conformité OHADA / BCEAO, déploiement souverain : des problèmes qui n'existent pas dans les manuels de la Silicon Valley. C'est un avantage compétitif réel.
🏗️ Un socle déjà là
Tu construis sur un catalogue de plus de 100 agents déjà éprouvés et sur l'écosystème Mstudio — pas sur une page blanche.
🎓 Une position d'influence
En tant que CTO de l'un des premiers studios d'agents IA d'Afrique francophone, tu contribues à définir les standards techniques du secteur sur le continent.
Pré-requis du poste
Formation & expérience
Diplôme Bac+5 en informatique, ingénierie logicielle, IA / data science ou équivalent
6 à 10 ans d'expérience en ingénierie logicielle, dont au moins 3 ans sur des systèmes LLM / agents IA en production
Expérience confirmée en conception et opération de systèmes IA en production (pas seulement en POC ou R&D)
Expérience en startup ou environnement early-stage : capacité à construire sans infrastructure préexistante
Expérience d'intégrations omnicanales (APIs, WhatsApp Business, USSD) : fort atout
Expertise IA & agents (cœur du poste)
Maîtrise approfondie des LLMs et des architectures d'agents : orchestration multi-agents, RAG avancé, tool-use, gestion de la mémoire et du contexte
Évaluation et observabilité des agents : frameworks d'eval, détection d'hallucinations, tests de non-régression, monitoring de la qualité
Fine-tuning, distillation et sélection de modèles ; arbitrage coût / latence / qualité
Guardrails et sécurité des agents (prompt injection, fuite de données, comportements indésirables)
Frameworks d'orchestration (Dust, LangChain, LlamaIndex ou équivalent) — maîtrise requise ou montée en compétence rapide
Infrastructure & inférence
Solide compréhension de l'économie de l'inférence : coûts et contraintes GPU / NPU, optimisation de la latence et des coûts
Déploiement de modèles souverains / self-hosted et notions d'inférence edge / on-device (quantization, modèles légers) pour la faible connectivité
Architecture cloud et MLOps / LLMOps : déploiement, CI/CD, monitoring, gestion des coûts d'inférence
Développement backend solide : Python (obligatoire), APIs REST / GraphQL, bases de données (PostgreSQL, MongoDB, bases vectorielles)
Sécurité et conformité data : bonnes pratiques, sensibilité aux contextes réglementaires locaux (OHADA, BCEAO)
Qualités personnelles
Builder hands-on : tu codes autant que tu architectures — pas de tour d'ivoire
Ownership total de la performance des systèmes en production
Pragmatisme : tu choisis ce qui marche dans le contexte africain, pas le plus sophistiqué sur le papier
Communication transverse : tu traduis les enjeux techniques en langage business pour la Direction et les clients
Adaptabilité : à l'aise dans un environnement en construction, avec des priorités mouvantes
Bilingue français-anglais (documentation, veille technique, partenaires)
Outils & stack
Plateforme agents : Dust (ou équivalent)
LLMs : Claude (Anthropic), GPT (OpenAI) et modèles open-weights (Llama, etc.) pour le déploiement souverain
Backend : Python, APIs REST, PostgreSQL / MongoDB, bases vectorielles
Infrastructure : AWS / GCP / Azure, Docker, CI/CD, MLOps
Intégrations : WhatsApp Business API, USSD, connecteurs ERP / SIRH
Collaboration : Slack, Notion, GitHub
ou
C'est fait !
Votre candidature a été envoyée avec succès !
Vous avez déjà postulé à cet emploi
Nous vous remercions de l'intérêt que vous portez à ce poste. Malheureusement, vous avez déjà postulé à cet emploi.

