Prestation · AI engineer freelance

Créer des agents IA. Production — pas une démo.

Je construis des systèmes d'agents IA qui tournent vraiment — de bout en bout. Orchestration de LLM, tool-calling, RAG, et l'intégration dans ton stack existant. En solo, depuis Eindhoven, disponible 2-3 jours par semaine pour des clients aux Pays-Bas et dans l'UE.

Réserver un appel →Voir ECHO comme référence

Ce sur quoi j'interviens

Les projets où j'apporte le plus de valeur :

Mettre en place un agent de zéro. Orchestration de LLM · tool-calling · couche mémoire · toute l'architecture. Pas un chatbot qui se contente de parler, mais un agent qui exécute des tâches et reprend là où tu t'étais arrêté hier.
Améliorer une intégration LLM existante. Routage entre modèles, coûts en baisse, latence en baisse, fiabilité en hausse. Souvent avec un fallback multi-niveaux et des modèles locaux pour les requêtes peu coûteuses.
Mettre en place du RAG sur tes propres documents. Embeddings, chunking, stratégie de retrieval, évaluation. Pas un « load and chat » générique — mais configuré pour ton corpus et tes questions.
Intégration de l'API Claude. Tool-use, serveurs MCP, streaming, prompt caching. Pour les équipes qui veulent passer d'un prototype à la production sans tomber dans les pièges habituels.
Automatisation de workflows avec des agents. Agents SDR, flux de support, traitement de factures, pipelines de contenu. Avec les bons garde-fous et le monitoring qui va avec, pour que ça ne casse pas en silence.

La stack que je privilégie

La stack suit le problème, mais voici ce que je touche le plus en pratique pour le travail d'agents :

LLM

Anthropic Claude (Sonnet · Haiku · Opus). En local Ollama (Qwen 2.5, Llama 3.2) pour les routes peu coûteuses et le fallback hors ligne.

Backend

Python et FastAPI. I/O asynchrone · registre d'outils · streaming. Rust là où la latence compte.

Tooling

Tool-calling · MCP · le pattern agentskills.io (compatible OpenClaw). Fallback multi-niveaux pour la fiabilité en production.

Memory

Vault Obsidian comme dépôt de contexte (style Letta), extraction ADD-only, Qdrant en option pour le rappel vectoriel.

Infra

Supabase EU · Cloudflare R2 · Sentry EU · Stripe. Vercel ou un VPS auto-hébergé avec Coolify quand cela convient.

Pas

Pas de vendor lock-in sans raison. Pas de spaghetti LangChain. Pas de framework d'agents quand 100 lignes de Python suffisent.

Preuve — ECHO

Je ne construis pas seulement pour des clients — je construis pour moi-même. ECHO est mon propre orchestrateur d'agents qui tourne chaque jour sur mon bureau. Voice-first, routé entre Ollama en local et Claude, sa propre mémoire dans un vault Obsidian, un HUD en direct avec les stats système. Dix ans d'ADN audio en dessous pour la couche voix.

Ce qu'ECHO prouve pour le travail client : je sais où les agents cassent en production, et comment l'éviter. Les choix d'architecture faits tôt (couche mémoire, routage, registre d'outils, stratégie de fallback) déterminent si, dans six mois, tu seras encore satisfait de la codebase — ou si tu repars de zéro.

→ Lire à propos d'ECHO

Pour qui cela fonctionne le mieux

Les entreprises SaaS qui veulent mettre une fonctionnalité IA en production sans embaucher une équipe permanente. Un ou deux sprints de ma part suffisent souvent à la rendre opérationnelle.
Les PME avec de l'automatisation interne. Des agents pour le support, le développement commercial, le traitement de factures, les flux de contenu. Du travail qui reste sinon en suspens faute d'équipe.
Les solo founders et petites équipes qui veulent la couche IA sous leur produit, mais préfèrent ne pas avoir à décortiquer eux-mêmes toute l'économie des LLM.

Comment ça se passe

Un court e-mail ou message. Le problème, en gros ce que tu cherches, à quelle échéance. Un paragraphe suffit.
Un appel de 30 minutes. Si le courant passe, on cadre le projet. Sinon, je te le dis aussi. Je montre ECHO en direct si tu veux.
Une semaine payée d'abord. Pour les missions plus longues : une semaine de travail pour vérifier le rythme avant de poursuivre.

Prêt à démarrer ?

Le tarif, la disponibilité et le formulaire se trouvent sur la page hire. Disponible pour des clients aux Pays-Bas et en EU remote, 2-3 jours par semaine, depuis Eindhoven.

→ Vers /hire (tarif + contact)