Notre stack

Quinze briques interchangeables. Aucune imposée.

Nous travaillons avec ces technologies. Chaque brique peut être remplacée sans casser l'ensemble. Si dans dix-huit mois un meilleur composant sort, vous l'intégrez en quelques jours — pas en six mois de réécriture.

Modèles de langage propriétaires

Claude (Sonnet 4.6 / Opus 4.7)

Anthropic

Contexte 200k tokens (1M sur Opus en bêta)

+ Forces Raisonnement profond, respect des instructions précises, tool use solide, prompt caching natif, refus argumenté plutôt qu'hallucination.

− Faiblesses Coût élevé, latence non négligeable, pas multimodal natif sur tous les usages (vision OK, audio non).

GPT (4o / o1 / o3)

OpenAI

Contexte 128k tokens (200k sur GPT-4.1)

+ Forces Généraliste, écosystème mature, coût compétitif sur GPT-4o-mini, function calling robuste, voix native sur 4o.

− Faiblesses Moins consistant que Claude sur tâches longues, occasionnellement obéit trop (suggestions hasardeuses), dépendance à OpenAI seul fournisseur cloud.

Gemini (2.5 Pro / 3 Flash)

Google

Contexte 1M tokens natif (2M en bêta sur Pro)

+ Forces Contexte le plus long du marché, multimodal natif (image + vidéo + audio + PDF dans le même prompt), excellent pour analyse documentaire massive, prix attractif sur Flash.

− Faiblesses Plus volatile sur raisonnement complexe vs Claude, ecosystem Vertex AI parfois lourd, latence variable selon zone GCP.

Mistral Large 2 / Medium 3 / Small

Mistral AI

Contexte 128k tokens

+ Forces Français de référence (vocabulaire métier idiomatique), hébergement européen souverain (Scaleway, OVH), licence Apache 2.0 sur certaines variantes, prix bas sur Small.

− Faiblesses Moins capable que Claude/GPT/Gemini sur tâches très complexes ou code obscur, écosystème plus petit, pas de prompt caching généralisé.

DeepSeek (R1 / V3)

DeepSeek AI

Contexte 64k tokens (128k sur V3)

+ Forces Raisonnement compétitif Opus à coût marginal, open weights, excellent pour code, économie sur runs longs.

− Faiblesses Hébergement Chine par défaut (data sensitivity), modèle weights publics donc support commercial limité, qualité multilingue inégale.

Modèles ouverts auto-hébergés

LLaMA

Qwen

Alibaba

Excellent multilingue, bon compromis taille/performance.

Mixtral

Mistral AI

Mixture of experts, hébergement souverain possible.

DeepSeek

DeepSeek AI

Raisonnement et code, coût inférence très faible.

Orchestration et agents

MCP

Model Context Protocol

Standard ouvert pour connecter LLM et outils. Recommandé par défaut.

LangGraph

LangChain

Graphes d'agents avec état, utile pour workflows complexes.

Temporal

Durabilité et retry policy pour pipelines critiques.

Langages et runtime

Python

—

Data science, ML, scripts d'intégration, pipelines.

TypeScript

—

Interfaces, APIs, agents côté client.

Docker

Docker Inc.

Conteneurisation pour reproductibilité et déploiement.

Kubernetes

CNCF

Orchestration à l'échelle, souvent surdimensionné pour ETI — appliqué avec discernement.

Bases de données

PostgreSQL + pgvector

—

SQL relationnel + recherche vectorielle dans la même base. Notre choix par défaut.

ClickHouse

ClickHouse Inc.

Analytics haute performance sur très grands volumes.

Qdrant

Base vectorielle dédiée si besoin de fonctionnalités avancées (filtres, payloads, multi-collection).

Souveraineté

100 % local, c'est possible.

Certains cas l'exigent : secret industriel, conformité sectorielle, secret défense, données de santé. Nous déployons alors uniquement des modèles ouverts auto-hébergés, sur vos serveurs ou chez un hébergeur souverain français (Scaleway, OVHcloud, 3DS Outscale). Aucune donnée ne sort de votre périmètre. Aucune API publique n'est appelée. C'est plus exigeant à mettre en place, mais c'est la seule option pour certains métiers.

Discuter d'un déploiement souverain

Une techno spécifique à valider ?

Nous acceptons des contraintes techniques dictées par votre SI ou votre direction IT. Dites-nous ce que vous avez déjà, nous vous dirons si et comment nous pouvons nous intégrer proprement.

Prendre un RDV technique