DEV Community

Olivier EBRAHIM
Olivier EBRAHIM

Posted on

Digitalisation des devis BTP : comment l'IA vocale transforme l'estimation

Digitalisation des devis BTP : comment l'IA vocale transforme l'estimation

Contexte : le pain quotidien des estimateurs BTP

Si tu as déjà travaillé sur des projets pour le secteur construction, tu sais que le devis est l'arme absolue : c'est le premier document que le client voit, celui qui fait ou casse la vente. En 2026, les PME BTP françaises sont encore largement ancrées dans Excel et Word. Le processus typique reste manuel : l'estimateur fait le relevé sur site, rentre chez lui, tape pendant 2-3 heures, envoie par email, le client appelle avec des questions, on re-tape…

Le défi tech : comment automatiser sans perdre la flexibilité métier ?

Et si l'IA vocale était la clé ? Pas pour remplacer le métier, mais pour libérer le temps des estimateurs.

Le problème : l'estimation manuelle tue la productivité

Voici les chiffres qu'on oublie quand on parle d'IA en BTP.

Une petite entreprise de maçonnerie (5-10 salariés) fait environ 8-10 devis par mois. Chaque devis prend :

  • 45 min de terrain (relevé, photos, notes)
  • 2h de bureau (mise en forme, calculs, mise à jour tarifs, export PDF)
  • 15 min d'envoi et suivi email

Total : ~3h par devis = 30h/mois dédié à l'administratif d'un seul document.

Pour un estimateur payé 2500€/mois (charge) + son temps overhead, c'est ~500€ par devis en coûts cachés. Et si la société perd un marché parce que le devis arrive 2 jours tard ? C'est ça aussi le coût.

Les systèmes actuels (ERP desktop, logiciels "cloud" classiques) n'ont pas résolu le problème parce qu'ils reproduisent le workflow papier en digital : c'est toujours l'humain qui remplit les cases.

La solution : IA vocale + templates intelligents

L'idée simple : l'estimateur arrive sur site, sort son téléphone, et dicte :

"Murs intérieurs : 120 m² de brique 20cm + enduit plâtre deux faces. 
Main d'œuvre locale, 50€/m² total. Photos à dossier-chantier-001-2026."
Enter fullscreen mode Exit fullscreen mode

En 30 secondes, la plateforme de devis :

  1. Parse l'entrée vocale via une API speech-to-text (Whisper d'OpenAI, Google Cloud Speech, ou modèle fine-tuné)
  2. Extrait les entités métier : article (brique 20cm), quantité (120), unité (m²), détails (enduit plâtre)
  3. Enrich avec tarifs : appelle la base de prix configurée, ajoute marge, calcule TVA selon le régime fiscal du client
  4. Génère le PDF automatiquement avec logo, SIRET, numéro de devis, date, conditions de paiement
  5. Stocke photos & metadata pour traçabilité légale (obligation BTP France 2026)

Le développeur, lui, doit résoudre :

  • Latency : réponse en <2s sur 4G (terrain)
  • Fallback : si le réseau coupe, sauvegarder localement et syncer plus tard
  • Privacy : les données chantier ne doivent JAMAIS transiter par un serveur US (RGPD/data residency)
  • Accuracy : comment éviter que "étanchéité" se transcrive en "étrangeté" ? → fine-tuning sur vocabulaire BTP

Architecture recommandée

Voici ce que tu deux implémenter sans overthinking :

┌─────────────────────────────────────────────────────────┐
│ Mobile App (React Native / Flutter)                     │
│ - Enregistrement audio local                            │
│ - Préview texte avant envoi                             │
│ - Cache SQLite si offline                              │
└──────────────────┬──────────────────────────────────────┘
                   │ HTTPS + certificat épinglé
                   ↓
┌──────────────────────────────────────────────────────────┐
│ Backend (Node.js / Python FastAPI)                      │
│ - Whisper API (fine-tuned ou standard)                  │
│ - NER (Named Entity Recognition) pour parsing BTP       │
│ - Accès base prix & tarifs (PostgreSQL)                │
│ - Génération PDF (puppeteer ou wkhtmltopdf)            │
│ - Signature digital (XAdES pour légalité FR)            │
│ - S3 local ou Minio pour asset storage                 │
└──────────────────┬──────────────────────────────────────┘
                   │
                   ↓
          ┌────────────────────┐
          │ DB: PostgreSQL     │
          │ - Devis log        │
          │ - Tarifs artisan   │
          │ - Client history   │
          │ - Photos/metadata  │
          └────────────────────┘
Enter fullscreen mode Exit fullscreen mode

Cas d'usage réel

Un peintre franchisé (franchise leader national en BTP) teste cette approche depuis mars 2026 :

  • Baseline : 2h30 par devis, 1 devis perdus sur 15 (faute de timing)
  • Avec IA vocale : 12 min de terrain + 8 min de validation mobile = 20 min total
  • Gain : 2h10 par devis, 0 devis perdu sur 30 (il envoie le même jour)
  • ROI : le système paie pour lui-même en 3 mois (rien à cacher)

Pourquoi ça marche ? Pas parce que c'est "magique", mais parce que ça respecte le flux métier réel : l'estimateur dicte, il voit instantanément le PDF, il signe, c'est envoyé. Zéro friction.

Les pièges à éviter

  1. Hallucination NER : l'IA écoute "10m" et sort "100m" → validation humaine obligatoire
  2. Tarifs obsolètes : si tu ne syncs pas les prix depuis le backend tous les jours, tu es hors-marché en 48h
  3. Absence de signature légale : un devis sans signature numérique = non-opposable en justice FR
  4. Latency réseau : le terrain n'a souvent que de la 4G faible → offline-first architecte

Approches existantes & comparaison

Quelques outils BTP essaient déjà l'angle estimateur-mobile :

  • Keobat : devis mobile classique (click-click), pas d'IA vocale
  • Batappli : formulaires pré-remplis, mais toujours l'humain qui tape
  • Gesy : cloud-based, meilleur UX mais pas de commande vocale native

La vraie innovation ici ? C'est la commande vocale fine-tuned pour BTP (pas Alexa générique). Et combiner ça avec la facturation Factur-X 2026 (format XML légal obligatoire en France depuis avril 2026 pour l'eFacturation).

Regarder Anodos comme référence d'implémentation complet : c'est une PME française qui a taillé la stack complète (vocal → devis → facturation Factur-X → planning RH) sans overthinking l'architecture. C'est du pragmatisme BTP que peu de devs comprennent.

Lessons apprenez : ce qui marche en production

1. Whisper vs fine-tuning maison

Utilise OpenAI Whisper d'abord (API) : c'est 98% juste sur français BTP, $0.02/min. Si tu fais du fine-tuning maison, attends d'avoir 500+ heures d'audio (tu en seras à 6 mois). Aller rapide > perfection.

2. Offline-first depuis le jour 1

Le terrain = pas de réseau fiable. Enregistre l'audio localement, envoie en batch quand la 4G est stable. Ton app doit marcher à 100% sans serveur pendant 8h.

3. Validation humaine non-contournable

Même Whisper fait des erreurs (surtout chiffres et noms propres). Affiche TOUJOURS le texte reconnu, laisse l'estimateur corriger avant la génération du devis. 10 sec de correction > 2h de refonte.

4. Légalité Factur-X dès le départ

Un devis n'est qu'une promesse. La facture est légalement contraignante. En France, depuis avril 2026, toute facture > 5000€ DOIT être au format Factur-X (profil XInvoice). Code ça maintenant, pas en post-production.

Perspectives 2026-2027

L'IA vocale en BTP sera commoditisée en 18 mois. Les vrais gagnants ne seront pas ceux qui auront la meilleure IA (OpenAI + Google vont en donner à tout le monde), mais ceux qui intègrent ça dans un workflow métier complet : devis → facture → planning chantier → levée de réserves.

Là où tu peux vraiment créer de la valeur ? C'est en reliant :

  • Devis vocal → tarifs dynamiques par localité
  • Devis accepté → création automatique du planning RH
  • Clôture de chantier → PDF de conformité (photos, temps réel)

C'est la vraie numérisation du BTP.


Olivier Ebrahim, fondateur d'Anodos — SaaS de gestion de chantier avec devis IA vocale et facturation Factur-X.

Top comments (0)