Vos fichiers deviennent une mémoire
structurée et exploitable par l'IA

Documents, photos, emails Outlook, enregistrements audio — tout est capturé, transcrit et structuré automatiquement par des agents discrets en arrière-plan. Une seule base reliée, propre et indexée, directement exploitable par vos outils IA. En local, sans friction, sans cloud, sans abonnement.

100 % local — aucune API cloud, aucune télémétrie, vos données restent sur votre machine

3
Applications indépendantes
0
Dépendance cloud ou SaaS
YAML
Format ouvert, lisible, versionnable
JSONL
Index IA-ready : NODES, EDGES, LOOKUPS

Le principe

Sources multiples → base unique → IA prête

Peu importe la nature du contenu — document, image, email ou audio, tout converge dans un seul format structuré, sans effort imposé.

📄 PDF · DOCX · DOC 📧 MSG Outlook 🖼️ PNG · JPG 🎙️ Audio (micro · loopback)
Extraction automatique · OCR Tesseract · Transcription Whisper.cpp
BASE YAML STRUCTURÉE
UUIDv7 persistants · Schéma commun 20 champs · Liens explicites personnes / projets / structures · Intégrité vérifiée en continu
Indexation atomique par Archiviste
INDEX_NODES.jsonl INDEX_EDGES.jsonl INDEX_LOOKUPS.jsonl
RAG local Recherche sémantique Agents IA Automatisation

Vos données s'accumulent sans structure exploitable

Réunions, contrats, emails, notes de projet… Le volume grossit, mais l'accès reste manuel, le contexte se perd, et aucun outil IA ne peut s'en emparer efficacement.

  • Documents archivés sans métadonnées ni liens contextuels
  • Transcriptions audio inutilisables sans traitement manuel
  • Aucune vision graphe entre personnes, projets et contenus
  • Données éparpillées, impossibles à interroger en RAG ou en recherche sémantique
  • Outils cloud trop risqués pour données sensibles ou confidentielles

La réponse

  • Extraction automatique de contenu, génération de sidecars YAML structurés
  • Schéma commun aux 3 apps, UUIDs persistants, liens explicites entre entités
  • Index JSONL IA-ready : NODES, EDGES, LOOKUPS prêts pour le RAG
  • Contrôle d'intégrité continu : champs requis, IDs dupliqués, liens cassés
  • 100 % local — exécutables autonomes, zéro réseau, zéro abonnement

Bénéfices clés

Ce que la suite change concrètement

Récupérez du temps chaque jour

Scribe ingère vos PDF, DOCX et MSG en quelques secondes. Greffier transcrit vos réunions automatiquement. La ressaisie manuelle disparaît, le contenu est immédiatement exploitable.

Contrôle total sur vos données

Archiviste détecte automatiquement les incohérences — champs manquants, IDs dupliqués, liens cassés — avant qu'elles ne deviennent des problèmes métiers. Vos données restent fiables et cohérentes.

Une base prête pour l'IA

Trois index JSONL structurent votre connaissance sous forme de graphe : NODES pour le contexte, EDGES pour les liens, LOOKUPS pour le vocabulaire. Idéal pour le RAG, la recherche sémantique et l'automatisation.

Cas d'usage

Pour qui, dans quel contexte

Deux univers, une même exigence : que chaque document, chaque échange, chaque idée soit retrouvable et exploitable.

Personnel
📁

Archives familiales

Actes, contrats, diagnostics, courriers administratifs — numérisés et reliés, retrouvables en quelques secondes.

Scribe Archiviste
🎙️

Carnet de bord audio

Notes vocales, idées en déplacement, journaux de projet — capturés, transcrits et liés par date et contexte.

Greffier Archiviste
🏠

Gestion patrimoniale

Devis, assurances, diagnostics immobiliers, factures — organisés par bien, liés aux intervenants et interrogeables.

Scribe Archiviste
📬

Mémoire d'un projet

Emails, notes et documents épars d'un projet centralisés dans un workspace structuré et interrogeable.

Scribe Greffier Archiviste
Professionnel
⚖️

Juridique & notariat

Dossiers liés aux parties, actes scannés indexés, correspondances reliées aux affaires — graphe clients/dossiers.

Scribe Archiviste
💼

Consultant & freelance

Comptes-rendus transcrits, propositions et livrables liés par mission et client — base IA-ready pour chaque dossier.

Greffier Scribe Archiviste
👥

RH & recrutement

Entretiens transcrits avec diarisation, CVs et emails liés aux candidats — suivi structuré, recherche contextuelle immédiate.

Greffier Scribe Archiviste
🔬

Recherche & analyse

Corpus documentaire, bibliographie, notes de terrain et enregistrements — base interrogeable en RAG local sans risque de fuite.

Scribe Greffier Archiviste

Workflow cible

Du fichier brut à la base de connaissances

Un pipeline en 4 étapes, entièrement local et automatisable.

01

Collecte

Greffier capture l'audio en tray (micro ou loopback). Scribe ingère documents et images via l'Explorateur Windows (clic droit).

Greffier · Scribe
02

Transcription & extraction

Whisper.cpp pour l'audio en local. Extracteurs natifs PDF, DOCX, MSG + OCR Tesseract pour PDF scannés et images PNG/JPG.

Whisper · Tesseract · OpenXml
03

Structuration YAML

Génération de sidecars YAML harmonisés : UUIDv7 persistants, schéma commun à 20 champs, liens explicites entre entités.

YamlDotNet · Schéma Superset
04

Contrôle + index IA

Archiviste valide l'intégrité du workspace entier et produit atomiquement INDEX_NODES, INDEX_EDGES, INDEX_LOOKUPS.

Archiviste · JSONL atomique

Applications

Trois outils complémentaires, indépendants

Chaque application se déploie et évolue seule. Elles coopèrent uniquement via le format de données partagé.

Archiviste

Noyau de gouvernance metadata : contrôle d'intégrité continu, édition via formulaires dynamiques, indexation atomique best-effort.

  • Détection : orphelins, YAML invalides, champs requis manquants, IDs dupliqués, liens vers entités inconnues
  • Réindexation atomique (write-then-rename) vers 3 fichiers JSONL
  • Formulaires dynamiques de création et d'édition de sidecars
  • Intégration Explorateur Windows (clic droit → Éditer / Créer sidecar)
  • Reindex automatique configurable avec détection de changements
Acheter

Scribe

Extraction de contenu depuis documents et images, production automatique de sidecars YAML compatibles Archiviste. Application tray, zéro fenêtre imposée.

  • Documents : PDF natif, PDF scanné (OCR), DOCX, DOC (LibreOffice), MSG (email Outlook)
  • Images : PNG, JPG/JPEG — OCR direct via Tesseract
  • Mise à jour du champ transcription sans écraser les autres champs existants
  • Traitement par lots depuis l'Explorateur Windows (clic droit sur fichier ou dossier)
  • Conversion DOC legacy via LibreOffice CLI (optionnel, non requis)
Acheter

Greffier

Enregistrement et transcription audio 100 % locale en mode tray, avec sortie MP3 + sidecar YAML directement indexable par Archiviste.

  • Capture simultanée micro et loopback système, gestion de sessions, reprise après incident
  • Transcription hors-ligne via Whisper.cpp — aucun envoi réseau, aucun compte requis
  • Diarisation optionnelle via tinydiarize (–tdrz) pour distinguer les locuteurs
  • Exports par session : MP3 (converti via Windows Media Foundation), TXT, SRT + sidecar YAML
  • Historique de sessions, re-transcription à la demande, gestion des erreurs
Acheter

Aperçu des interfaces

Discret, intégré, toujours actif

Des applications tray qui vivent dans votre barre des tâches — jamais dans votre chemin, toujours prêtes en arrière-plan.

Archiviste — Paramètres workspace
Interface Archiviste — configuration du workspace et des champs

Configuration des champs, intégration Explorateur, intervalle de réindexation

Greffier — Historique des sessions
Interface Greffier — historique des sessions d'enregistrement

Sessions horodatées, durée, retranscription à la demande, accès dossier

Format de données

Le sidecar YAML — format pivot de la suite

Lisible, versionnable, ouvert. Chaque fichier principal est accompagné de son sidecar qui porte le contexte, les métadonnées et les liens vers les autres entités.

contrat-client.pdf.yml
# Identifiant unique UUIDv7 — généré automatiquement, immuable
id: 01966a3f-77dd-7b2e-8d87-0185ad71eb40

file:   contrat-client.pdf
label:  Contrat de prestation 2026
type:   piece
domain: juridique
status: a_valider
priority: haute

date_created: 2026-03-02
date_updated: 2026-03-02

summary: Contrat cadre signé pour les prestations de conseil 2026.

# Graphe de liens — personnes, projets, structures
links:
  persons:
    - id: 01966a40-0041-7e0d-90b2-cf7b8e151ea5
      label: Johan Haudiquet
      role: signataire
  projects:
    - id: 01966a40-11c2-71f0-a017-1d35fbe9f602
      label: Programme Creative Apps
      interest: fort

Stack technique

Robuste, éprouvé, orienté production

Des technologies reconnues pour des performances stables sur Windows natif — sans compromis sur la maintenabilité.

.NET 8

.NET 8 + C#

Exécutables autonomes Windows avec LTS, outillage mature et performances stables sur poste de travail réel.

WPF

WPF Tray Apps

Interface desktop native cohérente sur les 3 applications, thème harmonisé, comportement system tray prévisible.

Whisper

Whisper.cpp

Transcription audio locale dans Greffier — modèle medium, diarisation tinydiarize optionnelle, zéro réseau.

Tesseract

Tesseract OCR

Traitement des PDF scannés dans Scribe, activé à la demande sur les documents sans couche texte native.

LibreOffice

LibreOffice CLI

Conversion des fichiers .doc legacy vers .docx pour extraction propre dans le pipeline documentaire de Scribe.

JSONL

Index JSONL IA-ready

NODES, EDGES et LOOKUPS produits par Archiviste pour alimenter RAG, recherche sémantique et automatisations IA.

Architecture

Indépendance stricte, cohérence fonctionnelle

Trois applications qui coopèrent sans se coupler — une architecture pensée pour la durabilité et la maintenabilité.

Autonomie exécutable

Chaque application se construit, se déploie et évolue indépendamment des deux autres.

  • Build, publication et cycle de release séparés par composant
  • Aucune référence binaire inter-applications
  • Utilisable composant par composant selon le besoin

Contrat de données commun

Les trois apps convergent via des conventions de format, sans couplage technique direct.

  • Sidecars YAML avec schéma partagé (20 champs canoniques)
  • UUIDv7 harmonisés — immuables, traçables, ordonnés dans le temps
  • Expérience visuelle cohérente sur l'ensemble de la suite

Objectif IA sans interprétation

Constituer une base propre pour l'IA — sans décision automatique sur le sens des données.

  • NODES : contexte structuré, sans champ transcription massif
  • EDGES : graphe de liens explicites entre entités
  • LOOKUPS : vocabulaire normalisé pour prompts et classification IA

Multi-formats

Ce que la suite ingère et produit

Sept formats d'entrée, quatre de sortie — un seul schéma YAML en commun pour tout relier.

Scribe
Entrées
PDF natif PDF scanné DOCX DOC MSG PNG JPG / JPEG
OCR + extraction de texte → YAML
Sorties
.yml sidecar
Greffier
Entrées
Micro WASAPI Loopback système
Whisper.cpp → transcription + MP3
Sorties
MP3 TXT SRT .yml sidecar
Archiviste
Entrées
.yml sidecar .person.yml .project.yml .structure.yml
Validation + indexation atomique
Sorties
INDEX_NODES.jsonl INDEX_EDGES.jsonl INDEX_LOOKUPS.jsonl

Plateforme : Windows 10 / 11 x64 — exécutables self-contained WPF desktop, intégration système complète (tray, Explorateur, associations de fichiers), aucun runtime externe requis.

Tarifs

Choisissez par application ou la suite complète

Paiement unique, usage perpétuel : vous achetez une fois, la suite vous appartient définitivement.

Archiviste

40 € licence perpétuelle
  • Contrôle d'intégrité du workspace YAML
  • Indexation atomique NODES / EDGES / LOOKUPS
  • Formulaires dynamiques d'édition de sidecars

Scribe

40 € licence perpétuelle
  • Extraction documents (PDF, DOCX, DOC, MSG)
  • OCR images et PDF scannés (PNG, JPG)
  • Génération sidecars YAML compatibles Archiviste

Greffier

40 € licence perpétuelle
  • Capture audio micro + loopback en local
  • Transcription hors-ligne via Whisper.cpp
  • Exports MP3, TXT, SRT et sidecar YAML
Suite complète (Archiviste + Scribe + Greffier)
Les 3 applications, une seule licence perpétuelle, un seul achat.
Économie : 20 € (16,7 %) par rapport à 3 achats séparés
100 € paiement unique
Pour situer
Suite complète ramenée sur 12 mois 8,33 € / mois
Moins cher qu'un repas à l'extérieur ~8 à 14 €
Environ le prix de 2 cafés Starbucks à emporter ~7 à 10 €
Acheter la suite — 100 €

Auteur

Né d’un besoin concret, par quelqu’un qui le vit chaque jour

Identité

Johan HAUDIQUET

Formateur en logiciels professionnels

Passionné d’informatique & d’IA depuis l’enfance

Philosophie

Mon métier, c’est la formation. Je forme des équipes à des logiciels professionnels pour un éditeur — avec des exigences bien concrètes : conformité Qualiopi, traçabilité des sessions, preuves documentaires à retrouver parfois des mois plus tard. L’informatique m’accompagne depuis l’enfance — une passion, pas un métier. Mais les deux se nourrissent l’un l’autre.

Ce qui me passionne depuis quelques années, c’est le potentiel des IA et des automations pour transformer la gestion du savoir : l’idée d’un deuxième cerveau numérique — une base structurée, reliée, interrogeable, qu’on peut confier à un LLM pour retrouver un contexte, croiser des sources, extraire de la connaissance. Pour ça, les données doivent être propres, normées, cohérentes. Pas juste stockées.

J’ai cherché un outil combinant ingestion multi-formats, structuration locale et présence discrète. Il n’existait pas. Je l’ai construit — pour moi d’abord, parce que j’en avais besoin. Si vous partagez cette vision, vous y trouverez probablement ce qu’il vous faut aussi.