M
Mnemia
Solution prête à être déployée · v0.1 — mai 2026

Vos documents internes et vos données entreprise, interrogeables en langage naturel.

Mnemia est une solution RAG souveraine (génération augmentée par récupération) qui transforme vos fichiers PDF, Excel, Texte, PowerPoint et Word en base de connaissances, interrogeable en langage naturel.

Installation Windows en un clic, traitement 100 % local, réponses et citations vérifiables.

Vos données ne quittent jamais votre infrastructure.

100 % on-premise
Aucun envoi cloud
Citations vérifiables
Benchmarks mesurés · mai 2026

La précision qu'une entreprise attend.
Pas celle d'un chatbot grand public.

Mnemia est validé sur deux corpus d'évaluation — documents entreprise HAAPII Services et corpus PDF FinePDFs. Voici les scores réels, pas des promesses.

100 % local
0,0 %
Questions courantes
gpt-oss:20b

Sur un corpus de PDFs métier (lookup direct + difficulté moyenne), la précision dépasse 97 %. C'est ce que 80 % de vos utilisateurs constaterons au quotidien.

100 % local
0,0 %
Toutes difficultés confondues
gpt-oss:20b

Sur le banc d'évaluation complet (questions simples, intermédiaires et très complexes sur classeurs Excel multi-feuilles), la version 100 % locale apporte une réponse fiable dans 75% des cas, sinon elle vous dira qu'elle n'a pas trouvé de réponse pertinente.

Cloud dédié
0,0 %
Toutes difficultés confondues
gpt-oss:120b

En passant sur un modèle open-source plus puissant (120 milliards de paramètres) hébergé sur cloud dédié SecNumCloud, la précision grimpe à 84 % — sans jamais renoncer à la souveraineté.

Méthodologie : pipeline identique sur les 3 runs (P1 query-rewriting + P4 reranking bge-m3 GPU, embedder bge-m3 LocalTorch). Scoring automatique sur 90 questions de référence. Détails sur la page Optimisations.

De vos fichiers à la réponse sourcée

Comment fonctionne Mnemia ?

Deux flux de travail autour d'une même base de connaissances :
d'abord l'indexation de vos documents, puis l'interrogation en langage naturel.

1

Indexation des fichiers : Mnemia Watcher

1

Clic droit dans l'explorateur

Sélectionnez un ou plusieurs fichiers/dossiers depuis l'explorateur Windows, puis faites un clic droit « Indexer avec Mnemia ». Tous les formats bureautiques sont pris en charge.

PDFPPTXDOCXXLSXTXTMD
Mnemia +
  • Menu contextuel WindowsIntégration native à l'explorateur : indexez un fichier, une multi-sélection ou un dossier entier d'un clic droit, sans ouvrir d'interface.
2

Mnemia Watcher

Le service indexe les fichiers, suit leurs modifications et les ré-indexe automatiquement en cas de modification.

Mnemia +
  • Watcher Rust résilientSurveillance temps réel et ré-indexation automatique à chaque modification, avec auto-skip des fichiers corrompus pour ne jamais bloquer le pipeline.
3

Découpage en morceaux

Chaque document est segmenté en chunks sémantiques cohérents.

Mnemia +
  • Chunker xlsx spécifiqueDécoupage « block-first » des classeurs Excel multi-feuilles : en-têtes détectés automatiquement, agrégations pluriannuelles (CA par exercice, marges multi-zones) enfin fiables.
  • Lecteur pptx et xlsx augmentésLecture réelle des slides, titres et notes PowerPoint, et sérialisation lisible des tableaux Excel avec leurs en-têtes — là où les RAG classiques échouent.
  • +4 à +10 points de précisionEn fonction de la complexité du fichier et de la question
4

Vectorisation

Chaque chunk est converti en vecteur mathématique par l'embedder bge-m3.

Mnemia +
  • Métadonnées + recherche hybrideEn plus du vecteur, chaque chunk stocke des métadonnées : mots-clés rares (noms propres, acronymes, références - fortement pondérés en BM25), libellés et contexte parent. La recherche hybride mêle alors sémantique et correspondance lexicale exacte — un terme précis n'est plus manqué et le filtrage est plus fin.
  • +3 points de précision
5

Stockage Weaviate

Les vecteurs sont rangés dans la base vectorielle locale.

Base de connaissances
Base vectorielle Weaviate · 100 % locale
2

Interrogation de la base de connaissances : Mnemia Chat

1

Question utilisateur

L'utilisateur pose une question en langage naturel dans le chat.

Mnemia +
  • Chat mnemia + historique + dictée vocaleConversations historisées et consultables, et dictée vocale (faster-whisper local) pour poser ses questions à l'oral.
2

Recherche sémantique

La question est vectorisée puis comparée aux chunks de la base.

Mnemia +
  • Query rewritingMnemia reformule d'abord la question (synonymes métier, noms propres normalisés, période explicitée) pour matcher le vocabulaire des documents.
  • +4 points de précision
3

Récupération des passages

Les extraits les plus pertinents sont remontés et reclassés.

Mnemia +
  • Reranking bge-m3Un reranker cross-encoder réordonne les chunks par pertinence réelle ; seuls les plus pertinents sont transmis au LLM, qui n'est plus pollué par du bruit.
  • +8 points de précision
4

Enrichissement du prompt

La question et les extraits sont assemblés en un prompt contextualisé.

Mnemia +
  • Agentic toolsMnemia fournit au LLM des outils agentiques (filtrer, agréger, sommer, ...) pour réaliser des calculs sur vos données au lieu d'inventer les chiffres — réponses traçables et sans hallucination.
  • +5 à +9 points de précisionEn fonction de la complexité de la question
5

Génération par le LLM

Le modèle rédige une réponse appuyée sur le contexte fourni.

Mnemia +
  • Modèle local ou cloud dédiéAu choix : 100 % local (gpt-oss, qwen3.5, ...) ou modèles puissants sur cloud dédié pour les questions complexes. Vos données ne quittent jamais votre infrastructure.
6

Réponse finale

Une réponse fiable, précise et sourcée — avec citations vérifiables.

Mnemia +
  • Sources vérifiablesVue détaillée des extraits cités et ouverture directe des fichiers sources d'un simple clic — chaque réponse est vérifiable.

Partout où vous voyez cette étincelle, Mnemia enrichit l'étape standard d'un RAG avec ses propres optimisations : c'est ce qui sépare une réponse approximative d'une réponse précise, sourcée et fiable.
Un RAG classique se contente des étapes de base (63% de précision en moyenne) — Mnemia gagne des points de précision à chacune d'elles (entre 75.6% et 97.5% de précision en moyenne). Voir les 12 optimisations en détail.

Comprendre ce qu'apporte un RAG

Un ChatGPT générique ne connaît pas votre entreprise.
Mnemia, si.

Les grands modèles de langage sont entraînés sur des corpus de texte généralistes et publics : ils n'ont aucune idée de vos process, de vos contrats, de vos KPIs ou de votre histoire. La génération augmentée par récupération (RAG) résout cela en connectant le modèle à vos propres documents — sans jamais les exposer à l'extérieur.

LLM seul

« Je ne sais pas répondre… ou je vais inventer. »

Question

« Quel est le CA cumulé de notre filiale sur les 6 dernières années ? »

Réponse

« Je ne dispose pas d'informations spécifiques sur votre filiale. À titre indicatif, vous pourriez consulter vos rapports annuels… »

  • Connaissances figées à la date d'entraînement
  • Ne connaît rien de votre activité interne
  • Risque d'hallucinations (réponses inventées)
  • Aucune traçabilité des sources

LLM + Mnemia

« Voici la réponse, avec les sources. »

Question

« Quel est le CA cumulé de notre filiale sur les 6 dernières années ? »

Réponse

« 12,4 M€ cumulés sur 2019-2024 : Nord 4,8 M€ · Sud 4,1 M€ · Ouest 2,2 M€ · Est 1,3 M€ — source : KPIs_consolidés_2024.xlsx, 6 feuilles annuelles. »

  • Réponses construites à partir de VOS documents
  • Citations vérifiables des sources
  • Aucune invention : si l'info n'existe pas, le système le dit
  • Toujours à jour : indexation continue par le watcher mnemia

« La génération augmentée par récupération permet à un LLM de consulter vos données d'entreprise en temps réel avant de fournir une réponse. Outre la contextualisation des modèles génératifs, le RAG permet d'améliorer la traçabilité de l'information et de supprimer le risque d'hallucinations. »

Direction Générale des Entreprises — Guide RAG, novembre 2024

Télécharger le Guide RAG de la DGE

L'expérience

Vos documents — et eux seuls — sont les sources de la réponse.

Un LLM classique répond à partir de ses connaissances pré-entraînées, figées à une date donnée et étrangères à votre activité. Mnemia inverse la logique : à chaque question, le modèle ne s'appuie que sur les passages réellement extraits de vos documents internes, et chaque réponse cite ses sources. Pas d'invention, pas de connaissance externe — uniquement ce qui est écrit dans votre corpus.

M
Mnemia · Chatqwen3.5:latest · local
Quel est le CA cumulé sur les 6 dernières années, et la répartition par zone ?
search_rag(query: « CA par zone, exercices 2019-2024 »)
aggregate_field(field: CA, op: sum, group_by: Zone × Exercice)

Sur les 6 derniers exercices (2019-2024), le chiffre d'affaires cumulé s'élève à 12,4 M€, réparti ainsi :

  • Zone Nord : 4,8 M€ (38,7 %)
  • Zone Sud : 4,1 M€ (33,1 %)
  • Zone Ouest : 2,2 M€ (17,7 %)
  • Zone Est : 1,3 M€ (10,5 %)
KPIs_consolidés_2024.xlsx·6 feuilles annuelles
M
Mnemia · Chatgpt-oss:120b · cloud dédié
Quelle a été l'évolution de la rémunération annuelle brute de Claire Doe depuis son embauche jusqu'à aujourd'hui ?
search_rag(query: « rémunération Claire Doe contrat avenants historique »)
parse_chunks(entity: salaire brut annuel, ordered_by: date)

La rémunération brute annuelle de Claire Doe a évolué comme suit :

  • 12/03/2018 — embauche en CDI : 32 000 €
  • 01/2020 — avenant 1 (revalorisation) : 35 500 € (+10,9 %)
  • 06/2022 — avenant 2 (promotion responsable d'équipe) : 39 000 € (+9,9 %)
  • 01/2024 — avenant 3 (revalorisation) : 42 500 € (+9,0 %)

Soit une progression de +32,8 % sur 6 ans.

CDI_Claire_DOE_2018-03-12.pdf·art. 5
Avenant_1_Claire_DOE_2020-01.pdf
Avenant_2_Claire_DOE_2022-06.pdf
Avenant_3_Claire_DOE_2024-01.pdf

Récapitulatif

Six raisons d'équiper votre entreprise.

Conçu pour les organisations qui ne peuvent pas — ou ne veulent pas — confier leurs documents à un cloud tiers.

Souveraineté totale

Vos documents ne quittent jamais votre poste. Pas de cloud imposé, pas de télémétrie, pas de fuite. RGPD by design.

Installation Next-Next-Finish

Un installeur Windows EXE unique. Aucun Docker, aucun Python à installer, aucune ligne de commande. Service prêt en moins de 10 minutes.

Multi-format

PDF, Excel multi-feuilles, PowerPoint, Word, Markdown, texte. Le BasicReader Mnemia comprend même les supports PPTX que certains RAG basiques ne savent pas gérer.

Hybride local / cloud

Embedding bge-m3 100 % local (GPU torch direct). LLM au choix : gpt-oss:20b fourni par défaut en modèle local, ou bien tout autre modèle local de votre choix, ou bien encore un modèle puissant en cloud dédié, ou fonctionnement hybride selon la sensibilité de la question. Tout est possible !

Watcher temps réel

Dépose un fichier dans un dossier surveillé, il est indexé. Menu contextuel Windows pour indexation à la demande. Auto-skip des fichiers corrompus.

Personnalisable

Choix des modèles (réponse standard / approfondie), gestion des clés API par provider, dictée vocale configurable (Speech To Text), dark/light mode,...

Souveraineté clé en main

Un supercalculateur IA souverain, posé sur un bureau.

Pour les organisations qui exigent la souveraineté la plus stricte, nous livrons Mnemia clé en main sur un NVIDIA DGX Spark — un supercalculateur IA de la taille d'un livre. Les modèles open-weight les plus puissants tournent 100 % en local, au service de toute une équipe, sans qu'aucune donnée ne quitte vos locaux.

128 Go de mémoire unifiéeJusqu'à 200 Md de paramètres en local1 PFLOP de calcul IA240 W · 1,2 kg
  • 100 % sur site : ni vos documents, ni votre base de connaissance, ni vos questions ne sortent de vos locaux. La souveraineté la plus stricte possible.
  • Les LLM open-weight les plus puissants — jusqu'à gpt-oss:120b — s'exécutent entièrement en local sur la box.
  • Une seule box au service de plusieurs utilisateurs simultanés : dimensionnée pour une équipe, pas un poste isolé.
  • Serveur de fichiers intégré : la box centralise au passage vos documents ET la base de connaissances en un point unique, partagé par toute l'équipe.
  • La puissance d'un cluster GPU, sans abonnement cloud ni facturation à l'usage.

Évolutif : deux DGX Spark se chaînent via leur lien réseau 200 Gb/s pour servir des modèles encore plus grands (jusqu'à 405 Md de paramètres).

NVIDIA DGX Spark posé sur un bureau à côté d'un ordinateur portable — supercalculateur IA personnel exécutant Mnemia en local
Tout-en-un · zéro paramétrage

Un installateur Windows. Trois composants. Aucune ligne de commande.

Vous lancez Mnemia-Setup.exe, vous cliquez sur « Suivant » jusqu'au bout, et votre RAG d'entreprise est opérationnel. Aucun Docker à maintenir, aucun Python à installer, aucun serveur à provisionner — tout tourne en service Windows sur le poste de votre choix.

1

Mnemia Watcher

Indexation continue, supervisée depuis votre barre des tâches.

Un module Windows en arrière-plan qui surveille vos dossiers et fichiers indexés. Dès qu'un fichier est créé, modifié ou supprimé, il est ré-indexé automatiquement. Une icône dans le system tray vous montre l'avancement en temps réel — et permet d'indexer un fichier ou un dossier d'un simple clic droit dans l'explorateur.

  • Surveillance temps réel des dossiers et fichiers cibles
  • Indexation à la demande depuis le menu contextuel Windows
  • Skip automatique des fichiers corrompus
2

Base vectorielle locale

Vos documents sont stockés sous forme de « mémoire » interrogeable.

Chaque document est découpé en morceaux sémantiques (chunks) puis converti en vecteurs mathématiques par notre embedder bge-m3. Ces vecteurs sont stockés dans une base de données vectorielle locale (Weaviate) qui tourne directement sur votre poste. Aucun envoi vers un serveur tiers, jamais.

  • Embedder GPU local (bge-m3 multilingue, 1024 dimensions)
  • Recherche hybride sémantique + mots-clés
  • Données 100 % cantonnées à votre machine
3

Chat Mnemia

L'interface où vos collaborateurs posent leurs questions.

Une interface web moderne accessible depuis le navigateur, qui ressemble à ChatGPT — mais dont les réponses ne proviennent que de vos documents internes. Conversation contextuelle, citations cliquables, choix du modèle (local ou cloud dédié), historique consultable.

  • Citations cliquables vers les documents sources
  • Modèles au choix : 100 % local ou cloud dédié
  • Historique de conversations consultable

Un seul fichier. Moins de 10 minutes.

L'assistant d'installation détecte automatiquement votre GPU, télécharge les modèles (embedding, reranker, LLM local, dictée vocale) et installe le service Windows puis démarre les composants.

Pas d'administrateur réseau, pas de cluster à provisionner. Votre solution RAG est prête en 10 minutes.

Signature EV (Sectigo / DigiCert)Détection GPU automatiqueService Windows LocalSystemDésinstallation propre

Passez à l'action

Et si on lançait Mnemia sur vos documents ?

Nous installons une instance Mnemia sur l'un de vos postes ou un environnement de test, indexons un échantillon de votre corpus et vous montrons les réponses obtenues sur vos vraies données — en 1 à 2 jours, sans engagement.

Démo en 1 à 2 jours
Sans engagement
Réponse sous 48 h