Pattern popularisé par Microsoft Research en 2024 dans le papier "From Local to Global: A Graph RAG Approach to Query-Focused Summarization" (Edge et al.). GraphRAG résout une limitation fondamentale du RAG vectoriel : comprendre globalement un corpus au lieu de juste retrouver des passages similaires.

Le problème du RAG vectoriel classique

Question : "Quelles sont les principales tendances de l'IA en 2025 selon ce corpus de 500 articles ?"

RAG vectoriel : récupère 5 chunks "similaires" → vue myope, pas de synthèse globale.

GraphRAG : extrait les entités (modèles, techniques, chercheurs, dates), construit le graphe, détecte les communautés (clusters thématiques), résume chaque communauté → réponse globale et structurée.

Architecture GraphRAG

[CORPUS]
   │
   ▼
┌────────────────────────┐
│  ENTITY EXTRACTION     │ ← LLM avec prompt structuré
│  (LLM)                 │   Output: entités + relations
└──────────┬─────────────┘
           │
           ▼
┌────────────────────────┐
│  GRAPH CONSTRUCTION    │ ← Neo4j / NetworkX / FalkorDB
│  Nodes + Edges         │
└──────────┬─────────────┘
           │
           ▼
┌────────────────────────┐
│  COMMUNITY DETECTION   │ ← Algorithme Leiden (multi-resolution)
│  (Leiden algorithm)    │
└──────────┬─────────────┘
           │
           ▼
┌────────────────────────┐
│  COMMUNITY SUMMARIES   │ ← LLM résume chaque communauté
│  (hierarchical LLM)    │   Niveau 0 (fine) → Niveau N (gros)
└──────────┬─────────────┘
           │
           ▼ (KB built, ready for queries)

[QUERY]
   │
   ▼
┌─────────────────────┐
│  QUERY CLASSIFIER   │
│  Local or Global ?  │
└─────────┬───────────┘
          │
   ┌──────┴──────┐
   │             │
   ▼             ▼
LOCAL          GLOBAL
SEARCH         SEARCH
(entity        (community
 subgraph)      summaries)
   │             │
   └──────┬──────┘
          │
          ▼
      [LLM Generate]
          │
          ▼
       [ANSWER]

Outil	Type	Avantages
Neo4j	Graph DB mature	Cypher, AuraDB managed, écosystème
FalkorDB	Redis-based, ultra-rapide	-90% hallucinations claimed, low-latency
Memgraph	In-memory, streaming	Real-time analytics
NetworkX	Python in-memory	Prototypage, petits graphes
Kùzu	Embedded, columnar	Embarqué dans l'app, fast analytical
TigerGraph	Distributed enterprise	Très gros graphes

Métrique	Vector RAG	GraphRAG	Gain
Comprehensiveness	baseline	+72%	Réponses plus complètes
Diversity	baseline	+62%	Moins de redondance
Empowerment (insight)	baseline	+52%	Plus actionnable

Pattern	Best for	Latency	Cost build	Cost query
Vector RAG	Fact lookup, similarité sémantique	Bas (~100ms)	Bas (embeddings)	Bas
Hybrid RAG	Mixed needs, BM25 + vector	Bas (~150ms)	Bas	Bas
GraphRAG	Global summarization, narrative	Modéré (~1-5s)	Élevé (LLM extraction)	Modéré
Local GraphRAG	Entity-centric Q&A	Bas-Modéré	Élevé	Bas
Global GraphRAG	Theme synthesis, cross-doc	Élevé (~5-30s)	Élevé	Élevé

Framework	Auteur	Avantages	Inconvénients
Microsoft GraphRAG	Microsoft Research	Implémentation officielle, mature	Lourd, coûteux
LightRAG	HKU 2024	5x plus rapide que MS GraphRAG, dual-level retrieval	Moins de features
Neo4j GraphRAG (Python lib)	Neo4j	Stack Neo4j, mature	Lock-in Neo4j
FalkorDB GraphRAG	FalkorDB	Ultra-low latency, -90% hallucinations	Newer ecosystem
Nano-GraphRAG	community	Lightweight, ~800 lignes Python	MVP only
ms-graphrag-mcp	community	MCP server pour Claude Code	Wrap MS GraphRAG

GraphRAG (Graph-based RAG)

GraphRAG (Graph-based RAG)

Le problème du RAG vectoriel classique

Architecture GraphRAG

Composants

1. Entity & Relationship Extraction

2. Graph storage

3. Community Detection (Leiden)

4. Community Summarization

5. Query Routing

6. Local Search

7. Global Search

Gains mesurés (papier Microsoft)

GraphRAG vs Vector RAG vs Hybrid

Frameworks production

Pipeline minimal (Microsoft GraphRAG)

Coût et latence

Quand utiliser GraphRAG

Anti-patterns

GraphRAG + vector hybride

Quand déléguer

Ressources

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling