Architecture Deep Dive

System Overview

┌─────────────────────────────────────────────────────┐
│           Claude Desktop / MCP Client               │
└────────────────┬────────────────────────────────────┘
                 │ STDIO Transport (JSON-RPC)
                 ▼
┌─────────────────────────────────────────────────────┐
│           MCP Java SDK (STDIO Transport)            │
│  ┌──────────────────────────────────────────────┐   │
│  │        LuceneSearchTools (MCP Tools)         │   │
│  └──────────────────────────────────────────────┘   │
└─────────┬───────────────────────────┬───────────────┘
          │                           │
          ▼                           ▼
┌──────────────────────┐    ┌──────────────────────┐
│  LuceneIndexService  │    │ DocumentCrawler      │
│  - Search & Index    │    │ Service              │
│  - NRT Manager       │    │ - File Discovery     │
│  - Admin Operations  │    │ - Content Extraction │
└──────────┬───────────┘    └──────────┬───────────┘
           │                           │
           ▼                           ▼
┌─────────────────────────────────────────────────────┐
│              Apache Lucene 10.3 + Apache Tika       │
└─────────────────────────────────────────────────────┘

System Overview

┌─────────────────────────────────────────────────────┐ │ Claude Desktop / MCP Client │ └────────────────┬────────────────────────────────────┘ │ STDIO Transport (JSON-RPC) ▼ ┌─────────────────────────────────────────────────────┐ │ MCP Java SDK (STDIO Transport) │ │ ┌──────────────────────────────────────────────┐ │ │ │ LuceneSearchTools (MCP Tools) │ │ │ └──────────────────────────────────────────────┘ │ └─────────┬───────────────────────────┬───────────────┘ │ │ ▼ ▼ ┌──────────────────────┐ ┌──────────────────────┐ │ LuceneIndexService │ │ DocumentCrawler │ │ - Search & Index │ │ Service │ │ - NRT Manager │ │ - File Discovery │ │ - Admin Operations │ │ - Content Extraction │ └──────────┬───────────┘ └──────────┬───────────┘ │ │ ▼ ▼ ┌─────────────────────────────────────────────────────┐ │ Apache Lucene 10.3 + Apache Tika │ └─────────────────────────────────────────────────────┘

Limitation	Reason	Workaround
Lexical search only	Simplicity, no ML dependencies	AI generates OR queries for synonyms
Single-node only	Target: personal document collections	Vertical scaling
STDIO only	Claude Desktop requirement	Could add SSE transport
No auth	Single-user desktop deployment	OS-level sandboxing

Architecture

Architecture Deep Dive

System Overview

Architecture

Architecture Deep Dive

System Overview

Design Decisions

Why Plain Java (no Spring)?

Why STDIO Transport?

Why Multi-Analyzer Pipeline?

Processing Patterns

Batch Processing

NRT (Near Real-Time) Optimization

Configuration Priority

Admin Operations Pattern

Crawler Architecture

MCP Response Token Budget

Limitations (Design Constraints)

Future Enhancement Ideas

Obsidian Vault Maintainer

Notion

Things Mac

Gemini

Openclaw Pr Maintainer

Feishu Wiki