Name: Fc Optimize Mongodb
Author: fchastanet

スキルを検索.../

{
  "metadata": {
    "date": "YYYY-MM-DD",
    "api_python": {"branch": "...", "commit": "..."},
    "kafka_consumer": {"branch": "...", "commit": "..."}
  },
  "collections": {
    "music": {"has_indexes": true, "query_count": 15, "obsolete": false},
    "music_preference": {"has_indexes": true, "query_count": 0, "obsolete": true}
  },
  "queries": [
    {
      "collection": "music",
      "file": "api_python/routers/user_music_preferences.py",
      "line": 27,
      "type": "find",
      "code": "await Music.find(In(Music.id, unique_music_ids)).count()"
    }
  ],
  "summary": {
    "total_collections": 10,
    "collections_with_queries": 7,
    "obsolete_collections": 3,
    "total_queries": 65
  }
}

{
  "coverage": [
    {
      "query_id": "music_find_by_ids",
      "collection": "music",
      "fields_used": ["id"],
      "index_used": "name_unique_idx",
      "status": "🪛 TO CHECK",
      "reason": "Using _id field, default index should work",
      "recommendation": "Verify with explain() in production"
    },
    {
      "query_id": "pending_reco_by_music_id",
      "collection": "pending_user_recommendation",
      "fields_used": ["music_urn"],
      "index_used": "music_urn_idx",
      "status": "✅ Full",
      "reason": "Exact index match"
    }
  ],
  "missing_indexes": [
    {
      "collection": "pending_user_recommendation",
      "query": "PendingUserRecommendation.find({music_urn: urn}).update_many()",
      "fields": ["music_urn"],
      "severity": "🔴 CRITICAL",
      "reason": "Kafka consumer update_many without index"
    }
  ],
  "schema_issues": [
    {
      "collection": "music",
      "issue": "missing_timestamps",
      "missing_fields": ["created_at", "updated_at"],
      "severity": "🔥 HIGH"
    }
  ],
  "summary": {
    "full_coverage": 45,
    "to_check": 12,
    "missing_index": 8,
    "schema_issues": 2
  }
}

{
  "optimizations": [
    {
      "type": "partial_index_for_instrument",
      "collection": "music",
      "current": {
        "code": "{\"keys\": [(\"instrument\", 1)], \"sparse\": True}",
        "issue": "Indexing entire 1536-dimensional instrument for existence check"
      },
      "proposed": {
        "python": "python code here",
        "mongosh": "mongosh code here",
        "benefit": "90% index size reduction, same query performance"
      },
      "priority": "📀 OPTIMIZATION",
      "migration": "Can be done online, no downtime"
    }
  ],
  "kafka_consumer_drift": [
    {
      "collection": "playlist",
      "api_python_fields": ["field1", "field2", "created_at"],
      "kafka_consumer_fields": ["field1", "field2"],
      "missing_in_kafka": ["created_at"],
      "severity": "🔥 HIGH",
      "recommendation": "Create shared models package"
    }
  ],
  "covered_queries": [
    {
      "query": "UserRecommendation.find(...).project(music_urn, score)",
      "current_index": ["user_urn", "is_recommendable", "score"],
      "add_to_index": ["music_urn"],
      "benefit": "Index-only scan, no document fetch"
    }
  ],
  "summary": {
    "partial_index_opportunities": 2,
    "covered_query_opportunities": 3,
    "kafka_drift_issues": 4
  }
}

# BEFORE (inefficient):
{"keys": [("instrument_structure", pymongo.ASCENDING)], "sparse": True}

# AFTER (optimized):
{"keys": [("_id", pymongo.ASCENDING)],
 "partialFilterExpression": {"instrument_structure": {"$exists": True}},
 "name": "instrument_structure_exists_partial_idx"}

# Query projects: music_urn, score
# Index: user_urn, playlist_is_recommendable, score
# Optimization: Add music_urn to index for covered query

// Example for music_urn single-field query
db.musics_instances.find({
  music_urn: "urn:music:xyz123"
}).explain("executionStats")

// Check for:
// - totalDocsExamined vs nReturned ratio
// - executionTimeMillis < 100ms threshold
// - indexName used by query planner

Fc Optimize Mongodb | Skills Pool

Fc Optimize Mongodb

Fc Optimize Mongodb

🚀 Phased Execution Strategy

Execution Workflow

Phase Breakdown

Scope and Source of Truth

Pre-Analysis Checks (Phase 1 only)

📋 Phase 1: Discovery & Inventory (2-3 min)

Objectives

Actions

Output Format (save to /memories/session/mongodb-analysis-phase1.json)

Phase 1: Summary Output

🎯 Phase 2: Index Coverage Analysis (2-3 min)

Phase 2: Prerequisites

Phase 2: Objectives

Phase 2: Actions

Output Format (save to /memories/session/mongodb-analysis-phase2.json)

Phase 2: Summary Output

🔧 Phase 3: Index Optimization Analysis (2-3 min)

Phase 3: Prerequisites

Phase 3: Objectives

Phase 3: Actions

Output Format (save to /memories/session/mongodb-analysis-phase3.json)

Phase 3: Summary Output

📄 Phase 4: Report Generation (1-2 min)

Phase 4: Prerequisites

Phase 4: Objectives

Phase 4: Actions

Report Structure

Phase 4: Summary Output

Analysis Checklist (Reference for All Phases)

1. Repository Metadata

2. Query Inventory

3. Obsolete Collection Detection

4. Schema Consistency Checks

4.1 Timestamp Consistency

5. Index Analysis

5.1 Index Coverage

5.2 Index Optimization Patterns

5.3 Index Type Optimization

5.4 Index Report format

6. Query Optimization

7. Production Verification Strategy

8. Schema Improvements

9. Kafka Consumer Inconsistencies

11. Report Structure

12. PlantUML Diagrams

13. Code Snippets

14. Consider These Specific Patterns

Priority Matrix

Anti-Patterns to Avoid

Success Criteria

🎮 Execution Logic

Phase Detection

Session Memory Management

Error Handling

Processing Workflow

For Each Phase Execution

Quick Validation Checklist (Before Phase 4 Report)

Performance Guidelines

Vector Index Tuning

Azure Resource Manager Redis Dotnet

Redis Expert

Elasticsearch

Cache Expert

Abp Mongodb

Output Format (save to `/memories/session/mongodb-analysis-phase1.json`)

Output Format (save to `/memories/session/mongodb-analysis-phase2.json`)

Output Format (save to `/memories/session/mongodb-analysis-phase3.json`)