스킬 파일

Scaffold Connector

Name: Scaffold Connector
Author: open-metadata

Build a new OpenMetadata connector from scratch — scaffold JSON Schema, Python boilerplate, and AI context using schema-first architecture with code generation across Python, Java, TypeScript, and auto-rendered UI forms.

open-metadata11,162 스타2026. 3. 10.

직업
카테고리: Backend

스킬 내용

OpenMetadata Connector Building Skill

When to Activate

When a user asks to build, create, add, or scaffold a new connector, source, or integration for OpenMetadata.

Core Insight

One JSON Schema definition cascades through 6 layers: Python Pydantic models, Java models, UI forms (RJSF auto-render), API validation, test fixtures, and documentation. Define the schema once — everything else is generated or guided.

Workflow: 7 Phases

Phase 0: ENVIRONMENT — Set Up Python Dev Environment

Before any make or python commands, set up the environment from the repo root:

python3.11 -m venv env
source env/bin/activate
make install_dev generate

관련 스킬

Scaffold Connector | Skills Pool

source env/bin/activate
metadata scaffold-connector

metadata scaffold-connector \
  --name my_db \
  --service-type database \
  --connection-type sqlalchemy \
  --scheme "mydb+pymydb" \
  --auth-types basic \
  --capabilities metadata lineage usage profiler \
  --docs-url "https://docs.example.com/api" \
  --sdk-package "mydb-sdk" \
  --docker-image "mydb/mydb:latest" \
  --docker-port 5432

Service Type	Base Class	Reference
`database`	`CommonDbSourceService`	`mysql/`
`dashboard`	`DashboardServiceSource`	`metabase/`
`pipeline`	`PipelineServiceSource`	`airflow/`
`messaging`	`MessagingServiceSource`	`kafka/`
`mlmodel`	`MlModelServiceSource`	`mlflow/`
`storage`	`StorageServiceSource`	`s3/`
`search`	`SearchServiceSource`	`elasticsearch/`
`api`	`ApiServiceSource`	`rest/`

Agent: openmetadata-skills:connector-researcher
Prompt: "Research {source_name} for an OpenMetadata {service_type} connector.
Find: API docs, auth methods, key endpoints, pagination, rate limits, SDK packages."

Step	File	Change
1	`openmetadata-spec/.../entity/services/{serviceType}Service.json`	Add to type enum + connection oneOf
2	`openmetadata-ui/.../utils/{ServiceType}ServiceUtils.tsx`	Import schema + add switch case
3	`openmetadata-ui/.../locale/languages/`	Add i18n display name keys

# Ensure environment is active and tools are installed
source env/bin/activate
pip install -e ".[dev]" 2>/dev/null || make install_dev

# Generate models from schemas
make generate                                # Python Pydantic models
mvn clean install -pl openmetadata-spec      # Java models
cd openmetadata-ui/src/main/resources/ui && yarn parse-schema  # UI schemas

# Format ALL code (mandatory before commit)
cd /path/to/repo/root
make py_format                               # black + isort + pycln
mvn spotless:apply                           # Format Java

python skills/connector-review/scripts/analyze_connector.py {service_type} {name}

[ ] JSON Schema: validates, $ref resolves, supports* flags correct
[ ] JSON Schema: auth fields required when service mandates authentication
[ ] JSON Schema: SSL/TLS config included for HTTPS connectors
[ ] Code gen: make generate + mvn install + yarn parse-schema succeed
[ ] Connection: creates client, test_connection passes all steps
[ ] Source: create() validates config type, ServiceSpec is discoverable
[ ] Pydantic models: populate_by_name=True on all aliased models
[ ] Client: all list endpoints paginate (check API docs for pagination support)
[ ] Client: dict lookups in prepare(), not list iteration per entity
[ ] Lineage: no wildcard table_name="*" — skip if no table-level info available
[ ] Tests: unit + connection integration + metadata integration pass (no empty stubs)
[ ] Formatting: make py_format + mvn spotless:apply pass with no changes
[ ] Cleanup: CONNECTOR_CONTEXT.md is gitignored (verify it's not staged)
[ ] Cleanup: no leftover TODO scaffolding comments

./docker/run_local_docker.sh -m ui -d mysql -s false -i true -r true

./docker/run_local_docker.sh -m ui -d mysql -s true -i true -r false

# Run the static analyzer
analysis=$(python skills/connector-review/scripts/analyze_connector.py {service_type} {name} --json)

# Create PR with quality summary in description
gh pr create --title "feat(ingestion): Add {Name} {service_type} connector" --body "$(cat <<'EOF'
## Summary
- New {service_type} connector for {Name}
- Capabilities: {list capabilities}

## Test plan
- [ ] Unit tests pass (`pytest ingestion/tests/unit/topology/{service_type}/test_{name}.py`)
- [ ] Integration tests pass
- [ ] Local Docker test: connector appears in UI, test connection passes

## Connector Quality Review

**Verdict**: {VERDICT} | **Score**: {SCORE}/10

| Category | Score |
|----------|-------|
| Schema & Registration | X/10 |
| Connection & Auth | X/10 |
| Source, Topology & Performance | X/10 |
| Test Quality | X/10 |
| Code Quality & Style | X/10 |

**Blockers**: 0 | **Warnings**: {count} | **Suggestions**: {count}

<details>
<summary>Static analysis output</summary>

{paste analyze_connector.py output here}

</details>

🤖 Generated with [Claude Code](https://claude.com/claude-code)
EOF
)"

Standard	Content
`main.md`	Architecture overview, connector anatomy, service types
`patterns.md`	Error handling, logging, pagination, auth, filters
`testing.md`	Unit test patterns, integration tests, pytest style
`code_style.md`	Python style, JSON Schema conventions, naming
`schema.md`	Connection schema patterns, $ref usage, test connection JSON
`connection.md`	BaseConnection vs function patterns, SSL, client wrapper
`service_spec.md`	DefaultDatabaseSpec vs BaseSpec
`registration.md`	Service enum, UI utils, i18n
`performance.md`	Pagination, batching, rate limiting
`memory.md`	Memory management, streaming, OOM prevention
`lineage.md`	Lineage extraction methods, dialect mapping, query logs
`sql.md`	SQLAlchemy patterns, URL building, auth, multi-DB
`source_types/*.md`	Service-type-specific patterns

Reference	Content
`architecture-decision-tree.md`	Service type, connection type, base class selection
`connection-type-guide.md`	SQLAlchemy vs REST API vs SDK client
`capability-mapping.md`	Capabilities by service type, schema flags, generated files

Scaffold Connector

OpenMetadata Connector Building Skill

When to Activate

Core Insight

Workflow: 7 Phases

Phase 0: ENVIRONMENT — Set Up Python Dev Environment

Scaffold Connector

OpenMetadata Connector Building Skill

When to Activate

Core Insight

Workflow: 7 Phases

Phase 0: ENVIRONMENT — Set Up Python Dev Environment

Phase 1: SCAFFOLD — Generate Boilerplate

Phase 2: CLASSIFY — Understand the Source

Phase 3: RESEARCH — API/SDK Discovery

Phase 4: IMPLEMENT — Fill in the TODO Items

Phase 5: REGISTER — Integration Points

Phase 6: GENERATE & FORMAT — Run Code Generation and Formatting

Phase 7: VALIDATE — Run Static Analysis and Checklist

Phase 8: TEST LOCALLY — Deploy and Test in the UI

Phase 9: CREATE PR — Submit with Quality Summary

Standards Reference

References

Xurl

Acp Router

Coding Standards

Api Design

Mcp Server Patterns

Backend Patterns