Name: Bioinformatics Initial Data Analysis
Author: OpenLAIR

Skills suchen.../

Bioinformatics Initial Data Analysis | Skills Pool

python3 scripts/run_pipeline.py <input_path> \
    [--data-type auto|cytof|scrnaseq|flow] \
    [--subsample 500] \
    [--output-dir ./analysis_output] \
    [--report-style clinical|technical]

analysis_output/
├── figures/                    # All generated plots (PNG)
├── processed/
│   └── adata_processed.h5ad   # Processed AnnData object
├── report.html                 # Complete analysis report
└── analysis_summary.json       # Machine-readable summary statistics

from step1_load_data import load_data
from step2_qc import run_qc
from step3_normalize import normalize_data
from step4_dim_reduction import run_dim_reduction
from step5_clustering import run_clustering
from step6_marker_analysis import run_marker_analysis
from step7_report import generate_report

Data Type	File Formats	Detection Pattern
scRNA-seq	`.h5ad`, `.h5` (10X), `.mtx` + barcodes	Gene names, count matrix
CyTOF	`.csv`, `.h5ad`	Phospho-markers (p.ERK, p.AKT, etc.)
Flow cytometry	`.fcs`, `.csv`	Surface markers, scatter channels

Data Type	File Formats	Detection Pattern
scRNA-seq	`.h5ad`, `.h5` (10X), `.mtx` + barcodes	Gene names, count matrix
CyTOF	`.csv`, `.h5ad`	Phospho-markers (p.ERK, p.AKT, etc.)
Flow cytometry	`.fcs`, `.csv`	Surface markers, scatter channels

Bioinformatics Initial Data Analysis

Supported Data Types

Approach 1: Full Pipeline (Recommended)

Bioinformatics Initial Data Analysis

Supported Data Types

Approach 1: Full Pipeline (Recommended)

Approach 2: Modular Steps

Pipeline Steps

Step 1: Data Loading

Step 2: Quality Control

Step 3: Normalization

Step 4: Dimensionality Reduction

Step 5: Clustering

Step 6: Marker Analysis

Step 7: Report Generation

Reference Files

Important Notes

Nanoclaw Repl

Bioinformatics

Smart Explore

Vector Database Engineer

Skin Health Analyzer

Scanpy