Name: Bio Read Alignment Star Alignment
Author: GPTomics

搜索技能.../

Bio Read Alignment Star Alignment | Skills Pool

# Basic index generation
STAR --runMode genomeGenerate \
    --runThreadN 8 \
    --genomeDir star_index/ \
    --genomeFastaFiles reference.fa \
    --sjdbGTFfile annotation.gtf \
    --sjdbOverhang 100    # Read length - 1

# For 150bp reads, use sjdbOverhang=149
STAR --runMode genomeGenerate \
    --runThreadN 8 \
    --genomeDir star_index_150/ \
    --genomeFastaFiles reference.fa \
    --sjdbGTFfile annotation.gtf \
    --sjdbOverhang 149

# Paired-end alignment
STAR --runThreadN 8 \
    --genomeDir star_index/ \
    --readFilesIn reads_1.fq.gz reads_2.fq.gz \
    --readFilesCommand zcat \
    --outFileNamePrefix sample_ \
    --outSAMtype BAM SortedByCoordinate

STAR --runThreadN 8 \
    --genomeDir star_index/ \
    --readFilesIn reads.fq.gz \
    --readFilesCommand zcat \
    --outFileNamePrefix sample_ \
    --outSAMtype BAM SortedByCoordinate

# Two-pass mode for better novel junction detection
STAR --runThreadN 8 \
    --genomeDir star_index/ \
    --readFilesIn r1.fq.gz r2.fq.gz \
    --readFilesCommand zcat \
    --outFileNamePrefix sample_ \
    --outSAMtype BAM SortedByCoordinate \
    --twopassMode Basic

# Output gene counts (like featureCounts)
STAR --runThreadN 8 \
    --genomeDir star_index/ \
    --readFilesIn r1.fq.gz r2.fq.gz \
    --readFilesCommand zcat \
    --outFileNamePrefix sample_ \
    --outSAMtype BAM SortedByCoordinate \
    --quantMode GeneCounts

# ENCODE recommended settings
STAR --runThreadN 8 \
    --genomeDir star_index/ \
    --readFilesIn r1.fq.gz r2.fq.gz \
    --readFilesCommand zcat \
    --outFileNamePrefix sample_ \
    --outSAMtype BAM SortedByCoordinate \
    --outSAMunmapped Within \
    --outSAMattributes NH HI AS NM MD \
    --outFilterType BySJout \
    --outFilterMultimapNmax 20 \
    --outFilterMismatchNmax 999 \
    --outFilterMismatchNoverReadLmax 0.04 \
    --alignIntronMin 20 \
    --alignIntronMax 1000000 \
    --alignMatesGapMax 1000000 \
    --alignSJoverhangMin 8 \
    --alignSJDBoverhangMin 1

# For chimeric/fusion detection
STAR --runThreadN 8 \
    --genomeDir star_index/ \
    --readFilesIn r1.fq.gz r2.fq.gz \
    --readFilesCommand zcat \
    --outFileNamePrefix sample_ \
    --outSAMtype BAM SortedByCoordinate \
    --chimSegmentMin 12 \
    --chimJunctionOverhangMin 8 \
    --chimOutType Junctions WithinBAM SoftClip \
    --chimMainSegmentMultNmax 1

File	Description
*Aligned.sortedByCoord.out.bam	Sorted BAM file
*Log.final.out	Alignment summary statistics
*Log.out	Detailed log
*SJ.out.tab	Splice junctions
*ReadsPerGene.out.tab	Gene counts (if --quantMode)
*Chimeric.out.junction	Fusion candidates (if chimeric)

# Reduce memory for limited systems
STAR --genomeLoad NoSharedMemory \
    --limitBAMsortRAM 10000000000 \  # 10GB for sorting
    ...

# For very large genomes, limit during index generation
STAR --runMode genomeGenerate \
    --limitGenomeGenerateRAM 31000000000 \  # 31GB
    ...

# Load genome into shared memory (for multiple samples)
STAR --genomeLoad LoadAndExit --genomeDir star_index/

# Run alignments (faster startup)
STAR --genomeLoad LoadAndKeep --genomeDir star_index/ ...

# Remove from memory when done
STAR --genomeLoad Remove --genomeDir star_index/

Parameter	Default	Description
--runThreadN	1	Number of threads
--sjdbOverhang	100	Read length - 1
--outFilterMultimapNmax	10	Max multi-mapping
--alignIntronMax	0	Max intron size
--outFilterMismatchNmax	10	Max mismatches
--outSAMtype	SAM	Output format
--quantMode	-	GeneCounts for counting
--twopassMode	None	Basic for two-pass

Bio Read Alignment Star Alignment

Version Compatibility

STAR RNA-seq Alignment

Generate Genome Index

Bio Read Alignment Star Alignment

Version Compatibility

STAR RNA-seq Alignment

Generate Genome Index

Index with Specific Read Length

Basic Alignment

Single-End Alignment

Two-Pass Mode

Quantification Mode

ENCODE Options

Fusion Detection

Output Files

Memory Requirements

Shared Memory Mode

Key Parameters

Brenda Database

Clinical Decision Support Documents

Nanoclaw Repl

Data Analyst

Deep Research

Academic Researcher

Bio Read Alignment Star Alignment

Version Compatibility

STAR RNA-seq Alignment

Generate Genome Index

Bio Read Alignment Star Alignment

Version Compatibility

STAR RNA-seq Alignment

Generate Genome Index

Index with Specific Read Length

Basic Alignment

Single-End Alignment

Two-Pass Mode

Quantification Mode

ENCODE Options

Fusion Detection

Output Files

Memory Requirements

Shared Memory Mode

Key Parameters

Related Skills

Brenda Database

Clinical Decision Support Documents

Nanoclaw Repl

Data Analyst

Deep Research

Academic Researcher