Name: Bio Vcf Statistics
Author: FreedomIntelligence

Buscar habilidades.../

Bio Vcf Statistics | Skills Pool

bcftools stats input.vcf.gz > stats.txt

bcftools stats input.vcf.gz | grep "^SN"

bcftools stats input.vcf.gz | grep "^SN" | cut -f3-

bcftools stats input.vcf.gz | grep "^TSTV"

bcftools stats -s - input.vcf.gz > per_sample.txt

bcftools stats input1.vcf.gz input2.vcf.gz > comparison.txt

bcftools stats -r chr1:1000000-2000000 input.vcf.gz > region_stats.txt

bcftools stats -R exome.bed input.vcf.gz > exome_stats.txt

bcftools stats input.vcf.gz > stats.txt
plot-vcfstats -p output_dir stats.txt

bcftools stats file1.vcf.gz file2.vcf.gz > comparison.txt
plot-vcfstats -p comparison_dir comparison.txt

bcftools gtcheck -g reference.vcf.gz query.vcf.gz

bcftools gtcheck -G 1 input.vcf.gz > relatedness.txt

DC  0  sample1  sample2  0.95  1234  1200

bcftools gtcheck -g 1000genomes.vcf.gz unknown_sample.vcf.gz

bcftools view -H input.vcf.gz | wc -l

# SNPs
bcftools view -v snps -H input.vcf.gz | wc -l

# Indels
bcftools view -v indels -H input.vcf.gz | wc -l

bcftools view -f PASS -H input.vcf.gz | wc -l

bcftools query -f '%QUAL\n' input.vcf.gz | \
    awk '{sum+=$1; count++} END {print "Mean QUAL:", sum/count}'

bcftools query -f '%INFO/DP\n' input.vcf.gz | \
    awk '{sum+=$1; count++} END {print "Mean DP:", sum/count}'

# Count heterozygous sites per sample
bcftools query -f '[%GT\t]\n' input.vcf.gz | \
    awk -F'\t' '{for(i=1;i<=NF;i++) if($i=="0/1" || $i=="0|1") het[i]++}
        END {for(i in het) print "Sample", i, "het:", het[i]}'

bcftools query -f '%INFO/AF\n' input.vcf.gz | \
    awk '{
        if($1<0.01) rare++
        else if($1<0.05) low++
        else if($1<0.5) common++
        else freq++
    } END {
        print "Rare (<1%):", rare
        print "Low (1-5%):", low
        print "Common (5-50%):", common
        print "Frequent (>50%):", freq
    }'

bcftools query -l input.vcf.gz

bcftools query -l input.vcf.gz | wc -l

for sample in $(bcftools query -l input.vcf.gz); do
    count=$(bcftools view -s "$sample" -H input.vcf.gz | \
        bcftools view -c 1 -H | wc -l)
    echo "$sample: $count"
done

bcftools stats -s - input.vcf.gz | grep "^PSC"

from cyvcf2 import VCF

stats = {'snps': 0, 'indels': 0, 'other': 0}

for variant in VCF('input.vcf.gz'):
    if variant.is_snp:
        stats['snps'] += 1
    elif variant.is_indel:
        stats['indels'] += 1
    else:
        stats['other'] += 1

print(f'SNPs: {stats["snps"]}')
print(f'Indels: {stats["indels"]}')
print(f'Other: {stats["other"]}')

from cyvcf2 import VCF
import numpy as np

quals = []
for variant in VCF('input.vcf.gz'):
    if variant.QUAL:
        quals.append(variant.QUAL)

quals = np.array(quals)
print(f'Mean QUAL: {np.mean(quals):.1f}')
print(f'Median QUAL: {np.median(quals):.1f}')
print(f'Min QUAL: {np.min(quals):.1f}')
print(f'Max QUAL: {np.max(quals):.1f}')

from cyvcf2 import VCF

vcf = VCF('input.vcf.gz')
samples = vcf.samples

hom_ref = [0] * len(samples)
het = [0] * len(samples)
hom_alt = [0] * len(samples)
missing = [0] * len(samples)

for variant in vcf:
    for i, gt in enumerate(variant.gt_types):
        if gt == 0:
            hom_ref[i] += 1
        elif gt == 1:
            het[i] += 1
        elif gt == 3:
            hom_alt[i] += 1
        else:
            missing[i] += 1

for i, sample in enumerate(samples):
    print(f'{sample}: HOM_REF={hom_ref[i]}, HET={het[i]}, HOM_ALT={hom_alt[i]}, MISS={missing[i]}')

from cyvcf2 import VCF

transitions = 0
transversions = 0

ti_pairs = {('A', 'G'), ('G', 'A'), ('C', 'T'), ('T', 'C')}

for variant in VCF('input.vcf.gz'):
    if not variant.is_snp:
        continue
    ref = variant.REF
    alt = variant.ALT[0]
    if (ref, alt) in ti_pairs:
        transitions += 1
    else:
        transversions += 1

ratio = transitions / transversions if transversions > 0 else 0
print(f'Transitions: {transitions}')
print(f'Transversions: {transversions}')
print(f'Ti/Tv ratio: {ratio:.2f}')

# Generate stats
bcftools stats input.vcf.gz > stats.txt

# Extract key metrics
echo "=== VCF Summary ==="
grep "^SN" stats.txt | cut -f3-

echo ""
echo "=== Ti/Tv Ratio ==="
grep "^TSTV" stats.txt | cut -f5

# Generate plots
plot-vcfstats -p qc_plots stats.txt

bcftools stats raw.vcf.gz filtered.vcf.gz > comparison.txt

echo "=== Before Filtering ==="
grep "^SN.*raw" comparison.txt | cut -f3-

echo ""
echo "=== After Filtering ==="
grep "^SN.*filtered" comparison.txt | cut -f3-

bcftools gtcheck -G 1 cohort.vcf.gz > relatedness.txt
cat relatedness.txt

Task	Command
Full stats	`bcftools stats input.vcf.gz`
Summary only	`bcftools stats input.vcf.gz \| grep "^SN"`
Ti/Tv ratio	`bcftools stats input.vcf.gz \| grep "^TSTV"`
Per-sample	`bcftools stats -s - input.vcf.gz`
Compare VCFs	`bcftools stats file1.vcf.gz file2.vcf.gz`
Sample check	`bcftools gtcheck -G 1 input.vcf.gz`
Plot stats	`plot-vcfstats -p dir stats.txt`

Command	Purpose
`bcftools stats`	Comprehensive variant statistics
`bcftools gtcheck`	Sample concordance and relatedness

Command	Purpose
`bcftools stats`	Comprehensive variant statistics
`bcftools gtcheck`	Sample concordance and relatedness

Error	Cause	Solution
`No data`	Empty VCF	Check if VCF has variants
`plot-vcfstats not found`	Not installed	Install with bcftools
`Cannot open`	Invalid VCF	Check file format

Bio Vcf Statistics

Version Compatibility

VCF Statistics

Statistics Tools

Bio Vcf Statistics

Version Compatibility

VCF Statistics

Statistics Tools

bcftools stats

Basic Statistics

View Key Metrics

Summary Numbers (SN)

Transition/Transversion Ratio

Per-Sample Statistics

Compare Two VCFs

Region-Specific Stats

Exome Statistics

Plotting Statistics

Generate Plots

Comparison Plots

bcftools gtcheck

Check Sample Identity

Detect Sample Swaps

Output Format

Check Against Reference Panel

Quick Statistics with Query

Count Variants

Count by Type

Count PASS Variants

Quality Distribution

Depth Distribution

Genotype Counts

Allele Frequency Spectrum

Sample Statistics

List Samples

Count Samples

Per-Sample Variant Counts

Missing Genotypes per Sample

cyvcf2 Statistics

Basic Counts

Quality Statistics

Genotype Distribution

Transition/Transversion Calculation

Common Workflows

Quality Control Report

Compare Before/After Filtering

Sample Relatedness Check

Quick Reference

Common Errors

Related Skills

Visualization Expert

Data Analyst

Huggingface Hub

Multi Reviewer Patterns

Dbt Transformation Patterns

Startup Financial Modeling