Name: Igv Tracks
Author: bfairkun

스킬 검색.../

Igv Tracks | Skills Pool

track_name → {chrom: [[start, end, value], ...]}

chr2  1000  2000  gene1  0  +  1000  2000  0  2  200,300,  0,700,

from my_utils.genometracks_utils import get_block_signal_df, plot_block_signal

df = get_block_signal_df(
    tracks_path="code/scratch/ucsc_export.json.gz",
    bed12_path="data/my_transcripts.bed",
    track_names=["SampleA_RPM", "SampleB_RPM"],  # None = all tracks
    padding=50,   # extend blocks by 50 bp each side (shows splice site context)
)
# df columns: bed_name, chrom, block_id, start, end, width, in_block, <track cols>

plot_block_signal(
    df,
    output_path="output/signal_plot.pdf",
    track_names=["SampleA_RPM", "SampleB_RPM"],
    region="chr2:1,850,700-1,886,852",  # optional, to zoom
    bed_names=["ENST00000123456"],        # optional, subset of BED entries
    ylim=(0, 5),                          # optional, shared y-axis
)

conda run -n py_general python -m my_utils.genometracks_utils \
    code/scratch/ucsc.json.gz \
    data/transcripts.bed \
    -o output/signal_plot \
    --padding 50 \
    --region "chr2:1,850,700-1,886,852"
# Writes output/signal_plot.tsv and output/signal_plot.pdf

Column	Description
`bed_name`	BED12 feature name (field 4)
`chrom`	chromosome
`block_id`	`block_001`, `block_002`, ... (merged after padding)
`start`, `end`	sub-interval coordinates
`width`	end - start
`in_block`	True if within original (unpadded) block
`<track_name>`	signal value (NaN where track has no data)

result = (
    df[df["in_block"]]
    .groupby(["bed_name", "block_id"])
    .apply(lambda g: np.average(g["SampleA_RPM"].fillna(0), weights=g["width"]))
    .reset_index(name="weighted_mean_RPM")
)

# tracks.ini
[bigwig track]
file = path/to/signal.bw
title = My Signal
height = 3
color = blue
min_value = 0
max_value = 5

[genes]
file = path/to/annotation.gtf
title = Genes
height = 5

[spacer]

[x-axis]

conda run -n py_general pyGenomeTracks \
    --tracks tracks.ini \
    --region chr2:1850700-1886852 \
    --outFileName output/figure.pdf

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<Session genome="hg38" locus="All" version="8">
    <Resources>
        <Resource path="sample_plus.bw" type="bw"/>
        <Resource path="sample_minus.bw" type="bw"/>
    </Resources>
    <Panel height="120" name="AnnotationPanel" width="1500">
        <Track attributeKey="Reference sequence" clazz="org.broad.igv.track.SequenceTrack" fontSize="10" id="Reference sequence" name="Reference sequence" sequenceTranslationStrandValue="POSITIVE" shouldShowTranslation="false" visible="true"/>
        <Track attributeKey="Gene" clazz="org.broad.igv.track.FeatureTrack" fontSize="10" id="hg38_genes" name="Gene" visible="true"/>
    </Panel>
    <Panel height="400" name="DataPanel" width="1500">
        <Track attributeKey="sample_plus.bw" autoScale="true" clazz="org.broad.igv.track.DataSourceTrack" color="0,0,178" fontSize="10" id="/Users/bjf79/mnt/project/yangili1/bjf79/PATH/sample_plus.bw" name="Sample +" renderer="BAR_CHART" visible="true" windowFunction="mean"/>
        <Track attributeKey="sample_minus.bw" autoScale="true" clazz="org.broad.igv.track.DataSourceTrack" color="178,0,0" fontSize="10" id="/Users/bjf79/mnt/project/yangili1/bjf79/PATH/sample_minus.bw" name="Sample -" negateValues="true" renderer="BAR_CHART" visible="true" windowFunction="mean"/>
    </Panel>
    <PanelLayout dividerFractions="0.18,0.97"/>
    <HiddenAttributes>
        <Attribute name="DATA FILE"/>
        <Attribute name="DATA TYPE"/>
        <Attribute name="NAME"/>
    </HiddenAttributes>
</Session>

import pyBigWig, json, os
from base64 import b64encode
from gzip import compress
from IPython.display import display, HTML
import matplotlib.pyplot as plt
import matplotlib.colors as mcolors

IGV_CHR, IGV_START, IGV_END = 'chr16', 187000, 231000
IGV_LOCUS = f'{IGV_CHR}:{IGV_START}-{IGV_END}'

def bedgraph_to_data_uri(bw_path, chrom, start, end):
    """Read bigwig intervals → bedgraph string → gzip → base64 data URI."""
    bw = pyBigWig.open(bw_path)
    ivs = bw.intervals(chrom, start, end) or []
    bw.close()
    lines = ''.join(f'{chrom}\t{s}\t{e}\t{v:.4f}\n' for s, e, v in ivs)
    gz = compress(lines.encode())
    b64 = b64encode(gz).decode()
    return f'data:application/gzip;base64,{b64}'

# Build track list with data URIs
track_configs = []
for t in tracks:   # tracks = list of dicts with 'bw', 'name', 'color'
    uri = bedgraph_to_data_uri(t['bw'], IGV_CHR, IGV_START, IGV_END)
    track_configs.append({
        'url':            uri,
        'name':           t['name'],
        'color':          t['color'],
        'format':         'bedgraph',
        'type':           'wig',
        'height':         40,
        'autoscaleGroup': 'mygroup',   # shared y-axis across tracks
        'autoscale':      True,
    })

tracks_json = json.dumps(track_configs, indent=2)

html = f"""<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
  <script src="https://cdn.jsdelivr.net/npm/[email protected]/dist/igv.min.js"></script>
  <style>body {{ margin:0; padding:8px; }} #igv {{ width:100%; }}</style>
</head>
<body>
  <div id="igv"></div>
  <script>
    igv.createBrowser(document.getElementById("igv"), {{
      genome: "hg38",
      locus:  "{IGV_LOCUS}",
      tracks: {tracks_json}
    }});
  </script>
</body>
</html>"""

# Optionally save standalone file
with open('code/scratch/browser.html', 'w') as f:
    f.write(html)

# Embed in notebook via srcdoc iframe
# IMPORTANT: must escape & → &amp; first, then " → &quot;
srcdoc = html.replace('&', '&amp;').replace('"', '&quot;')
display(HTML(f'<iframe srcdoc="{srcdoc}" style="width:100%;height:860px;border:1px solid #ddd;"></iframe>'))

Igv Tracks

Genome Track Visualization

`genometracks_utils` from `my_utils`

What it does

Workflow

Igv Tracks

Genome Track Visualization

`genometracks_utils` from `my_utils`

What it does

Workflow

DataFrame returned by `get_block_signal_df()`

pyGenomeTracks INI approach (alternative)

IGV Session XML files (for local IGV via SAMBA-mounted Midway)

Quick IGV session tips

Embedded igv.js browser in a Quarto notebook

Pattern (Python, py_general kernel)

Key notes

Deep Research

Data Analyst

Academic Researcher

Data Scientist

Biopython

Binary Analysis Patterns

Igv Tracks

Genome Track Visualization

genometracks_utils from my_utils

What it does

Workflow

Igv Tracks

Genome Track Visualization

genometracks_utils from my_utils

What it does

Workflow

DataFrame returned by get_block_signal_df()

pyGenomeTracks INI approach (alternative)

IGV Session XML files (for local IGV via SAMBA-mounted Midway)

Quick IGV session tips

Embedded igv.js browser in a Quarto notebook

Pattern (Python, py_general kernel)

Key notes

Deep Research

Data Analyst

Academic Researcher

Data Scientist

Biopython

Binary Analysis Patterns

`genometracks_utils` from `my_utils`

`genometracks_utils` from `my_utils`

DataFrame returned by `get_block_signal_df()`