Name: Implementing Go Pipelines
Author: LeoDPraetorian

搜索技能.../

Implementing Go Pipelines | Skills Pool

func Pipeline(ctx context.Context, nums []int) <-chan int {
    // Stage 1: Generator
    gen := func() <-chan int {
        out := make(chan int)
        go func() {
            defer close(out)
            for _, n := range nums {
                select {
                case out <- n:
                case <-ctx.Done():
                    return  // Exit on cancellation
                }
            }
        }()
        return out
    }

    // Stage 2: Square
    sq := func(in <-chan int) <-chan int {
        out := make(chan int)
        go func() {
            defer close(out)
            for n := range in {
                select {
                case out <- n * n:
                case <-ctx.Done():
                    return
                }
            }
        }()
        return out
    }

    // Stage 3: Filter evens
    filter := func(in <-chan int) <-chan int {
        out := make(chan int)
        go func() {
            defer close(out)
            for n := range in {
                if n%2 == 0 {
                    select {
                    case out <- n:
                    case <-ctx.Done():
                        return
                    }
                }
            }
        }()
        return out
    }

    // Connect stages
    return filter(sq(gen()))
}

func stage(done <-chan struct{}, in <-chan int) <-chan int {
    out := make(chan int)
    go func() {
        defer close(out)
        for n := range in {
            select {
            case out <- n:
            case <-done:
                return  // Broadcast received, exit immediately
            }
        }
    }()
    return out
}

// Usage
done := make(chan struct{})
defer close(done)  // Broadcast cancellation to all stages

c := stage(done, gen(done, nums))

func Pipeline(ctx context.Context, nums []int) <-chan int {
    out := make(chan int)
    go func() {
        defer close(out)
        for _, n := range nums {
            select {
            case out <- n:
            case <-ctx.Done():
                return  // Context canceled
            }
        }
    }()
    return out
}

// Usage
ctx, cancel := context.WithCancel(context.Background())
defer cancel()  // Broadcast cancellation

c := Pipeline(ctx, nums)

Buffer Size	Use Case	Memory Impact	Throughput
0 (unbuf)	Synchronization, low throughput	Minimal	Slowest
10-100	Memory-constrained	Low	Moderate
100-1000	Balanced, smooth flow (TruffleHog)	Medium	High
1000+	High variance, prevent blocking	High	Highest

func generate(ctx context.Context, nums []int) <-chan int {
    out := make(chan int, 100)  // Buffer 100 items
    go func() {
        defer close(out)
        for _, n := range nums {
            select {
            case out <- n:
            case <-ctx.Done():
                return
            }
        }
    }()
    return out
}

// Stage 1: Chunk source (I/O-bound)
chunkChan := make(chan Chunk, 100)
// Workers: 1 (single source)

// Stage 2: Detect patterns (CPU-bound)
detectChan := make(chan Detection, 1000)
// Workers: concurrency × 3
// Buffer: 1000 (high variance in chunk sizes)

// Stage 3: Verify findings (Network-bound)
verifyChan := make(chan Verified, 100)
// Workers: concurrency × 2
// Buffer: 100 (network has natural buffering)

// Stage 4: Notify results (I/O-bound)
resultChan := make(chan Result, 100)
// Workers: concurrency × 1
// Buffer: 100 (downstream is fast)

func fanOut(ctx context.Context, in <-chan int, workers int) []<-chan int {
    outs := make([]<-chan int, workers)

    for i := 0; i < workers; i++ {
        out := make(chan int)
        outs[i] = out

        go func() {
            defer close(out)
            for n := range in {
                result := expensiveOperation(n)
                select {
                case out <- result:
                case <-ctx.Done():
                    return
                }
            }
        }()
    }

    return outs
}

func fanIn(ctx context.Context, channels ...<-chan int) <-chan int {
    out := make(chan int)
    var wg sync.WaitGroup

    for _, c := range channels {
        wg.Add(1)
        go func(ch <-chan int) {
            defer wg.Done()
            for n := range ch {
                select {
                case out <- n:
                case <-ctx.Done():
                    return
                }
            }
        }(c)
    }

    go func() {
        wg.Wait()
        close(out)
    }()

    return out
}

func parallel(ctx context.Context, in <-chan int, workers int) <-chan int {
    outs := fanOut(ctx, in, workers)
    return fanIn(ctx, outs...)
}

// ❌ BAD: Goroutine leaks if receiver stops reading
func leak(nums []int) <-chan int {
    out := make(chan int)
    go func() {
        for _, n := range nums {
            out <- n  // Blocks forever if no receiver!
        }
        close(out)
    }()
    return out
}

// ✅ GOOD: Respect cancellation
func safe(ctx context.Context, nums []int) <-chan int {
    out := make(chan int)
    go func() {
        defer close(out)
        for _, n := range nums {
            select {
            case out <- n:
            case <-ctx.Done():
                return  // Exit on cancel
            }
        }
    }()
    return out
}

// ❌ BAD: Downstream goroutines hang waiting for close
func noClose(in <-chan int) <-chan int {
    out := make(chan int)
    go func() {
        for n := range in {
            out <- n * 2
        }
        // Forgot close(out)!
    }()
    return out
}

// ✅ GOOD: Always defer close
func withClose(in <-chan int) <-chan int {
    out := make(chan int)
    go func() {
        defer close(out)  // ALWAYS defer
        for n := range in {
            out <- n * 2
        }
    }()
    return out
}

// ❌ BAD: Upstream blocked trying to send
ctx, cancel := context.WithCancel(context.Background())
c := pipeline(ctx, nums)

// Read only first value
val := <-c
cancel()  // Upstream still trying to send!

// ✅ GOOD: Drain channel or use buffered channel
ctx, cancel := context.WithCancel(context.Background())
c := pipeline(ctx, nums)

val := <-c
cancel()

// Drain remaining
for range c {
    // Discard
}

func TestCancellation(t *testing.T) {
    ctx, cancel := context.WithCancel(context.Background())

    // Create pipeline with 1000 items
    c := Pipeline(ctx, makeRange(1000))

    // Read only 10 items
    for i := 0; i < 10; i++ {
        <-c
    }

    // Cancel early
    cancel()

    // Verify goroutines exit (no leaks)
    time.Sleep(100 * time.Millisecond)
    // Check with runtime.NumGoroutine() or leak detector
}

func TestStageIsolation(t *testing.T) {
    ctx := context.Background()

    // Test each stage independently
    gen := generate(ctx, []int{1, 2, 3})
    sq := square(ctx, gen)

    var results []int
    for n := range sq {
        results = append(results, n)
    }

    expected := []int{1, 4, 9}
    if !reflect.DeepEqual(results, expected) {
        t.Errorf("got %v, want %v", results, expected)
    }
}

Pattern	Use When	Code Snippet
Basic pipeline	Linear stage processing	`stage1() → stage2() → stage3()`
Done channel	Explicit cancellation	`defer close(done)`
Context cancellation	Modern cancellation (Go 1.7+)	`ctx.Done()`
Buffered channels	Smooth throughput variance	`make(chan T, 100)`
Fan-out	Parallel processing per stage	Multiple goroutines read from same channel
Fan-in	Merge results from parallel stage	`sync.WaitGroup` + merge goroutine
Graceful shutdown	Drain channels on cancel	`for range c {}` after cancel

Implementing Go Pipelines

When to Use

Official Pattern (Go Blog, 2014)

Implementing Go Pipelines

When to Use

Official Pattern (Go Blog, 2014)

Critical Principle: Goroutines Are NOT Garbage Collected

Basic Pipeline Pattern

Three-Stage Example

Explicit Cancellation Pattern

Done Channel (Canonical Pattern)

Context-Based Cancellation (Modern)

Buffered Channels for Throughput

Sizing Guidelines

Example: Buffered Pipeline

Production Example: TruffleHog Multi-Stage Pipeline

Architecture

Stage-Specific Worker Tuning

Fan-Out/Fan-In Pattern

Fan-Out: Multiple Workers per Stage

Fan-In: Merge Multiple Channels

Combined: Parallel Processing

Common Pitfalls

1. Goroutine Leak from Blocked Send

2. Forgetting to Close Channels

3. Not Draining Channels on Exit

Testing Strategies

Test Pipeline Cancellation

Test Stage Isolation

Quick Reference

Performance Characteristics

References

Clickhouse Io

Clickhouse Io

Claude Devfleet

Clickhouse Io

Ai First Engineering

Postgres Patterns

Pattern	Throughput	Memory	Complexity
Unbuffered pipeline	Low	Minimal	Low
Buffered pipeline	High	Moderate	Low
Fan-out (parallel)	Very high	High	Medium
Multi-stage (TruffleHog)	40K/hour	Moderate	High

Implementing Go Pipelines

When to Use

Official Pattern (Go Blog, 2014)

Implementing Go Pipelines

When to Use

Official Pattern (Go Blog, 2014)

Critical Principle: Goroutines Are NOT Garbage Collected

Basic Pipeline Pattern

Three-Stage Example

Explicit Cancellation Pattern

Done Channel (Canonical Pattern)

Context-Based Cancellation (Modern)

Buffered Channels for Throughput

Sizing Guidelines

Example: Buffered Pipeline

Production Example: TruffleHog Multi-Stage Pipeline

Architecture

Stage-Specific Worker Tuning

Fan-Out/Fan-In Pattern

Fan-Out: Multiple Workers per Stage

Fan-In: Merge Multiple Channels

Combined: Parallel Processing

Common Pitfalls

1. Goroutine Leak from Blocked Send

2. Forgetting to Close Channels

3. Not Draining Channels on Exit

Testing Strategies

Test Pipeline Cancellation

Test Stage Isolation

Quick Reference

Performance Characteristics

References

Related Skills

Clickhouse Io

Clickhouse Io

Claude Devfleet

Clickhouse Io

Ai First Engineering

Postgres Patterns