Name: Acestep
Author: calesthio

Acestep

AI music generation with ACE-Step 1.5 — background music, vocal tracks, covers, stem extraction for video production. Use when generating music, soundtracks, jingles, or working with audio stems. Triggers include background music, soundtrack, jingle, music generation, stem extraction, cover, style transfer, or musical composition tasks.

calesthio2,620 星標2026年3月29日

職業
分類: LLM 同 AI

ACE-Step 1.5 Music Generation

Open-source music generation (MIT license) via tools/music_gen.py. Runs on RunPod serverless. Requires RUNPOD_API_KEY and RUNPOD_ACESTEP_ENDPOINT_ID in .env (run --setup to create endpoint).

Quick Reference

# Basic generation
python tools/music_gen.py --prompt "Upbeat tech corporate" --duration 60 --output bg.mp3

# With musical control
python tools/music_gen.py --prompt "Calm ambient piano" --duration 30 --bpm 72 --key "D Major" --output ambient.mp3

# Scene presets (video production)
python tools/music_gen.py --preset corporate-bg --duration 60 --output bg.mp3
python tools/music_gen.py --preset tension --duration 20 --output problem.mp3
python tools/music_gen.py --preset cta --brand digital-samba --duration 15 --output cta.mp3

# Vocals with lyrics
python tools/music_gen.py --prompt "Indie pop jingle" --lyrics "[verse]\nBuild it better\nShip it faster" --duration 30 --output jingle.mp3

# Cover / style transfer
python tools/music_gen.py --cover --reference theme.mp3 --prompt "Jazz piano version" --duration 60 --output jazz_cover.mp3

# Stem extraction
python tools/music_gen.py --extract vocals --input mixed.mp3 --output vocals.mp3

# List presets
python tools/music_gen.py --list-presets

ACE-Step 1.5 Music Generation

Quick Reference

# Basic generation
python tools/music_gen.py --prompt "Upbeat tech corporate" --duration 60 --output bg.mp3

# With musical control
python tools/music_gen.py --prompt "Calm ambient piano" --duration 30 --bpm 72 --key "D Major" --output ambient.mp3

# Scene presets (video production)
python tools/music_gen.py --preset corporate-bg --duration 60 --output bg.mp3
python tools/music_gen.py --preset tension --duration 20 --output problem.mp3
python tools/music_gen.py --preset cta --brand digital-samba --duration 15 --output cta.mp3

# Vocals with lyrics
python tools/music_gen.py --prompt "Indie pop jingle" --lyrics "[verse]\nBuild it better\nShip it faster" --duration 30 --output jingle.mp3

# Cover / style transfer
python tools/music_gen.py --cover --reference theme.mp3 --prompt "Jazz piano version" --duration 60 --output jazz_cover.mp3

# Stem extraction
python tools/music_gen.py --extract vocals --input mixed.mp3 --output vocals.mp3

# List presets
python tools/music_gen.py --list-presets

Preset	BPM	Key	Use Case
`corporate-bg`	110	C Major	Professional background, presentations
`upbeat-tech`	128	G Major	Product launches, tech demos
`ambient`	72	D Major	Overview slides, reflective content
`dramatic`	90	D Minor	Reveals, announcements
`tension`	85	A Minor	Problem statements, challenges
`hopeful`	120	C Major	Solution reveals, resolutions
`cta`	135	E Major	Call to action, closing energy
`lofi`	85	F Major	Screen recordings, coding demos

Scene	Preset	Duration	Notes
Title	`dramatic` or `ambient`	3-5s	Short, mood-setting
Problem	`tension`	10-15s	Dark, unsettling
Solution	`hopeful`	10-15s	Relief, optimism
Demo	`lofi` or `corporate-bg`	30-120s	Non-distracting, matches demo length
Stats	`upbeat-tech`	8-12s	Building credibility
CTA	`cta`	5-10s	Maximum energy, punchy
Credits	`ambient`	5-10s	Gentle fade-out

Acestep

ACE-Step 1.5 Music Generation

Quick Reference

Acestep

ACE-Step 1.5 Music Generation

Quick Reference

Creating a Song (Step by Step)

1. Instrumental background track (simplest)

2. Song with vocals and lyrics

3. Using a preset for video background

Key tips for good results

Scene Presets

Task Types

text2music (default)

cover

extract

repaint (future)

lego (future, requires base model)

complete (future, requires base model)

Prompt Engineering

Caption Writing — Layer Dimensions

Key Principles

Lyrics Formatting

Video Production Integration

Music for Scene Types

Timing Workflow

Combining with Voiceover

Brand Consistency

Technical Details

When NOT to use ACE-Step

Openai Whisper

Voice Call

Prose

Clawhub

Sherpa Onnx Tts

Openai Whisper Api