Skill File

sandeco-token-reduce

Name: sandeco-token-reduce
Author: sandeco

Comprime tokens de prompts usando LLMLingua-2 da Microsoft para reduzir custo e latencia. Use esta skill sempre que o usuario pedir para comprimir um prompt, reduzir tokens, economizar tokens, usar LLMLingua, ou quando um texto for longo demais para enviar a um LLM. Tambem use quando o usuario quiser pre-processar contexto antes de enviar ao Claude. Triggers: "comprimir", "reduzir tokens", "economizar tokens", "LLMLingua", "texto muito longo", "compressao de prompt", "token compression", "compress tokens", "inicializar compressao", "init token-reduce".

sandeco731 starsApr 16, 2026

Occupation
Categories: Framework Internals

Skill Content

Comprime tokens removendo os menos relevantes de um texto, preservando o significado semantico. Usa o modelo XLM-RoBERTa da Microsoft (LLMLingua-2) rodando localmente (CPU ou GPU).

Estrutura

sandeco-token-reduce/
├── SKILL.md          ← este arquivo
├── scripts/
│   ├── setup.py      ← inicializacao (cria .venv, instala libs, baixa modelo)
│   └── compress.py   ← compressao de texto (requer init)
└── .venv/            ← criado pelo setup.py (NAO distribuir)

IMPORTANTE: Fluxo de inicializacao

A skill precisa ser inicializada antes do primeiro uso. O .venv NAO e distribuido junto com a skill — cada usuario precisa rodar o init uma vez.

Antes de qualquer operacao de compressao:

Verifique se o .venv existe dentro do diretorio desta skill
Se NAO existir, informe ao usuario que a skill precisa ser inicializada e execute o setup:

Related Skills

sandeco-token-reduce | Skills Pool

python "<skill-dir>/scripts/setup.py"

"<venv-python>" "<skill-dir>/scripts/compress.py" --text "texto longo aqui" --rate 0.4

"<venv-python>" "<skill-dir>/scripts/compress.py" --file caminho/para/arquivo.txt --rate 0.4

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --output comprimido.txt

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --ask "Resuma este texto"

"<venv-python>" "<skill-dir>/scripts/compress.py" --file entrada.txt --rate 0.4 --json

Parametro	Padrao	Descricao
`--text`	—	Texto passado diretamente (mutuamente exclusivo com --file)
`--file`	—	Caminho para arquivo de texto
`--rate`	`0.4`	Fracao de tokens a manter
`--output`	—	Salva texto comprimido neste arquivo
`--json`	`false`	Saida em JSON estruturado
`--ask`	—	Pergunta a enviar ao Claude com o contexto comprimido
`--model`	`claude-sonnet-4-6`	Modelo Claude (so usado com --ask)
`--max-tokens`	`4096`	Max tokens na resposta do Claude

{
  "compression": {
    "compressed_prompt": "texto comprimido...",
    "origin_tokens": 312,
    "compressed_tokens": 124,
    "ratio": 2.52,
    "saving": 188,
    "rate_requested": 0.4
  },
  "claude": {
    "answer": "resposta do Claude...",
    "model": "claude-sonnet-4-6",
    "input_tokens": 150,
    "output_tokens": 200
  }
}

sandeco-token-reduce

Estrutura

IMPORTANTE: Fluxo de inicializacao

Antes de qualquer operacao de compressao:

sandeco-token-reduce

Estrutura

IMPORTANTE: Fluxo de inicializacao

Antes de qualquer operacao de compressao:

Quando o usuario pedir para "inicializar", "configurar" ou "init" a skill:

Como comprimir

So comprimir (texto direto)

Comprimir a partir de arquivo

Comprimir e salvar resultado em arquivo

Comprimir e enviar ao Claude com uma pergunta

Saida JSON (para consumo programatico)

Parametros do compress.py

Guia de taxas de compressao

Formato da saida JSON

Notas tecnicas

Pre-processamento automatico

Chunking automatico

Pytorch Patterns

Regex Vs Llm Structured Text

Effect

Flags

WPF to WinUI 3 Migration Skill

At Dispatch V2