Transcrie documente PDF în format Markdown folosind Gemini API. Folosește când Claudia trimite un PDF sau când trebuie transcris un document existent. De asemenea, poate face cercetare juridică aprofundată prin Gemini.
Nu folosi niciodată tool-ul read sau pdf pe fișiere PDF. Asta va umple contextul și va consuma token-uri inutil. Trimite PDF-ul la Gemini și citește doar rezultatul.
Salvează fișierul primit de la Claudia în repo cu denumirea corectă (vezi CLAUDE.md pentru convenții):
YYYY-MM-DD_Tip_Detalii_(Sursa).pdf
Dacă nu știi sursa sau data, întreab-o pe Claudia.
curl -s "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-flash-lite-preview:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d "$(jq -n \
--arg pdf_b64 "$(base64 -w0 /home/node/dosar-maghieru/path/to/file.pdf)" \
'{
"contents": [{
"parts": [
{
"inline_data": {
"mime_type": "application/pdf",
"data": $pdf_b64
}
},
{
"text": "Transcrie acest document PDF în format Markdown. Păstrează structura originală. Marchează paginile cu **— PAGINA N —**. Notează ștampilele cu [Ștampilă: DESCRIERE]. Notează semnăturile cu [Semnătură: NUME]. Păstrează tot textul original, inclusiv date, numere, nume. Nu omite nimic. Nu traduce — păstrează limba originală. FOARTE IMPORTANT: Dacă un cuvânt sau fragment NU se poate citi clar, scrie [greu lizibil] în loc. NU inventa sau ghici cuvinte — e mai bine să marchezi [greu lizibil] decât să scrii un cuvânt greșit. Acuratețea e critică: acest text va fi folosit ca probă juridică."
}
]
}]
}'
)"
Extrage textul din răspunsul JSON și salvează-l ca .md lângă PDF:
# Extrage textul din răspuns (câmpul candidates[0].content.parts[0].text)
# Salvează ca: path/to/file.md (același nume, extensie diferită)
OBLIGATORIU: Toate transcrierile Gemini trebuie să aibă frontmatter cu verificat: false. Acesta indică faptul că transcrierea nu a fost verificată manual de un om.
Dacă fișierul e în 04-Documente-Suport/ și e relevant pentru mai multe dosare:
---