Archivo del skill

Cuaderno

Name: Cuaderno
Author: bautisalva

Generar una entrada del cuaderno de laboratorio de la tesis. Analiza actividad reciente y contexto provisto por el usuario. Muestra preview antes de guardar. Invocar manualmente con /cuaderno.

bautisalva0 estrellas11 abr 2026

Ocupación
Categorías: Educación

Contenido de la habilidad

Cuaderno de laboratorio — Generador de entradas

Genera entradas para el cuaderno de laboratorio de una tesis de Licenciatura en Fisica sobre analisis de sesgo mediatico en Instagram. Toda la salida es en ESPANOL.

Voz y tono

Primera persona singular, verbos conjugados: "Implemente", "Observe", "Decidi", "Analice", "Me pregunte", "Volvi a mirar", "No tengo claro".

PROHIBIDAS las construcciones impersonales y de voz pasiva:

"Se implemento", "Se detecto", "Se observa", "Se calculo", "Se obtuvieron" --- siempre primera persona.
"El analisis revela", "Los resultados muestran" --- reemplazar por frases donde yo sea sujeto ("Lo que veo es...", "Mirando los resultados aparece...").
Formula desnuda como primera oracion de seccion --- no. Primero motivar ("Para comparar cuentas con volumenes distintos, uso..."), despues la formula.

Pensamiento expuesto --- marcadores concretos. Una entrada bien escrita tiene varias de estas construcciones:

Conectores conversacionales: "Lo primero que mire fue...", "Un dato que me llamo la atencion...", "Aca esta lo mas interesante...", "Un detalle importante...", "Lo llamativo es que...".

Skills relacionados

Cuaderno | Skills Pool

Entidades distintas, nombres distintos: cuando un conteo tiene matices (ej. "medios trazados" vs "cuentas unicas en Instagram"), usar terminos distintos y definirlos una vez explicitamente. Ejemplo que hubo que corregir: "31 medios confirmados" (ambiguo cuando 4 aliases de marca comparten cuenta con medios ya contados) --> "35 medios trazados sobre 31 perfiles unicos". No reutilizar el mismo numero si representa dos cosas distintas a lo largo del texto.
Dimension de los porcentajes: siempre aclarar si un porcentaje se computa sobre POSTS o sobre CUENTAS (el dataset casi siempre tiene las dos dimensiones disponibles y el resultado cambia). Ejemplo que hubo que corregir: "las cuentas business son mayoria (51.7%)" --> "los posts provienen mayoritariamente de cuentas business (51.7%)". En la dimension cuentas, business no era mayoria.
Ambiguedad de campos categoricos del MCL: cuando se segmenta por un campo como post_owner.type (business/creator/personal), discutir explicitamente si esa categorizacion es significativa para la pregunta analitica. Business/creator reflejan la configuracion de herramientas de perfil del titular, no su rol editorial: @barackobama es creator, @michelleobama es business, Newsmax es creator, NYT es business. Si la segmentacion mezcla "medio", "politico" y "creador viral", hay que decirlo en el texto y usar una capa externa (como la lista de Juana) para separar.
No asumir causa unica para anomalias: cuando se diagnostica un conjunto chico de casos raros (outliers, edge cases, posts "Neither"), inspeccionar CADA caso individualmente antes de categorizar. No extrapolar de 3-5 ejemplos al patron global: el caso modal suele esconder estructura categorica. Ejemplo real: en 2026-04-09.tex (primera iteracion) diagnostique los 42 posts "Neither" no-story como "ofuscacion Unicode + stories" a partir de 3-4 ejemplos; la auditoria profunda en el commit 58d9f16 revelo que eran 5 categorias estructurales con root causes completamente distintos (Unicode 13, redacted 3, username 1, drift 20, residual 5). Regla: si hay menos de 100 casos, enumerarlos exhaustivamente antes de afirmar "el patron es X". Si son mas, muestrear por cuantiles de una metrica relevante en vez de agarrar los primeros que aparecen.

Situacion	Target lineas
Setup / primer dia / infraestructura	10-20
Implementacion de codigo sin ciencia nueva	10-15
Lectura con 1-3 insights concretos	25-50
Analisis con 1-2 figuras y una idea central	40-80
Analisis con 3-5 figuras o tabla + narrativa	80-180
Analisis denso: 6+ figuras/tablas y multiples sub-temas	180-400
EDA completo o sesion de multiples analisis encadenados	400-600

\subsection{DD de Mes de YYYY --- Descripcion breve de lo realizado}
\label{entry:YYYY-MM-DD}

\paragraph{Objetivo.}
% 1-2 oraciones naturales. NO formato "Ejecutar los action items X, Y, Z" que suena a ticket.
% Si el dia arranca con una reunion que define las direcciones, puede ser mejor OMITIR el Objetivo
% formal y empezar directamente con \paragraph{Reunion con [nombre].} seguido de una introduccion
% narrativa que enmarca las direcciones acordadas.
% Ejemplos buenos:
%   "Revisar la tesis de Juana para evaluar si su metrica es aplicable a nuestro dataset."
%   "EDA completo del dataset MCL de Instagram para caracterizar los datos antes de NLP."
% Ejemplo malo:
%   "Ejecutar los cuatro analisis propuestos en la reunion del 4 de abril: identificacion
%   de medios, validacion de keywords, engagement normalizado y deteccion de picos."

\paragraph{Trabajo realizado.}
% Narrativa cronologica y razonada. Prosa conectada, NO listas de items.
% Aca van las figuras si las hay:
%
% \begin{figure}[!ht]
%   \centering
%   \includegraphics[width=0.8\textwidth]{../src/plots/nombre.png}
%   \caption{Descripcion completa en espanol.}
%   \label{fig:etiqueta}
% \end{figure}
% IMPORTANTE: el bloque \begin{figure} va INMEDIATAMENTE despues del
% parrafo que referencia la figura (no al final de la seccion). Cada
% figura es ATOMICA: un PNG por \begin{figure}, con su propio \label.
% Nunca combinar varios paneles en un mismo bloque (dificulta discutir
% paneles individualmente y controlar el placement).
% Generado por \texttt{@src/scripts/script.py}
%
% Aca van las ecuaciones si las hay:
% \begin{equation} ... \end{equation}
%
% Aca van las citas si corresponde: \cite{key}

% SOLO si hubo reunion:
\paragraph{Reunion con [nombre].}
% Decisiones, feedback, cambios de rumbo.

% SOLO si hay preguntas/ideas nuevas:
\paragraph{Preguntas abiertas.}

\paragraph{Proximos pasos.}
% 2-4 items telegraficos.

\subsection numerado (sin asterisco) para que aparezca en la tabla de contenidos. El titulo incluye la fecha seguida de --- y una descripcion breve (una oracion) de lo realizado ese dia. Ejemplo: \subsection{3 de abril de 2026 --- EDA completo del dataset MCL de Instagram}.
Figuras con placement [!ht] (NO [htbp]) y ubicadas inmediatamente despues del parrafo que las referencia. Tablas tambien con [!ht]. El objetivo es que cada figura/tabla flote lo menos posible del texto que la discute. Excepcion: cuando un subparagraph acumula mas de 4 figuras, la regla se invierte --- ver regla de agrupamiento abajo.
Agrupamiento de figuras cuando son >4 en un subparagraph. Si un subparagraph tiene mas de 4 figuras, NO intercalarlas con prosa: LaTeX con [!ht] reordena los floats y genera un efecto "muro de figuras" mas dificil de leer, no mas facil (error detectado al iterar sobre cuaderno/entradas/2026-04-09.tex, subparagraph "Engagement por cuenta" con 10 figuras en ~160 lineas, commit b913e8b). La regla correcta es dividir la prosa en 3-4 sub-bloques conceptuales, dejar que cada sub-bloque fluya sin interrupcion, y al final del sub-bloque agrupar sus 2-3 figuras con [htbp] (aca si [htbp], porque el objetivo deja de ser adyacencia y pasa a ser que el algoritmo natural de floats de LaTeX las ubique razonablemente). Patron de referencia:
```
% MAL: intercaladas con [!ht], LaTeX las reordena, muro de figuras
\subparagraph{Tema.}
Primera discusion...
\begin{figure}[!ht]...\end{figure}
Segunda discusion...
\begin{figure}[!ht]...\end{figure}

% BIEN: agrupadas al final de cada sub-bloque con [htbp]
\subparagraph{Tema.}
Primera discusion de la distribucion, mencionando la Figura~\ref{fig:X}.
Segunda discusion del ranking, mencionando la Figura~\ref{fig:Y}.

\begin{figure}[htbp]...\label{fig:X}\end{figure}
\begin{figure}[htbp]...\label{fig:Y}\end{figure}
```
Figuras atomicas: un PNG por \begin{figure}, con su propio \caption y \label. Nunca agrupar varios paneles en un solo bloque "por ahorrar espacio" --- dificulta discutir paneles individualmente en el texto, obliga a captions generalistas y complica el placement. Si un script produce 3 paneles, son 3 \begin{figure} separados.
Todas las figuras y entradas con \label para referencia cruzada.
Citas con \cite{key} usando las claves de bibliografia/refs.bib.
Escapar guiones bajos en paths: \texttt{src/scripts/mi\_script.py}.
Ecuaciones numeradas si son para referenciar, sin numero (equation*) si son auxiliares.
Fechas en espanol: "2 de abril de 2026". En \label: formato ISO entry:2026-04-02.
NEVER write author names with years as plain text (e.g., "del Pozo et al. (2024)"). ALWAYS use Author et al.~\cite{key}. Before generating the entry, verify every citation key exists in bibliografia/refs.bib.

Recoger contexto: git log desde cuaderno/.last_entry_hash, archivos modificados en src/, plots nuevos en src/plots/, y lo que el usuario diga al invocar el skill. Si no existe .last_entry_hash, mirar los ultimos 7 dias.
Evaluar relevancia: Hay material para una entrada? Si solo hubo cambios triviales y el usuario no agrega contexto, preguntar antes de generar: "No veo material suficiente para una entrada del cuaderno. Hay algo que quieras registrar que no este en los commits?"
Generar borrador: Siguiendo el template, las reglas de extension y los criterios de relevancia. Incluir solo secciones con contenido.
Auto-auditoria del borrador (antes del preview): correr este checklist y corregir cualquier fallo. Si fallan mas de 3 items, replantear la estructura global en vez de parche por parche.
- Citas: escanear el borrador por patrones de texto plano Author YYYY o Author et al. YYYY y convertir todo a \cite{clave} con claves verificadas en bibliografia/refs.bib.
- Voz pasiva: grep por "Se implement", "Se detect", "Se observ", "Se calcul", "Se obtuvo". Cero ocurrencias.
- Subparagraphs numerados: grep por subparagraph{Paso, subparagraph{Etapa, subparagraph{Fase. Cero ocurrencias.
- Sub-sub-labels prohibidos: grep por \emph{(a), \emph{(b), \emph{(c), \emph{(d) como sub-labels, y por patrones \emph{Titulo breve.} al comienzo de parrafo. Cero ocurrencias.
- Listas en contextos descriptivos: si hay itemize/enumerate fuera de "Preguntas abiertas", "Proximos pasos", "Decisiones pendientes", "Opciones", "Limitaciones", revisar si deberia ser prosa.
- Pensamiento expuesto: la entrada contiene al menos 2-3 marcadores conversacionales ("Lo primero que mire...", "Un dato que me llamo la atencion...", "No tengo claro...", "Me pregunte...", "?`Por que...?"). Si cero, el tono es reportador.
- Prueba del hilo (manual, no se delega a grep): antes del preview, parafrasear el arco narrativo en 3-4 oraciones. Si cuesta, hay problema de conexion entre subparagraphs o sobra contenido.
- Proporcionalidad: la extension cae en el rango esperado de la tabla de "Regla de proporcionalidad". Si se excede, validar que cada seccion justifica su espacio.
- Figuras vs. prosa: cada figura referenciada tiene al menos 2-3 oraciones de interpretacion en el texto, no solo un caption + "La Figura X muestra Y".
- Figuras atomicas: grep por \begin{figure} seguido de mas de un \includegraphics. Cada \begin{figure} debe tener exactamente un \includegraphics.
- Placement segun densidad: contar \begin{figure} dentro de cada \subparagraph. Si son <=4, placement [!ht] y figura adyacente al parrafo que la referencia. Si son >4, dividir la prosa en sub-bloques conceptuales y agrupar 2-3 figuras al final de cada sub-bloque con [htbp] (ver regla de agrupamiento).
- Objetivo y metodo explicitos: cada \subparagraph abre declarando QUE se investiga y COMO se aborda antes de mostrar resultados.
- Dimension de porcentajes: buscar porcentajes ("51.7\%", "60.5\%") y verificar que el texto adyacente aclara si se computan sobre POSTS o sobre CUENTAS.
- Proximos pasos estrategicos: los items del \paragraph{Proximos pasos} son features / consultas / analisis, no fixes de regex o correcciones de una linea.
- Codigo ausente: cero snippets en el .tex. Solo \texttt{@src/...} como referencia a archivos.
MOSTRAR PREVIEW: Imprimir la entrada completa. Preguntar "Guardamos esta entrada? Queres modificar algo?". NUNCA guardar sin confirmacion explicita del usuario.
Al confirmar:
- Guardar en cuaderno/entradas/YYYY-MM-DD.tex. Si el archivo ya existe (segunda entrada del mismo dia), appendear al final con \bigskip SIN repetir \subsection ni \label.
- Agregar \input{entradas/YYYY-MM-DD.tex} antes de % === NUEVA ENTRADA AQUI === en cuaderno/main.tex (verificar que no este duplicado).
- Escribir la fecha en cuaderno/.last_entry_date.
- Escribir el hash de HEAD en cuaderno/.last_entry_hash.
Compilar PDF: Ejecutar cd cuaderno && latexmk -pdf -interaction=nonstopmode main.tex para regenerar el PDF. Si la compilacion falla, avisar al usuario pero no revertir los cambios en los archivos .tex. Nota: hay un hook PostToolUse que compila automaticamente, pero este paso sirve como respaldo.
Ofrecer commit: Preguntar "Hacemos commit de la entrada y el PDF actualizado?". Si el usuario acepta, ejecutar:
```
git add cuaderno/entradas/YYYY-MM-DD.tex cuaderno/main.tex cuaderno/main.pdf cuaderno/.last_entry_date cuaderno/.last_entry_hash
git commit -m "Add cuaderno entry for YYYY-MM-DD"
```
Respetar las convenciones de commit del proyecto: ingles, imperativo. No commitear sin confirmacion explicita.

Cuaderno

Cuaderno de laboratorio — Generador de entradas

Voz y tono

Cuaderno

Cuaderno de laboratorio — Generador de entradas

Voz y tono

Microestructura narrativa

Que va en el cuaderno y cuanto espacio merece

Que NUNCA va en el cuaderno

Conocimiento de base sobre el dataset MCL

Regla de proporcionalidad

Template de entrada

Convenciones LaTeX

Convenciones del header / main.tex

Lecciones sobre layout LaTeX en el cuaderno

Lecciones sobre figuras

Workflow de polish narrativo para entries largas

Flujo de trabajo

Update Skills

Eval Harness

Ecc Tools Cost Audit

Code Tour

Rules Distill

Design System