- Implementa ProcessingMonitor singleton para procesamiento secuencial de archivos - Agrega AI summary service con soporte para MiniMax API - Agrega PDF generator para resúmenes - Agrega watchers para monitoreo de carpeta remota - Mejora sistema de notificaciones Telegram - Implementa gestión de VRAM para GPU - Configuración mediante variables de entorno (sin hardcoded secrets) - .env y transcriptions/ agregados a .gitignore Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
12 KiB
CODEX.md
Guia maestra para producir resúmenes académicos de alta calidad en HTML/PDF con coherencia conceptual, densidad útil y gráficos claros.
Esta guía está diseñada para cualquier materia:
- economía
- física
- historia
- biología
- derecho
- ingeniería
- filosofía
- otras
Objetivo: que cualquier IA pueda replicar un estándar profesional de resumen de estudio, no solo “texto lindo”.
1) Principios de diseño (no negociables)
- Claridad causal
- Cada afirmación importante debe responder: qué cambia, por qué cambia y qué consecuencia produce.
- Evitar listas de definiciones sin mecanismo.
- Legibilidad real para estudiar
- El documento debe poder leerse en bloques de 15-25 minutos.
- Los títulos deben guiar la estrategia de estudio, no solo “decorar”.
- Densidad informativa sana
- Evitar páginas vacías o con 2 líneas.
- Evitar “paredes de texto” sin respiración visual.
- Coherencia visual
- Mismo sistema de colores, etiquetas y jerarquía tipográfica en todo el documento.
- En gráficos, usar siempre convenciones constantes (ejes, colores, flechas, leyendas).
- Verificación pre y post PDF
- Revisar HTML antes de exportar.
- Revisar PDF final (paginado, cortes, legibilidad, textos residuales tipo
file://).
2) Flujo de trabajo general (end-to-end)
- Ingesta de fuentes
- Reunir transcripción (
.txt), material bibliográfico (.pdf) y guía de cátedra si existe. - Detectar ruido de transcripción: muletillas, repetición, errores de OCR.
- Extracción semántica
- Separar: conceptos núcleo, definiciones, procedimientos, ejemplos de clase, errores típicos de examen.
- Marcar explícitamente qué partes son “base” y cuáles son “expansión didáctica”.
- Diseño de estructura
- Construir índice con progresión lógica (de fundamentos a aplicación).
- Incluir sí o sí: casos resueltos, checklist, autoevaluación.
- Redacción por capas
- Capa 1: idea central de sección en 1-2 párrafos.
- Capa 2: tabla o esquema operativo.
- Capa 3: caja de “importante” o “error frecuente”.
- Capa 4: caso aplicado.
- Maquetación HTML
- Usar componentes consistentes: portada, secciones, tablas, cajas, gráficos SVG, banco de casos.
- Preparar para impresión A4 desde el inicio.
- Exportación PDF
- Exportar con motor headless estable (Chromium recomendado).
- Desactivar headers/footers automáticos del navegador.
- QA final
- Verificar páginas “casi vacías”.
- Verificar cortes feos (tabla partida, título huérfano, caja cortada).
- Verificar coherencia de gráficos y legibilidad de flechas/etiquetas.
3) Estructura recomendada del resumen (plantilla universal)
- Portada
- Materia + clase + tema central.
- Objetivo de estudio de esa clase.
- Mapa rápido (ruta de lectura en una línea).
- Índice
- 6 a 12 bloques como máximo por clase regular.
- Nombres de sección orientados a acción.
- Desarrollo conceptual
- Definiciones esenciales.
- Mecanismos principales.
- Tabla de términos operativos.
- Aplicación
- Casos simples.
- Casos combinados o ambiguos.
- Errores frecuentes.
- Entrenamiento examen
- Simulación de parcial (preguntas).
- Respuestas modelo cortas.
- Preguntas de desarrollo.
- Cierre
- Checklist final.
- Tarjetas de repaso.
- Mini glosario.
4) Reglas de redacción (para cualquier disciplina)
- Escribir en modo operativo
- En vez de “la elasticidad es importante”, escribir: “si |E| > 1, un aumento de precio reduce recaudación”.
- Separar descripción de inferencia
Descripción: qué se observa.Inferencia: qué significa y bajo qué condiciones.
- Evitar ambigüedad de sujeto
- No usar “esto cambia aquello” sin especificar variable.
- Definir límites
- Toda regla importante debe incluir cuándo no aplica.
- Frases de cierre por sección
- Cerrar sección con una frase “si te preguntan X, responde Y con Z mecanismo”.
5) Componentes visuales y semánticos
5.1 Cajas semánticas
-
.definicion- Uso: concepto técnico o regla formal.
- Debe responder “qué es”.
-
.importante- Uso: advertencia, límite, error típico.
- Debe responder “qué no confundir”.
-
.ejemplo- Uso: traducción a caso concreto.
- Debe responder “cómo se aplica”.
5.2 Tablas
Usar tablas para:
- comparaciones (A vs B)
- pasos de procedimiento
- matriz de cambios
Reglas:
- encabezado corto y explícito
- 3-5 columnas máximo
- celdas con frases breves, no párrafos largos
5.3 Gráficos (estándar universal)
Principio: todo gráfico debe poder leerse en 10 segundos.
Checklist mínimo por gráfico:
- ejes rotulados
- elementos con nombres visibles
- leyenda de colores
- flecha/sentido de cambio claro
- caption con interpretación
- bloque “Lectura del gráfico” con mecanismo en texto
6) Guía técnica de gráficos por tipo de materia
6.1 Economía
Formato base:
- Eje vertical: precio/salario/tasa
- Eje horizontal: cantidad/trabajo/fondos
- Curva inicial: gris
- Curva nueva: color principal (rojo demanda, verde oferta)
- Flecha: azul oscuro gruesa
- Resultado: texto final con dirección de equilibrio
Lectura mínima obligatoria:
Curva implicadaMecanismoResultado
6.2 Física
Gráficos típicos:
- posición-tiempo, velocidad-tiempo, aceleración-tiempo
- energía potencial vs coordenada
- circuitos (I-V)
Reglas:
- incluir unidades SI en ejes
- marcar pendiente/área cuando tenga significado físico
- incluir condición inicial/final
- indicar régimen (lineal/no lineal)
6.3 Historia
Gráficos útiles:
- línea de tiempo con hitos
- mapa de actores (Estado, grupos, alianzas)
- matriz causa-evento-consecuencia
Reglas:
- separar causas estructurales de detonantes
- distinguir corto vs largo plazo
- marcar continuidad vs ruptura
6.4 Biología
Gráficos útiles:
- rutas (metabólicas, señalización)
- taxonomías jerárquicas
- tablas comparativas de procesos
Reglas:
- nombrar niveles de organización
- explicitar entrada/salida de cada proceso
- marcar regulación positiva/negativa
6.5 Derecho
Diagramas útiles:
- flujo procedimental
- jerarquía normativa
- mapa de requisitos y excepciones
Reglas:
- identificar fuente normativa
- separar regla general y excepción
- incluir condición de aplicación
7) Estándar CSS recomendado (impresión A4)
Reglas de impresión:
@page size: A4- márgenes 1.5 a 2.0 cm
- tipografía serif para cuerpo (Georgia/Times)
- tamaño base 10.8-11.2 pt
Control de cortes:
- evitar
break-inside: avoidglobal indiscriminado - aplicar
break-inside: avoidsolo en:- tablas
- cajas críticas
- tarjetas de casos
Evitar páginas en blanco:
- no forzar
page-break-beforesalvo secciones pesadas (ej: banco de casos) - si un título queda solo al final de página, ajustar bloques previos o mover sección completa
8) Exportación PDF robusta
Comando recomendado:
chromium \
--headless \
--disable-gpu \
--no-sandbox \
--no-pdf-header-footer \
--print-to-pdf="salida.pdf" \
"file:///ruta/entrada.html"
Notas:
--no-pdf-header-footerevita contaminación confile://en pie.- Si aparecen rutas en PDF, revisar opciones de impresión primero.
9) QA automático mínimo
Herramientas:
pdfinfo: cantidad de páginaspdftotext: extracción y búsqueda de basura textualrg: detección rápida de patrones no deseados
Controles:
- Páginas casi vacías
- detectar páginas con bajo conteo de caracteres
- Referencias no deseadas
- buscar
file://,.txt,.pdfsi el usuario pidió ocultarlas
- Coherencia semántica
- cada gráfico debe tener caption y lectura textual
- Integridad visual
- no cortar tablas ni cajas
- no superponer flechas con etiquetas principales
10) Criterios de calidad (rúbrica 0-5)
- Precisión conceptual
- 0: errores de concepto graves
- 5: conceptos correctos y bien delimitados
- Coherencia causal
- 0: listado sin lógica
- 5: mecanismo explícito en cada bloque
- Utilidad para examen
- 0: no entrenable
- 5: casos + respuestas + checklist
- Calidad visual
- 0: ilegible o inconsistente
- 5: limpio, consistente, imprimible
- Control técnico
- 0: PDF defectuoso
- 5: sin residuos, sin páginas vacías, sin cortes feos
11) Reglas para banco de casos
Cada tarjeta de caso debe contener:
- título del caso
- por qué cambia
- curva/variable implicada
- mecanismo causal
- gráfico coherente
- resultado final
No aceptar tarjetas con:
- solo flechas
- gráfico sin explicación
- explicación sin variable concreta
12) Reglas para materias cuantitativas
Agregar siempre:
- fórmula núcleo
- interpretación económica/física/estadística de cada término
- ejemplo numérico mínimo
- error típico de cálculo
Cuando haya derivaciones:
- no mostrar álgebra larga si no agrega aprendizaje
- priorizar: qué representa, cuándo usarla, cómo interpretar signo/magnitud
13) Reglas para materias cualitativas
Agregar siempre:
- periodización o estructura argumental
- actores, intereses, instituciones
- relación causa-contexto-consecuencia
- contraste entre 2 interpretaciones
Evitar:
- relato cronológico sin tesis
- opiniones sin anclaje conceptual
14) Estrategia anti-ruido de transcripción
Cuando la fuente es clase oral transcripta:
- limpiar muletillas y repeticiones
- preservar ejemplos de cátedra que aclaren examen
- reconstruir frases incompletas manteniendo sentido
- marcar inferencias cuando la transcripción es ambigua
15) Política de trazabilidad (sin contaminar el PDF)
Internamente:
- guardar scripts de generación y QA
- versionar cambios de estructura y estilo
En PDF final:
- no imprimir rutas locales
- no imprimir referencias de archivos si el usuario lo pidió
- no insertar notas técnicas irrelevantes para estudio
16) Plantilla de prompts para IA (genérica)
Prompt base:
- “Construye un resumen extendido de [materia/tema], orientado a examen, en formato HTML imprimible A4, con:
- índice
- desarrollo conceptual
- tablas operativas
- banco de casos con gráficos SVG claros
- simulación de examen
- checklist final
- sin referencias a rutas de archivos en el PDF.”
Prompt de QA:
- “Audita este HTML/PDF buscando:
- páginas con bajo contenido
- títulos huérfanos
- gráficos sin contexto
- etiquetas ilegibles
- texto basura (file://, rutas) y propone correcciones puntuales.”
17) Errores frecuentes de IA y correcciones
- Error: demasiado resumen, poca utilidad
- Corrección: añadir banco de casos y respuestas modelo.
- Error: gráficos bonitos pero ambiguos
- Corrección: incluir leyenda, curva implicada y mecanismo textual.
- Error: demasiados saltos de página
- Corrección: reducir
page-breakforzado y reequilibrar bloques.
- Error: repite teoría del libro sin foco de examen
- Corrección: priorizar preguntas-tipo y decisiones de resolución.
- Error: no distingue hechos de inferencias
- Corrección: separar “dato/definición” de “interpretación/aplicación”.
18) Checklist final antes de entregar
Checklist editorial:
- índice consistente con secciones
- numeración correcta
- no hay contradicciones internas
Checklist visual:
- gráficos legibles al 100%
- flechas claras
- etiquetas no montadas
Checklist técnico:
- PDF abre y pagina bien
- no hay
file:// - no hay páginas casi vacías
Checklist pedagógico:
- hay práctica de examen
- hay respuestas modelo
- hay errores frecuentes
- hay cierre operativo
19) Meta-estándar esperado
Un resumen de “nivel alto” no es el más largo. Es el que logra simultáneamente:
- comprensión conceptual
- capacidad de resolver ejercicios
- lectura rápida y confiable antes del examen
- salida PDF limpia y estable
Si falta uno de esos cuatro, el resumen está incompleto.