Files
cbc2027/codex.md
renato97 ee8fc183be feat: Sistema CBCFacil completo con cola secuencial
- Implementa ProcessingMonitor singleton para procesamiento secuencial de archivos
- Agrega AI summary service con soporte para MiniMax API
- Agrega PDF generator para resúmenes
- Agrega watchers para monitoreo de carpeta remota
- Mejora sistema de notificaciones Telegram
- Implementa gestión de VRAM para GPU
- Configuración mediante variables de entorno (sin hardcoded secrets)
- .env y transcriptions/ agregados a .gitignore

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-25 15:35:39 +00:00

12 KiB

CODEX.md

Guia maestra para producir resúmenes académicos de alta calidad en HTML/PDF con coherencia conceptual, densidad útil y gráficos claros.

Esta guía está diseñada para cualquier materia:

  • economía
  • física
  • historia
  • biología
  • derecho
  • ingeniería
  • filosofía
  • otras

Objetivo: que cualquier IA pueda replicar un estándar profesional de resumen de estudio, no solo “texto lindo”.

1) Principios de diseño (no negociables)

  1. Claridad causal
  • Cada afirmación importante debe responder: qué cambia, por qué cambia y qué consecuencia produce.
  • Evitar listas de definiciones sin mecanismo.
  1. Legibilidad real para estudiar
  • El documento debe poder leerse en bloques de 15-25 minutos.
  • Los títulos deben guiar la estrategia de estudio, no solo “decorar”.
  1. Densidad informativa sana
  • Evitar páginas vacías o con 2 líneas.
  • Evitar “paredes de texto” sin respiración visual.
  1. Coherencia visual
  • Mismo sistema de colores, etiquetas y jerarquía tipográfica en todo el documento.
  • En gráficos, usar siempre convenciones constantes (ejes, colores, flechas, leyendas).
  1. Verificación pre y post PDF
  • Revisar HTML antes de exportar.
  • Revisar PDF final (paginado, cortes, legibilidad, textos residuales tipo file://).

2) Flujo de trabajo general (end-to-end)

  1. Ingesta de fuentes
  • Reunir transcripción (.txt), material bibliográfico (.pdf) y guía de cátedra si existe.
  • Detectar ruido de transcripción: muletillas, repetición, errores de OCR.
  1. Extracción semántica
  • Separar: conceptos núcleo, definiciones, procedimientos, ejemplos de clase, errores típicos de examen.
  • Marcar explícitamente qué partes son “base” y cuáles son “expansión didáctica”.
  1. Diseño de estructura
  • Construir índice con progresión lógica (de fundamentos a aplicación).
  • Incluir sí o sí: casos resueltos, checklist, autoevaluación.
  1. Redacción por capas
  • Capa 1: idea central de sección en 1-2 párrafos.
  • Capa 2: tabla o esquema operativo.
  • Capa 3: caja de “importante” o “error frecuente”.
  • Capa 4: caso aplicado.
  1. Maquetación HTML
  • Usar componentes consistentes: portada, secciones, tablas, cajas, gráficos SVG, banco de casos.
  • Preparar para impresión A4 desde el inicio.
  1. Exportación PDF
  • Exportar con motor headless estable (Chromium recomendado).
  • Desactivar headers/footers automáticos del navegador.
  1. QA final
  • Verificar páginas “casi vacías”.
  • Verificar cortes feos (tabla partida, título huérfano, caja cortada).
  • Verificar coherencia de gráficos y legibilidad de flechas/etiquetas.

3) Estructura recomendada del resumen (plantilla universal)

  1. Portada
  • Materia + clase + tema central.
  • Objetivo de estudio de esa clase.
  • Mapa rápido (ruta de lectura en una línea).
  1. Índice
  • 6 a 12 bloques como máximo por clase regular.
  • Nombres de sección orientados a acción.
  1. Desarrollo conceptual
  • Definiciones esenciales.
  • Mecanismos principales.
  • Tabla de términos operativos.
  1. Aplicación
  • Casos simples.
  • Casos combinados o ambiguos.
  • Errores frecuentes.
  1. Entrenamiento examen
  • Simulación de parcial (preguntas).
  • Respuestas modelo cortas.
  • Preguntas de desarrollo.
  1. Cierre
  • Checklist final.
  • Tarjetas de repaso.
  • Mini glosario.

4) Reglas de redacción (para cualquier disciplina)

  1. Escribir en modo operativo
  • En vez de “la elasticidad es importante”, escribir: “si |E| > 1, un aumento de precio reduce recaudación”.
  1. Separar descripción de inferencia
  • Descripción: qué se observa.
  • Inferencia: qué significa y bajo qué condiciones.
  1. Evitar ambigüedad de sujeto
  • No usar “esto cambia aquello” sin especificar variable.
  1. Definir límites
  • Toda regla importante debe incluir cuándo no aplica.
  1. Frases de cierre por sección
  • Cerrar sección con una frase “si te preguntan X, responde Y con Z mecanismo”.

5) Componentes visuales y semánticos

5.1 Cajas semánticas

  • .definicion

    • Uso: concepto técnico o regla formal.
    • Debe responder “qué es”.
  • .importante

    • Uso: advertencia, límite, error típico.
    • Debe responder “qué no confundir”.
  • .ejemplo

    • Uso: traducción a caso concreto.
    • Debe responder “cómo se aplica”.

5.2 Tablas

Usar tablas para:

  • comparaciones (A vs B)
  • pasos de procedimiento
  • matriz de cambios

Reglas:

  • encabezado corto y explícito
  • 3-5 columnas máximo
  • celdas con frases breves, no párrafos largos

5.3 Gráficos (estándar universal)

Principio: todo gráfico debe poder leerse en 10 segundos.

Checklist mínimo por gráfico:

  • ejes rotulados
  • elementos con nombres visibles
  • leyenda de colores
  • flecha/sentido de cambio claro
  • caption con interpretación
  • bloque “Lectura del gráfico” con mecanismo en texto

6) Guía técnica de gráficos por tipo de materia

6.1 Economía

Formato base:

  • Eje vertical: precio/salario/tasa
  • Eje horizontal: cantidad/trabajo/fondos
  • Curva inicial: gris
  • Curva nueva: color principal (rojo demanda, verde oferta)
  • Flecha: azul oscuro gruesa
  • Resultado: texto final con dirección de equilibrio

Lectura mínima obligatoria:

  • Curva implicada
  • Mecanismo
  • Resultado

6.2 Física

Gráficos típicos:

  • posición-tiempo, velocidad-tiempo, aceleración-tiempo
  • energía potencial vs coordenada
  • circuitos (I-V)

Reglas:

  • incluir unidades SI en ejes
  • marcar pendiente/área cuando tenga significado físico
  • incluir condición inicial/final
  • indicar régimen (lineal/no lineal)

6.3 Historia

Gráficos útiles:

  • línea de tiempo con hitos
  • mapa de actores (Estado, grupos, alianzas)
  • matriz causa-evento-consecuencia

Reglas:

  • separar causas estructurales de detonantes
  • distinguir corto vs largo plazo
  • marcar continuidad vs ruptura

6.4 Biología

Gráficos útiles:

  • rutas (metabólicas, señalización)
  • taxonomías jerárquicas
  • tablas comparativas de procesos

Reglas:

  • nombrar niveles de organización
  • explicitar entrada/salida de cada proceso
  • marcar regulación positiva/negativa

6.5 Derecho

Diagramas útiles:

  • flujo procedimental
  • jerarquía normativa
  • mapa de requisitos y excepciones

Reglas:

  • identificar fuente normativa
  • separar regla general y excepción
  • incluir condición de aplicación

7) Estándar CSS recomendado (impresión A4)

Reglas de impresión:

  • @page size: A4
  • márgenes 1.5 a 2.0 cm
  • tipografía serif para cuerpo (Georgia/Times)
  • tamaño base 10.8-11.2 pt

Control de cortes:

  • evitar break-inside: avoid global indiscriminado
  • aplicar break-inside: avoid solo en:
    • tablas
    • cajas críticas
    • tarjetas de casos

Evitar páginas en blanco:

  • no forzar page-break-before salvo secciones pesadas (ej: banco de casos)
  • si un título queda solo al final de página, ajustar bloques previos o mover sección completa

8) Exportación PDF robusta

Comando recomendado:

chromium \
  --headless \
  --disable-gpu \
  --no-sandbox \
  --no-pdf-header-footer \
  --print-to-pdf="salida.pdf" \
  "file:///ruta/entrada.html"

Notas:

  • --no-pdf-header-footer evita contaminación con file:// en pie.
  • Si aparecen rutas en PDF, revisar opciones de impresión primero.

9) QA automático mínimo

Herramientas:

  • pdfinfo: cantidad de páginas
  • pdftotext: extracción y búsqueda de basura textual
  • rg: detección rápida de patrones no deseados

Controles:

  1. Páginas casi vacías
  • detectar páginas con bajo conteo de caracteres
  1. Referencias no deseadas
  • buscar file://, .txt, .pdf si el usuario pidió ocultarlas
  1. Coherencia semántica
  • cada gráfico debe tener caption y lectura textual
  1. Integridad visual
  • no cortar tablas ni cajas
  • no superponer flechas con etiquetas principales

10) Criterios de calidad (rúbrica 0-5)

  1. Precisión conceptual
  • 0: errores de concepto graves
  • 5: conceptos correctos y bien delimitados
  1. Coherencia causal
  • 0: listado sin lógica
  • 5: mecanismo explícito en cada bloque
  1. Utilidad para examen
  • 0: no entrenable
  • 5: casos + respuestas + checklist
  1. Calidad visual
  • 0: ilegible o inconsistente
  • 5: limpio, consistente, imprimible
  1. Control técnico
  • 0: PDF defectuoso
  • 5: sin residuos, sin páginas vacías, sin cortes feos

11) Reglas para banco de casos

Cada tarjeta de caso debe contener:

  • título del caso
  • por qué cambia
  • curva/variable implicada
  • mecanismo causal
  • gráfico coherente
  • resultado final

No aceptar tarjetas con:

  • solo flechas
  • gráfico sin explicación
  • explicación sin variable concreta

12) Reglas para materias cuantitativas

Agregar siempre:

  • fórmula núcleo
  • interpretación económica/física/estadística de cada término
  • ejemplo numérico mínimo
  • error típico de cálculo

Cuando haya derivaciones:

  • no mostrar álgebra larga si no agrega aprendizaje
  • priorizar: qué representa, cuándo usarla, cómo interpretar signo/magnitud

13) Reglas para materias cualitativas

Agregar siempre:

  • periodización o estructura argumental
  • actores, intereses, instituciones
  • relación causa-contexto-consecuencia
  • contraste entre 2 interpretaciones

Evitar:

  • relato cronológico sin tesis
  • opiniones sin anclaje conceptual

14) Estrategia anti-ruido de transcripción

Cuando la fuente es clase oral transcripta:

  • limpiar muletillas y repeticiones
  • preservar ejemplos de cátedra que aclaren examen
  • reconstruir frases incompletas manteniendo sentido
  • marcar inferencias cuando la transcripción es ambigua

15) Política de trazabilidad (sin contaminar el PDF)

Internamente:

  • guardar scripts de generación y QA
  • versionar cambios de estructura y estilo

En PDF final:

  • no imprimir rutas locales
  • no imprimir referencias de archivos si el usuario lo pidió
  • no insertar notas técnicas irrelevantes para estudio

16) Plantilla de prompts para IA (genérica)

Prompt base:

  • “Construye un resumen extendido de [materia/tema], orientado a examen, en formato HTML imprimible A4, con:
    • índice
    • desarrollo conceptual
    • tablas operativas
    • banco de casos con gráficos SVG claros
    • simulación de examen
    • checklist final
    • sin referencias a rutas de archivos en el PDF.”

Prompt de QA:

  • “Audita este HTML/PDF buscando:
    • páginas con bajo contenido
    • títulos huérfanos
    • gráficos sin contexto
    • etiquetas ilegibles
    • texto basura (file://, rutas) y propone correcciones puntuales.”

17) Errores frecuentes de IA y correcciones

  1. Error: demasiado resumen, poca utilidad
  • Corrección: añadir banco de casos y respuestas modelo.
  1. Error: gráficos bonitos pero ambiguos
  • Corrección: incluir leyenda, curva implicada y mecanismo textual.
  1. Error: demasiados saltos de página
  • Corrección: reducir page-break forzado y reequilibrar bloques.
  1. Error: repite teoría del libro sin foco de examen
  • Corrección: priorizar preguntas-tipo y decisiones de resolución.
  1. Error: no distingue hechos de inferencias
  • Corrección: separar “dato/definición” de “interpretación/aplicación”.

18) Checklist final antes de entregar

Checklist editorial:

  • índice consistente con secciones
  • numeración correcta
  • no hay contradicciones internas

Checklist visual:

  • gráficos legibles al 100%
  • flechas claras
  • etiquetas no montadas

Checklist técnico:

  • PDF abre y pagina bien
  • no hay file://
  • no hay páginas casi vacías

Checklist pedagógico:

  • hay práctica de examen
  • hay respuestas modelo
  • hay errores frecuentes
  • hay cierre operativo

19) Meta-estándar esperado

Un resumen de “nivel alto” no es el más largo. Es el que logra simultáneamente:

  • comprensión conceptual
  • capacidad de resolver ejercicios
  • lectura rápida y confiable antes del examen
  • salida PDF limpia y estable

Si falta uno de esos cuatro, el resumen está incompleto.