## Asset Header - **Asset ID:** DC-MPX-EvaluacionBookFactory-v01 - **Version:** v01 - **Status:** Draft - **Owner:** Victor Heredia - **IntellBank:** IB-MPX-MasterPlaybooks - **Tipo:** DC — Document Canónico - **Propósito:** Evaluación Profunda — Book Factory - **Última actualización:** 2026-04-11 --- # Evaluación Profunda — Book Factory ## ¿El sistema cumple los objetivos reales? > **Objetivo declarado:** 6+ resúmenes completos por día · Mínima intervención humana > **Veredicto:** El sistema está bien diseñado para lo que fue — pero no para lo que necesitas ahora. --- ## 1. El problema de fondo: el sistema fue diseñado para otro objetivo El Transfer Pack original decía **20 libros/semana** (~2.8/día) con **3 checkpoints humanos**. El objetivo real ahora es **6+/día** con **mínima intervención humana**. Eso no es una optimización del sistema actual. Es un cambio de categoría. | Métrica | Sistema v2.1 | Objetivo real | Brecha | |---------|-------------|---------------|--------| | Velocidad | 20/semana (~2.8/día) | 6+/día | **2.1x más rápido** | | Checkpoints | 3 por libro | Mínimos posibles | **18 decisiones/día vs <6** | | Paralelismo | 0 pistas paralelas | Múltiples simultáneos | **No existe** | | Automatización | ~40% | >85% | **Gap crítico** | | Orquestación | Manual | Automática | **No existe** | --- ## 2. El cuello de botella que mata la escala: los checkpoints Con 3 checkpoints por libro y 6 libros/día, el operador toma **18 decisiones por día** mínimo. **Carga humana real (sistema actual, 6 libros/día):** ``` Checkpoint #1 — Intake (E0): 6 validaciones/día Checkpoint #2 — Índice E2: 3–6 aprobaciones/día (si 50–100% sin PDF) Checkpoint #3 — QA/Publicación: 6 revisiones/día Revisiones QA limítrofes: 1–2 adicionales/día ───────────────────────────────────────────────────── Total decisiones humanas/día: 16 a 20 ``` Esto no es mínima intervención. Es operación intensiva. --- ## 3. Los 4 cuellos de botella técnicos ### Cuello 1 — Pipeline 100% secuencial ``` Sistema actual: Libro A → [E0→E1→E2→E3→E4A→E4B→E5→E6→E7] Libro B → [E0→...] ← 10–12 horas de pipeline total → Sistema necesario: Libro A → [E0→E1→...] Libro B → [E0→E1→...] Libro C → [E0→...] ← Pipeline paralelo, libros desfasados → ``` ### Cuello 2 — Checkpoint #2 no es automatizable en su forma actual El operador lee un índice de 13–16 capítulos por libro. A 6 libros/día: 30–60 minutos diarios solo en este punto. Cualquier demora detiene toda esa rama del pipeline. ### Cuello 3 — La ejecución del QA no está definida operacionalmente Con 15 preguntas por libro y 6 libros/día = **90 interacciones manuales diarias** solo en E6 si el operador corre las preguntas a mano. ### Cuello 4 — Alto volumen de llamadas LLM por libro ``` E1: 1 llamada E2: 3 llamadas (P1 + P2 + P3) E3: ~4–5 llamadas (batches + consolidación) E4A: 1 llamada E4B: 1 llamada E4C: 1 llamada E5: 1 llamada E6: 1 (batería) + 15 (evaluaciones) + 1 (dictamen) = 17 llamadas E7: 1 (verificación) ──────────────────────────────────────────────── Total: ~30 llamadas LLM por libro (flujo sin-libro) ~25 llamadas LLM por libro (flujo con-libro) A 6 libros/día: 150–180 llamadas LLM diarias ``` --- ## 4. Lo que sí está bien y debe mantenerse **✅ La arquitectura de artefactos es correcta.** Los 19 artefactos son atómicos y tienen propósitos claros. **✅ El QA tiene criterios concretos.** Thresholds, tipos de preguntas y pesos son operables. La lógica es buena — falta la ejecución automatizada. **✅ La Ficha de Producción (v2.1)** es exactamente lo que necesita un sistema de alta velocidad. Es la base de la orquestación automática. **✅ El árbol de dependencias de E8** con orquestación puede ser completamente automático. **✅ Los prompts de E1, E2, E3, E4A, E4B están maduros.** Probados con Iron War. Son la base confiable. --- ## 5. El componente que falta: la capa de orquestación El sistema define **qué producir** en cada estación. No define **quién activa cada estación, cuándo, y cómo**. ``` Sin orquestación (sistema actual): Operador → copia prompt de E1 → pega en Claude → copia output → copia prompt de E2 → pega en Claude → copia output → ... para cada estación, para cada libro Con orquestación: Sistema detecta nuevo libro en E0 → activa E1 automáticamente → cuando E1 completa, activa E2 o E3 según routing → solo pausa cuando necesita decisión humana real → notifica al operador con contexto ya preparado ``` Sin esta capa, la Book Factory es una lista de prompts que alguien corre a mano. --- ## 6. Rediseño del modelo de intervención humana ### Checkpoint #1 — Intake (E0) - **Hoy:** Operador revisa y firma cada libro - **Propuesta:** Auto-aprobado si viene de lista curada. Humano solo para fuente desconocida o autoría ambigua - **Reducción:** 6 → 1–2 decisiones/día ### Checkpoint #2 — Índice Virtual (E2) - **Hoy:** Operador lee y aprueba cada índice - **Propuesta:** Auto-aprobado si Score de Confianza = Alto. Humano solo si Score = Bajo o cobertura estimada < 60% - **Reducción:** 3–6 → 0–1 decisiones/día ### Checkpoint #3 — Publicación (E7) - **Hoy:** Operador revisa score QA y aprueba - **Propuesta:** Auto-publicación si score QA ≥ 8.5. Humano solo si 7.0–8.4 o fallo en Tipo D - **Reducción:** 6 → 1–2 decisiones/día **Meta:** 3–5 decisiones humanas/día en vez de 18–20. --- ## 7. Veredicto por dimensión | Dimensión | Estado actual | Para el objetivo real | |-----------|--------------|----------------------| | Arquitectura de artefactos | ✅ Sólida | Mantener | | Calidad de prompts (E1–E4B) | ✅ Probada | Mantener | | Velocidad del pipeline | 🔴 Insuficiente | Requiere paralelismo | | Intervención humana | 🔴 Alta (18–20/día) | Requiere auto-aprobación | | Orquestación | 🔴 No existe | Requiere diseño nuevo | | Ejecución del QA | 🟡 Definida, no operada | Requiere automatización | | Tracking (Ficha Producción) | ✅ Diseñada | Es la base de la orquestación | | Mantenimiento (E8) | ✅ Diseñado | Mantener, automatizar | --- ## 8. Hoja de ruta para cumplir los objetivos reales **Prioridad 1 — Desbloqueante inmediato** Definir la capa de orquestación: qué sistema activa cada estación, cómo se notifica al operador, y dónde vive la Ficha de Producción en producción. **Prioridad 2 — Escala de velocidad** Diseñar el modelo de pistas paralelas: cómo corren múltiples libros simultáneamente sin interferencia. **Prioridad 3 — Reducción de intervención humana** Implementar reglas de auto-aprobación para los 3 checkpoints con umbrales concretos. **Prioridad 4 — QA operacional** Definir cómo se ejecuta Sherpa durante E6: ¿API? ¿interfaz automatizada? Sin esto el QA es manual a escala. **Prioridad 5 — Prueba de throughput** Correr el flujo completo con Iron War (E5→E6→E7) para medir tiempos reales y calcular si 6/día es alcanzable. --- ## Conclusión La Book Factory v2.1 es un sistema **bien diseñado para producción artesanal de alta calidad**. Tiene la arquitectura correcta, los artefactos correctos y la lógica de calidad correcta. Lo que no tiene aún es la **capa industrial**: orquestación automática, pistas paralelas, y reglas que eliminan la intervención humana donde no es necesaria. El sistema está en la mitad del camino correcto. La base es sólida — lo que sigue es añadir el motor. --- *Evaluación v1.0 · Book Factory · 2026-03-13*