## Asset Header

- **Asset ID:** DC-MPX-EvaluacionBookFactory-v01
- **Version:** v01
- **Status:** Draft
- **Owner:** Victor Heredia
- **IntellBank:** IB-MPX-MasterPlaybooks
- **Tipo:** DC — Document Canónico
- **Propósito:** Evaluación Profunda — Book Factory
- **Última actualización:** 2026-04-11

---

# Evaluación Profunda — Book Factory
## ¿El sistema cumple los objetivos reales?

> **Objetivo declarado:** 6+ resúmenes completos por día · Mínima intervención humana
> **Veredicto:** El sistema está bien diseñado para lo que fue — pero no para lo que necesitas ahora.

---

## 1. El problema de fondo: el sistema fue diseñado para otro objetivo

El Transfer Pack original decía **20 libros/semana** (~2.8/día) con **3 checkpoints humanos**. El objetivo real ahora es **6+/día** con **mínima intervención humana**.

Eso no es una optimización del sistema actual. Es un cambio de categoría.

| Métrica | Sistema v2.1 | Objetivo real | Brecha |
|---------|-------------|---------------|--------|
| Velocidad | 20/semana (~2.8/día) | 6+/día | **2.1x más rápido** |
| Checkpoints | 3 por libro | Mínimos posibles | **18 decisiones/día vs <6** |
| Paralelismo | 0 pistas paralelas | Múltiples simultáneos | **No existe** |
| Automatización | ~40% | >85% | **Gap crítico** |
| Orquestación | Manual | Automática | **No existe** |

---

## 2. El cuello de botella que mata la escala: los checkpoints

Con 3 checkpoints por libro y 6 libros/día, el operador toma **18 decisiones por día** mínimo.

**Carga humana real (sistema actual, 6 libros/día):**

```
Checkpoint #1 — Intake (E0):     6 validaciones/día
Checkpoint #2 — Índice E2:       3–6 aprobaciones/día (si 50–100% sin PDF)
Checkpoint #3 — QA/Publicación:  6 revisiones/día
Revisiones QA limítrofes:        1–2 adicionales/día
─────────────────────────────────────────────────────
Total decisiones humanas/día:    16 a 20
```

Esto no es mínima intervención. Es operación intensiva.

---

## 3. Los 4 cuellos de botella técnicos

### Cuello 1 — Pipeline 100% secuencial

```
Sistema actual:   Libro A → [E0→E1→E2→E3→E4A→E4B→E5→E6→E7]
                  Libro B →                                   [E0→...]
                  ← 10–12 horas de pipeline total →

Sistema necesario: Libro A → [E0→E1→...]
                   Libro B →      [E0→E1→...]
                   Libro C →           [E0→...]
                   ← Pipeline paralelo, libros desfasados →
```

### Cuello 2 — Checkpoint #2 no es automatizable en su forma actual
El operador lee un índice de 13–16 capítulos por libro. A 6 libros/día: 30–60 minutos diarios solo en este punto. Cualquier demora detiene toda esa rama del pipeline.

### Cuello 3 — La ejecución del QA no está definida operacionalmente
Con 15 preguntas por libro y 6 libros/día = **90 interacciones manuales diarias** solo en E6 si el operador corre las preguntas a mano.

### Cuello 4 — Alto volumen de llamadas LLM por libro

```
E1:  1 llamada
E2:  3 llamadas (P1 + P2 + P3)
E3:  ~4–5 llamadas (batches + consolidación)
E4A: 1 llamada
E4B: 1 llamada
E4C: 1 llamada
E5:  1 llamada
E6:  1 (batería) + 15 (evaluaciones) + 1 (dictamen) = 17 llamadas
E7:  1 (verificación)
────────────────────────────────────────────────
Total: ~30 llamadas LLM por libro (flujo sin-libro)
       ~25 llamadas LLM por libro (flujo con-libro)
A 6 libros/día: 150–180 llamadas LLM diarias
```

---

## 4. Lo que sí está bien y debe mantenerse

**✅ La arquitectura de artefactos es correcta.** Los 19 artefactos son atómicos y tienen propósitos claros.

**✅ El QA tiene criterios concretos.** Thresholds, tipos de preguntas y pesos son operables. La lógica es buena — falta la ejecución automatizada.

**✅ La Ficha de Producción (v2.1)** es exactamente lo que necesita un sistema de alta velocidad. Es la base de la orquestación automática.

**✅ El árbol de dependencias de E8** con orquestación puede ser completamente automático.

**✅ Los prompts de E1, E2, E3, E4A, E4B están maduros.** Probados con Iron War. Son la base confiable.

---

## 5. El componente que falta: la capa de orquestación

El sistema define **qué producir** en cada estación. No define **quién activa cada estación, cuándo, y cómo**.

```
Sin orquestación (sistema actual):
  Operador → copia prompt de E1 → pega en Claude → copia output
           → copia prompt de E2 → pega en Claude → copia output
           → ... para cada estación, para cada libro

Con orquestación:
  Sistema detecta nuevo libro en E0
  → activa E1 automáticamente
  → cuando E1 completa, activa E2 o E3 según routing
  → solo pausa cuando necesita decisión humana real
  → notifica al operador con contexto ya preparado
```

Sin esta capa, la Book Factory es una lista de prompts que alguien corre a mano.

---

## 6. Rediseño del modelo de intervención humana

### Checkpoint #1 — Intake (E0)
- **Hoy:** Operador revisa y firma cada libro
- **Propuesta:** Auto-aprobado si viene de lista curada. Humano solo para fuente desconocida o autoría ambigua
- **Reducción:** 6 → 1–2 decisiones/día

### Checkpoint #2 — Índice Virtual (E2)
- **Hoy:** Operador lee y aprueba cada índice
- **Propuesta:** Auto-aprobado si Score de Confianza = Alto. Humano solo si Score = Bajo o cobertura estimada < 60%
- **Reducción:** 3–6 → 0–1 decisiones/día

### Checkpoint #3 — Publicación (E7)
- **Hoy:** Operador revisa score QA y aprueba
- **Propuesta:** Auto-publicación si score QA ≥ 8.5. Humano solo si 7.0–8.4 o fallo en Tipo D
- **Reducción:** 6 → 1–2 decisiones/día

**Meta:** 3–5 decisiones humanas/día en vez de 18–20.

---

## 7. Veredicto por dimensión

| Dimensión | Estado actual | Para el objetivo real |
|-----------|--------------|----------------------|
| Arquitectura de artefactos | ✅ Sólida | Mantener |
| Calidad de prompts (E1–E4B) | ✅ Probada | Mantener |
| Velocidad del pipeline | 🔴 Insuficiente | Requiere paralelismo |
| Intervención humana | 🔴 Alta (18–20/día) | Requiere auto-aprobación |
| Orquestación | 🔴 No existe | Requiere diseño nuevo |
| Ejecución del QA | 🟡 Definida, no operada | Requiere automatización |
| Tracking (Ficha Producción) | ✅ Diseñada | Es la base de la orquestación |
| Mantenimiento (E8) | ✅ Diseñado | Mantener, automatizar |

---

## 8. Hoja de ruta para cumplir los objetivos reales

**Prioridad 1 — Desbloqueante inmediato**
Definir la capa de orquestación: qué sistema activa cada estación, cómo se notifica al operador, y dónde vive la Ficha de Producción en producción.

**Prioridad 2 — Escala de velocidad**
Diseñar el modelo de pistas paralelas: cómo corren múltiples libros simultáneamente sin interferencia.

**Prioridad 3 — Reducción de intervención humana**
Implementar reglas de auto-aprobación para los 3 checkpoints con umbrales concretos.

**Prioridad 4 — QA operacional**
Definir cómo se ejecuta Sherpa durante E6: ¿API? ¿interfaz automatizada? Sin esto el QA es manual a escala.

**Prioridad 5 — Prueba de throughput**
Correr el flujo completo con Iron War (E5→E6→E7) para medir tiempos reales y calcular si 6/día es alcanzable.

---

## Conclusión

La Book Factory v2.1 es un sistema **bien diseñado para producción artesanal de alta calidad**. Tiene la arquitectura correcta, los artefactos correctos y la lógica de calidad correcta.

Lo que no tiene aún es la **capa industrial**: orquestación automática, pistas paralelas, y reglas que eliminan la intervención humana donde no es necesaria.

El sistema está en la mitad del camino correcto. La base es sólida — lo que sigue es añadir el motor.

---

*Evaluación v1.0 · Book Factory · 2026-03-13*
