## Asset Header

- **Asset ID:** SOP-MPX-BookFactorySistema-v01
- **Version:** v01
- **Status:** Draft
- **Owner:** Victor Heredia
- **IntellBank:** IB-MPX-MasterPlaybooks
- **Tipo:** SOP — Standard Operating Procedure
- **Propósito:** 🏭 Book Factory — Master Playbooks v2.0
- **Última actualización:** 2026-04-11

---

# 🏭 Book Factory — Master Playbooks v2.0
> Sistema de producción de conocimiento estructurado para Sherpa · 20 libros/semana · 3 checkpoints humanos

---

## ¿Qué es la Book Factory?

Una factoría que transforma libros en conocimiento estructurado profundo. Cada libro entra como materia prima y sale como un ecosistema de artefactos que permite a **Sherpa** — un asistente de IA — responder preguntas del lector como si fuera el propio autor.

El modelo se inspira en la **Big MetaFactory**: cada libro pasa por estaciones de producción en orden, y en cada estación se generan artefactos claros, reutilizables y encadenados.

---

## Arquitectura del Sistema

### Flujo CON libro disponible
```
Intake → Fase 1A → Fase 1B → Fase 3 → Fase 4 → Fase 5 → Fase 6
```

### Flujo SIN libro disponible
```
Intake → Fase 1A → Fase 2 → Fase 1B → Fase 3 → Fase 4 → Fase 5 → Fase 6
```

---

## Intake — Entrada del Sistema

**4 campos requeridos:**

| Campo | Tipo | Valores |
|-------|------|---------|
| `titulo` | texto | Título completo del libro |
| `autor` | texto | Nombre completo del autor |
| `libro_disponible` | booleano | `sí` / `no` |
| `tipo_autoria` | enum | `individual` / `colectiva` |

**Reglas de flujo:**
- `libro_disponible = no` → activa Fase 2
- `tipo_autoria = colectiva` → voz Sherpa = filosofía editorial del director

⚑ **Checkpoint #1** — El operador valida clasificación y disponibilidad del libro

---

## Fase 1A — Investigación del Libro y Autor
**Status:** ✅ Definida y probada

**Propósito:** Producir contexto completo del libro y del autor. Los lentes cognitivos y la voz NO se generan aquí.

**Inputs:** Ficha de Intake · Fuentes públicas (web, entrevistas, podcasts, reseñas, Goodreads)

**Outputs:**
- Clasificación con granularidad (categoría, subcategoría, tipo, audiencia)
- Tesis central precisa (suficiente para reconstruir el libro)
- Argumentos clave en orden lógico (mínimo 3)
- Biografía intelectual del autor
- Obra completa + posición en el campo

### Artefactos generados
- 📚 **Investigación del Libro** — Documento MD
- 👤 **Perfil del Autor** — Documento MD

---

## Fase 2 — Libro Virtual
**Status:** ✅ Definida y probada | **Condición:** Solo activa cuando `libro_disponible = NO`

**Propósito:** Reconstruir el contenido del libro capítulo a capítulo cuando no hay PDF disponible.

**3 prompts encadenados:**
1. **Prompt 2.1** — Verificación y ampliación de conocimiento
2. **Prompt 2.2** — Generación del índice para validación humana
3. **Prompt 2.3** — Reconstrucción completa (solo después de aprobación)

**Inputs:** Output Fase 1A · Resúmenes, reseñas por capítulo, transcripciones

**Outputs:**
- Índice validado (Estructural o Conceptual según fuentes)
- Reconstrucción capítulo a capítulo con 5 elementos por capítulo
- Score de cobertura global (% cubierto)

### Artefactos generados
- 📖 **Libro Virtual** — Documento MD
- 📊 **Score de Cobertura** — Métrica + alerta si < 50%

⚑ **Checkpoint #2** — El operador aprueba el índice antes de la reconstrucción completa

---

## Fase 1B — Lentes Cognitivos y Voz Intelectual
**Status:** ✅ Definida y probada

**Propósito:** Derivar cómo piensa y habla el autor desde el contenido del libro. Siempre después de tener el contenido. Usa batches de 3–4 capítulos.

**2 prompts encadenados:**
1. **Prompt 1B.1** — Extracción por batch de capítulos (ficha por capítulo)
2. **Prompt 1B.2** — Consolidación del perfil intelectual definitivo

**Inputs:** Contenido del libro (real o virtual) · Perfil del autor (Fase 1A)

**Outputs:**
- 3–6 lentes cognitivos con evidencia por capítulo (mínimo 3 capítulos por lente)
- Voz intelectual consolidada con vocabulario (10–15 términos)
- Filtros negativos: "Lo que NUNCA diría" (mínimo 4 afirmaciones concretas)
- Manejo de la incertidumbre (cómo responde Sherpa cuando algo excede el libro)

### Artefactos generados
- 🔭 **Lentes Cognitivos** — Documento MD
- 🎙️ **Voz Intelectual del Autor** — Documento MD
- 🚫 **Filtros Negativos** — Sección crítica para Sherpa

---

## Fase 3 — Producción del Resumen
**Status:** ✅ Definida y probada

**Propósito:** Producir el resumen publicable en la voz del autor + los chunks para Sherpa.

**Estructura del Resumen Amplio:**
- Libros **narrativos/encadenados** → 4–7 bloques temáticos
- Libros **prescriptivos/temáticos** → 4–8 ejes temáticos

**Playbook fusionado — 7 elementos por sección:**

| Elemento | Descripción |
|----------|-------------|
| Objetivo del paso | 1 oración: qué herramienta gana el lector |
| Qué hacer | Acción concreta en imperativo |
| Cómo hacerlo | Instrucción práctica específica |
| Cuándo aplicarlo | Momento o frecuencia concreta |
| Indicador de progreso | Señal observable y concreta |
| Mini caso genérico | Ejemplo del lector, no del libro |
| Error común a evitar | Error + corrección |

**3 prompts:**
1. **Prompt 3.1** — Generación del Resumen Completo (en voz del autor)
2. **Prompt 3.2** — Estructuración para RAG (chunks .md)
3. **Prompt 3.3** — Generación de Prompts Visuales (Midjourney)

### Artefactos generados
- 📄 **Resumen Publicable** — `.docx` (lo que lee el lector)
- 🧩 **Chunks RAG** — `.md` (16+ chunks para Sherpa)
- 🎨 **Prompts Visuales** — 5 prompts Midjourney con paleta de colores

---

## Fase 4 — Fuente Completa RAG ⬅ SPRINT 3
**Status:** 🔲 Siguiente a implementar

**Propósito:** Integrar todos los outputs anteriores en UN SOLO documento maestro estructurado para recuperación semántica. Este es el documento que consume Sherpa — no los chunks sueltos de Fase 3.

**4 bloques fijos en este orden:**

```
Bloque 1 — Perfil del Autor y Lentes Cognitivos    [Alta prioridad]
Bloque 2 — Mapa Conceptual del Libro               [Media-alta prioridad]
Bloque 3 — Contenido por Sección                   [Pares: contenido + playbook]
Bloque 4 — Contexto Externo                        [Baja prioridad]
```

**Reglas de construcción:**
- Cada chunk es **autocontenido** (Sherpa responde con solo ese chunk)
- Cada chunk lleva **header semántico**: tipo + temas + prioridad + preguntas activadoras
- Todo en **voz del autor** con su vocabulario
- Versión registrada (`v1.0`) para trazabilidad

**Especificaciones técnicas:**

| Parámetro | Valor |
|-----------|-------|
| Formato | `.md` único |
| Tamaño por chunk | 200–600 palabras |
| Header semántico | Obligatorio |
| Metadatos mínimos | Tipo + Prioridad + Preguntas activadoras |

### Artefactos generados
- 🗄️ **Fuente Completa Sherpa** — `.md` maestro para RAG
- 📑 **Índice de Chunks** — Mapa de recuperación con prioridades

---

## Fase 5 — QA Automático ⬅ SPRINT 3
**Status:** 🔲 Pendiente de implementar

**Propósito:** Evaluar si Sherpa puede responder correctamente antes de publicar. Ningún libro llega a producción sin pasar el QA.

**4 tipos de preguntas:**

| Tipo | Qué prueba | Señal de fallo |
|------|-----------|----------------|
| **A — Recuperación directa** | Sherpa encuentra información correcta | Inventa datos o confunde conceptos |
| **B — Aplicación/Inferencia** | Sherpa aplica los frameworks a situaciones nuevas | Respuestas genéricas sin los lentes del autor |
| **C — Preguntas de borde** | Sherpa sabe qué NO cubre el libro | Inventa respuestas para temas no cubiertos |
| **D — Preguntas trampa** | Sherpa no alucina ni atribuye ideas falsas | Confirma afirmaciones inventadas |

**Calibración por tipo de libro:**

| Tipo | A | B | C | D | Total |
|------|---|---|---|---|-------|
| Prescriptivo | 4 | 5 | 3 | 3 | 15 |
| Narrativo | 5 | 3 | 4 | 3 | 15 |
| Analítico | 5 | 4 | 4 | 2 | 15 |
| Académico | 6 | 3 | 4 | 2 | 15 |

**Thresholds de aprobación:**

| Condición | Threshold | Consecuencia |
|-----------|-----------|--------------|
| Score ≥ 8.0 | Aprobado | → Fase 6 |
| Score 7.0–7.9 | Revisión humana | → Checkpoint especial |
| Score < 7.0 | Rechazado | → Regresa a fase |
| Tipo D — fallos | 0 permitidos | Cualquier fallo = revisión |

**Pesos de evaluación LLM-as-judge:**
- Precisión factual: **35%**
- Voz del autor: **25%**
- Manejo de límites: **25%**
- Utilidad para el lector: **15%**

**3 prompts:**
1. **Prompt 5.1** — Generación de la batería de preguntas con respuestas esperadas
2. **Prompt 5.2** — Evaluación LLM-as-judge (4 dimensiones)
3. **Prompt 5.3** — Dictamen final con causa raíz y fase de regreso

### Artefactos generados
- 🧪 **Batería de Preguntas QA** — 15–20 preguntas categorizadas
- 📊 **Score de Calidad** — Evaluación LLM-as-judge por dimensión
- ✅ **Dictamen Final** — Aprobar · Revisión humana · Rechazar + fase de regreso

---

## Fase 6 — Publicación ⬅ SPRINT 3
**Status:** 🔲 Pendiente de implementar

**Propósito:** Publicar el resumen para el lector y activar Sherpa con la Fuente Completa.

**Condiciones de entrada:**
- QA dictamen = APROBADO → Checkpoint #3
- QA dictamen = REVISIÓN HUMANA → Operador resuelve → Checkpoint #3
- QA dictamen = RECHAZADO → ❌ No entra. Regresa a fase indicada

**3 acciones de publicación:**
1. **Acción 6.A** — Upload del `.docx` a la plataforma (para el lector)
2. **Acción 6.B** — Upload de la Fuente Completa al sistema RAG (para Sherpa)
3. **Acción 6.C** — Activación de Sherpa con sistema prompt configurado

⚑ **Checkpoint #3** — El operador revisa el score QA y aprueba el go-live

### Artefactos generados
- 🚀 **Libro Publicado** — Visible para lectores en la plataforma
- 🤖 **Sherpa Activo** — RAG operativo, responde como el autor

---

## Inventario Completo de Artefactos

| # | Fase | Artefacto | Formato | Condición |
|---|------|-----------|---------|-----------|
| 01 | INT | 📋 Ficha de Intake | Registro | Siempre |
| 02 | 1A | 📚 Investigación del Libro | MD | Siempre |
| 03 | 1A | 👤 Perfil del Autor | MD | Siempre |
| 04 | 2 | 📖 Libro Virtual | MD | Sin libro |
| 05 | 2 | 📊 Score de Cobertura | Métrica | Sin libro |
| 06 | 1B | 🔭 Lentes Cognitivos | MD | Siempre |
| 07 | 1B | 🎙️ Voz Intelectual | MD | Siempre |
| 08 | 1B | 🚫 Filtros Negativos | Sección | Siempre |
| 09 | 3 | 📄 Resumen Publicable | .docx | Siempre |
| 10 | 3 | 🧩 Chunks RAG | .md | Siempre |
| 11 | 3 | 🎨 Prompts Visuales | 5 prompts | Siempre |
| 12 | 4 | 🗄️ Fuente Completa Sherpa | .md maestro | Siempre |
| 13 | 4 | 📑 Índice de Chunks | Mapa prioridad | Siempre |
| 14 | 5 | 🧪 Batería QA | 15–20 preguntas | Siempre |
| 15 | 5 | 📊 Score de Calidad | Métrica | Siempre |
| 16 | 5 | ✅ Dictamen Final | Decisión | Siempre |
| 17 | 6 | 🚀 Libro Publicado | Plataforma | Si QA aprueba |
| 18 | 6 | 🤖 Sherpa Activo | RAG live | Si QA aprueba |

---

## Métricas del Sistema

| Métrica | Valor |
|---------|-------|
| Fases totales | 8 (INT + 1A + 2 + 1B + 3 + 4 + 5 + 6) |
| Artefactos por libro (flujo completo) | 18 |
| Artefactos por libro (con libro disponible) | 16 |
| Checkpoints humanos | 3 |
| Target de producción | 20+ libros/semana |
| Intervención humana por libro | ~3 decisiones |

---

## Estado del Sistema — Sprint 3

| Fase | Nombre | Status |
|------|--------|--------|
| INT | Intake | ✅ Definido y probado |
| 1A | Investigación del Libro y Autor | ✅ Definida y probada |
| 2 | Libro Virtual | ✅ Definida y probada |
| 1B | Lentes Cognitivos y Voz | ✅ Definida y probada |
| 3 | Producción del Resumen | ✅ Definida y probada |
| 4 | Fuente Completa RAG | 🔲 Sprint 3 — Siguiente |
| 5 | QA Automático | 🔲 Sprint 3 — Pendiente |
| 6 | Publicación | 🔲 Sprint 3 — Pendiente |

---

*Book Factory · Master Playbooks v2.0 · Sprint 3 en curso · Actualizado: 2026-03-13*
