## Asset Header - **Asset ID:** SOP-MPX-BookFactorySistema-v01 - **Version:** v01 - **Status:** Draft - **Owner:** Victor Heredia - **IntellBank:** IB-MPX-MasterPlaybooks - **Tipo:** SOP — Standard Operating Procedure - **Propósito:** 🏭 Book Factory — Master Playbooks v2.0 - **Última actualización:** 2026-04-11 --- # 🏭 Book Factory — Master Playbooks v2.0 > Sistema de producción de conocimiento estructurado para Sherpa · 20 libros/semana · 3 checkpoints humanos --- ## ¿Qué es la Book Factory? Una factoría que transforma libros en conocimiento estructurado profundo. Cada libro entra como materia prima y sale como un ecosistema de artefactos que permite a **Sherpa** — un asistente de IA — responder preguntas del lector como si fuera el propio autor. El modelo se inspira en la **Big MetaFactory**: cada libro pasa por estaciones de producción en orden, y en cada estación se generan artefactos claros, reutilizables y encadenados. --- ## Arquitectura del Sistema ### Flujo CON libro disponible ``` Intake → Fase 1A → Fase 1B → Fase 3 → Fase 4 → Fase 5 → Fase 6 ``` ### Flujo SIN libro disponible ``` Intake → Fase 1A → Fase 2 → Fase 1B → Fase 3 → Fase 4 → Fase 5 → Fase 6 ``` --- ## Intake — Entrada del Sistema **4 campos requeridos:** | Campo | Tipo | Valores | |-------|------|---------| | `titulo` | texto | Título completo del libro | | `autor` | texto | Nombre completo del autor | | `libro_disponible` | booleano | `sí` / `no` | | `tipo_autoria` | enum | `individual` / `colectiva` | **Reglas de flujo:** - `libro_disponible = no` → activa Fase 2 - `tipo_autoria = colectiva` → voz Sherpa = filosofía editorial del director ⚑ **Checkpoint #1** — El operador valida clasificación y disponibilidad del libro --- ## Fase 1A — Investigación del Libro y Autor **Status:** ✅ Definida y probada **Propósito:** Producir contexto completo del libro y del autor. Los lentes cognitivos y la voz NO se generan aquí. **Inputs:** Ficha de Intake · Fuentes públicas (web, entrevistas, podcasts, reseñas, Goodreads) **Outputs:** - Clasificación con granularidad (categoría, subcategoría, tipo, audiencia) - Tesis central precisa (suficiente para reconstruir el libro) - Argumentos clave en orden lógico (mínimo 3) - Biografía intelectual del autor - Obra completa + posición en el campo ### Artefactos generados - 📚 **Investigación del Libro** — Documento MD - 👤 **Perfil del Autor** — Documento MD --- ## Fase 2 — Libro Virtual **Status:** ✅ Definida y probada | **Condición:** Solo activa cuando `libro_disponible = NO` **Propósito:** Reconstruir el contenido del libro capítulo a capítulo cuando no hay PDF disponible. **3 prompts encadenados:** 1. **Prompt 2.1** — Verificación y ampliación de conocimiento 2. **Prompt 2.2** — Generación del índice para validación humana 3. **Prompt 2.3** — Reconstrucción completa (solo después de aprobación) **Inputs:** Output Fase 1A · Resúmenes, reseñas por capítulo, transcripciones **Outputs:** - Índice validado (Estructural o Conceptual según fuentes) - Reconstrucción capítulo a capítulo con 5 elementos por capítulo - Score de cobertura global (% cubierto) ### Artefactos generados - 📖 **Libro Virtual** — Documento MD - 📊 **Score de Cobertura** — Métrica + alerta si < 50% ⚑ **Checkpoint #2** — El operador aprueba el índice antes de la reconstrucción completa --- ## Fase 1B — Lentes Cognitivos y Voz Intelectual **Status:** ✅ Definida y probada **Propósito:** Derivar cómo piensa y habla el autor desde el contenido del libro. Siempre después de tener el contenido. Usa batches de 3–4 capítulos. **2 prompts encadenados:** 1. **Prompt 1B.1** — Extracción por batch de capítulos (ficha por capítulo) 2. **Prompt 1B.2** — Consolidación del perfil intelectual definitivo **Inputs:** Contenido del libro (real o virtual) · Perfil del autor (Fase 1A) **Outputs:** - 3–6 lentes cognitivos con evidencia por capítulo (mínimo 3 capítulos por lente) - Voz intelectual consolidada con vocabulario (10–15 términos) - Filtros negativos: "Lo que NUNCA diría" (mínimo 4 afirmaciones concretas) - Manejo de la incertidumbre (cómo responde Sherpa cuando algo excede el libro) ### Artefactos generados - 🔭 **Lentes Cognitivos** — Documento MD - 🎙️ **Voz Intelectual del Autor** — Documento MD - 🚫 **Filtros Negativos** — Sección crítica para Sherpa --- ## Fase 3 — Producción del Resumen **Status:** ✅ Definida y probada **Propósito:** Producir el resumen publicable en la voz del autor + los chunks para Sherpa. **Estructura del Resumen Amplio:** - Libros **narrativos/encadenados** → 4–7 bloques temáticos - Libros **prescriptivos/temáticos** → 4–8 ejes temáticos **Playbook fusionado — 7 elementos por sección:** | Elemento | Descripción | |----------|-------------| | Objetivo del paso | 1 oración: qué herramienta gana el lector | | Qué hacer | Acción concreta en imperativo | | Cómo hacerlo | Instrucción práctica específica | | Cuándo aplicarlo | Momento o frecuencia concreta | | Indicador de progreso | Señal observable y concreta | | Mini caso genérico | Ejemplo del lector, no del libro | | Error común a evitar | Error + corrección | **3 prompts:** 1. **Prompt 3.1** — Generación del Resumen Completo (en voz del autor) 2. **Prompt 3.2** — Estructuración para RAG (chunks .md) 3. **Prompt 3.3** — Generación de Prompts Visuales (Midjourney) ### Artefactos generados - 📄 **Resumen Publicable** — `.docx` (lo que lee el lector) - 🧩 **Chunks RAG** — `.md` (16+ chunks para Sherpa) - 🎨 **Prompts Visuales** — 5 prompts Midjourney con paleta de colores --- ## Fase 4 — Fuente Completa RAG ⬅ SPRINT 3 **Status:** 🔲 Siguiente a implementar **Propósito:** Integrar todos los outputs anteriores en UN SOLO documento maestro estructurado para recuperación semántica. Este es el documento que consume Sherpa — no los chunks sueltos de Fase 3. **4 bloques fijos en este orden:** ``` Bloque 1 — Perfil del Autor y Lentes Cognitivos [Alta prioridad] Bloque 2 — Mapa Conceptual del Libro [Media-alta prioridad] Bloque 3 — Contenido por Sección [Pares: contenido + playbook] Bloque 4 — Contexto Externo [Baja prioridad] ``` **Reglas de construcción:** - Cada chunk es **autocontenido** (Sherpa responde con solo ese chunk) - Cada chunk lleva **header semántico**: tipo + temas + prioridad + preguntas activadoras - Todo en **voz del autor** con su vocabulario - Versión registrada (`v1.0`) para trazabilidad **Especificaciones técnicas:** | Parámetro | Valor | |-----------|-------| | Formato | `.md` único | | Tamaño por chunk | 200–600 palabras | | Header semántico | Obligatorio | | Metadatos mínimos | Tipo + Prioridad + Preguntas activadoras | ### Artefactos generados - 🗄️ **Fuente Completa Sherpa** — `.md` maestro para RAG - 📑 **Índice de Chunks** — Mapa de recuperación con prioridades --- ## Fase 5 — QA Automático ⬅ SPRINT 3 **Status:** 🔲 Pendiente de implementar **Propósito:** Evaluar si Sherpa puede responder correctamente antes de publicar. Ningún libro llega a producción sin pasar el QA. **4 tipos de preguntas:** | Tipo | Qué prueba | Señal de fallo | |------|-----------|----------------| | **A — Recuperación directa** | Sherpa encuentra información correcta | Inventa datos o confunde conceptos | | **B — Aplicación/Inferencia** | Sherpa aplica los frameworks a situaciones nuevas | Respuestas genéricas sin los lentes del autor | | **C — Preguntas de borde** | Sherpa sabe qué NO cubre el libro | Inventa respuestas para temas no cubiertos | | **D — Preguntas trampa** | Sherpa no alucina ni atribuye ideas falsas | Confirma afirmaciones inventadas | **Calibración por tipo de libro:** | Tipo | A | B | C | D | Total | |------|---|---|---|---|-------| | Prescriptivo | 4 | 5 | 3 | 3 | 15 | | Narrativo | 5 | 3 | 4 | 3 | 15 | | Analítico | 5 | 4 | 4 | 2 | 15 | | Académico | 6 | 3 | 4 | 2 | 15 | **Thresholds de aprobación:** | Condición | Threshold | Consecuencia | |-----------|-----------|--------------| | Score ≥ 8.0 | Aprobado | → Fase 6 | | Score 7.0–7.9 | Revisión humana | → Checkpoint especial | | Score < 7.0 | Rechazado | → Regresa a fase | | Tipo D — fallos | 0 permitidos | Cualquier fallo = revisión | **Pesos de evaluación LLM-as-judge:** - Precisión factual: **35%** - Voz del autor: **25%** - Manejo de límites: **25%** - Utilidad para el lector: **15%** **3 prompts:** 1. **Prompt 5.1** — Generación de la batería de preguntas con respuestas esperadas 2. **Prompt 5.2** — Evaluación LLM-as-judge (4 dimensiones) 3. **Prompt 5.3** — Dictamen final con causa raíz y fase de regreso ### Artefactos generados - 🧪 **Batería de Preguntas QA** — 15–20 preguntas categorizadas - 📊 **Score de Calidad** — Evaluación LLM-as-judge por dimensión - ✅ **Dictamen Final** — Aprobar · Revisión humana · Rechazar + fase de regreso --- ## Fase 6 — Publicación ⬅ SPRINT 3 **Status:** 🔲 Pendiente de implementar **Propósito:** Publicar el resumen para el lector y activar Sherpa con la Fuente Completa. **Condiciones de entrada:** - QA dictamen = APROBADO → Checkpoint #3 - QA dictamen = REVISIÓN HUMANA → Operador resuelve → Checkpoint #3 - QA dictamen = RECHAZADO → ❌ No entra. Regresa a fase indicada **3 acciones de publicación:** 1. **Acción 6.A** — Upload del `.docx` a la plataforma (para el lector) 2. **Acción 6.B** — Upload de la Fuente Completa al sistema RAG (para Sherpa) 3. **Acción 6.C** — Activación de Sherpa con sistema prompt configurado ⚑ **Checkpoint #3** — El operador revisa el score QA y aprueba el go-live ### Artefactos generados - 🚀 **Libro Publicado** — Visible para lectores en la plataforma - 🤖 **Sherpa Activo** — RAG operativo, responde como el autor --- ## Inventario Completo de Artefactos | # | Fase | Artefacto | Formato | Condición | |---|------|-----------|---------|-----------| | 01 | INT | 📋 Ficha de Intake | Registro | Siempre | | 02 | 1A | 📚 Investigación del Libro | MD | Siempre | | 03 | 1A | 👤 Perfil del Autor | MD | Siempre | | 04 | 2 | 📖 Libro Virtual | MD | Sin libro | | 05 | 2 | 📊 Score de Cobertura | Métrica | Sin libro | | 06 | 1B | 🔭 Lentes Cognitivos | MD | Siempre | | 07 | 1B | 🎙️ Voz Intelectual | MD | Siempre | | 08 | 1B | 🚫 Filtros Negativos | Sección | Siempre | | 09 | 3 | 📄 Resumen Publicable | .docx | Siempre | | 10 | 3 | 🧩 Chunks RAG | .md | Siempre | | 11 | 3 | 🎨 Prompts Visuales | 5 prompts | Siempre | | 12 | 4 | 🗄️ Fuente Completa Sherpa | .md maestro | Siempre | | 13 | 4 | 📑 Índice de Chunks | Mapa prioridad | Siempre | | 14 | 5 | 🧪 Batería QA | 15–20 preguntas | Siempre | | 15 | 5 | 📊 Score de Calidad | Métrica | Siempre | | 16 | 5 | ✅ Dictamen Final | Decisión | Siempre | | 17 | 6 | 🚀 Libro Publicado | Plataforma | Si QA aprueba | | 18 | 6 | 🤖 Sherpa Activo | RAG live | Si QA aprueba | --- ## Métricas del Sistema | Métrica | Valor | |---------|-------| | Fases totales | 8 (INT + 1A + 2 + 1B + 3 + 4 + 5 + 6) | | Artefactos por libro (flujo completo) | 18 | | Artefactos por libro (con libro disponible) | 16 | | Checkpoints humanos | 3 | | Target de producción | 20+ libros/semana | | Intervención humana por libro | ~3 decisiones | --- ## Estado del Sistema — Sprint 3 | Fase | Nombre | Status | |------|--------|--------| | INT | Intake | ✅ Definido y probado | | 1A | Investigación del Libro y Autor | ✅ Definida y probada | | 2 | Libro Virtual | ✅ Definida y probada | | 1B | Lentes Cognitivos y Voz | ✅ Definida y probada | | 3 | Producción del Resumen | ✅ Definida y probada | | 4 | Fuente Completa RAG | 🔲 Sprint 3 — Siguiente | | 5 | QA Automático | 🔲 Sprint 3 — Pendiente | | 6 | Publicación | 🔲 Sprint 3 — Pendiente | --- *Book Factory · Master Playbooks v2.0 · Sprint 3 en curso · Actualizado: 2026-03-13*