## Asset Header - **Asset ID:** SOP-MPX-BookFactory-Fase4-FuenteRAG-v01 - **Version:** v01 - **Status:** Draft - **Owner:** Victor Heredia - **IntellBank:** IB-MPX-MasterPlaybooks - **Tipo:** SOP — Standard Operating Procedure - **Propósito:** FASE 4 — Fuente Completa para RAG - **Última actualización:** 2026-04-11 --- # FASE 4 — Fuente Completa para RAG ## El documento maestro que consume Sherpa > **Status:** 🔲 Sprint 3 — SIGUIENTE A IMPLEMENTAR > **Posición en el flujo:** Después de Fase 3 · Antes de Fase 5 --- ## Propósito La Fase 3 produce **chunks .md sueltos** como output de producción. La Fase 4 los integra — junto con material de todas las fases anteriores — en **UN SOLO documento maestro estructurado** que es lo que Sherpa consume vía RAG. Los chunks de Fase 3 son el **insumo** de Fase 4, no el producto final de RAG. **Principio clave:** Sherpa nunca debe necesitar ir a múltiples archivos. Todo el conocimiento que necesita para responder como el autor está en este documento único, estructurado para recuperación semántica. --- ## Arquitectura del Documento Maestro El documento se organiza en **4 bloques fijos** en este orden: ``` ┌─────────────────────────────────────────────┐ │ BLOQUE 1 — Perfil del Autor │ ← Alta prioridad · Siempre recuperable │ BLOQUE 2 — Mapa Conceptual del Libro │ ← Orientación global │ BLOQUE 3 — Contenido por Sección │ ← Chunks independientes y autocontenidos │ BLOQUE 4 — Contexto Externo │ ← Recepción, comparaciones, recursos └─────────────────────────────────────────────┘ ``` --- ## Estructura Detallada por Bloque ### BLOQUE 1 — Perfil del Autor y Lentes Cognitivos **Prioridad:** ALTA — siempre recuperado en preguntas de voz y perspectiva ```markdown # [TÍTULO] — Fuente Sherpa: Perfil del Autor ## Identidad intelectual [Quién es el autor como pensador: formación, posición en el campo, por qué su perspectiva es única] ## Lentes cognitivos (frameworks de interpretación) ### Lente 1: [Nombre] - Definición: [Qué ve el autor a través de este lente] - Pregunta característica: [La pregunta que haría ante cualquier situación] - Cómo afecta sus conclusiones: [...] - Evidencia en el libro: [Capítulos donde aparece] ### Lente N: [Nombre] [Repetir para cada lente — mínimo 3, máximo 6] ## Voz intelectual ### Vocabulario característico [10-15 términos o frases del autor con nota de por qué son representativos] ### Patrón retórico [Cómo construye argumentos: ¿de historia a principio? ¿de dato a aplicación?] ### Registro [Cómo combina registros: académico / conversacional / narrativo / técnico] ### Tipo de ejemplos preferidos [Datos / historias / metáforas / casos / experiencia personal — patrón consistente] ## Filtros negativos — Lo que NUNCA diría 1. "[Afirmación específica que el autor rechazaría]" 2. "[Afirmación específica que el autor rechazaría]" 3. "[Afirmación específica que el autor rechazaría]" 4. "[Afirmación específica que el autor rechazaría]" [mínimo 4 — suficientemente concretas para funcionar como filtro real de Sherpa] ## Manejo de la incertidumbre [Qué hace cuando la evidencia no es concluyente. Define cómo Sherpa debe responder preguntas que exceden el libro.] ``` --- ### BLOQUE 2 — Mapa Conceptual del Libro **Prioridad:** MEDIA-ALTA — recuperado en preguntas sobre el libro completo ```markdown # [TÍTULO] — Fuente Sherpa: Mapa Conceptual ## Metadata del libro - Autor: [Nombre completo] - Categoría: [Principal · Subcategoría] - Tipo de libro: [Prescriptivo / Narrativo / Analítico / Académico / Híbrido] - Tipo de autoría: [Individual / Colectiva] - Audiencia objetivo: [A quién va dirigido] - Año de publicación: [Año] ## Tesis central [La idea principal del libro en 2-3 oraciones precisas. No una descripción genérica — la tesis específica que lo distingue.] ## Hilo argumental [Párrafo que explica cómo se construye el argumento del libro de principio a fin. El arco intelectual completo.] ## Argumentos clave (en orden lógico) 1. [Argumento 1] 2. [Argumento 2] 3. [Argumento 3] [mínimo 3, máximo 7] ## Conceptos clave y relaciones | Concepto | Definición del autor | Relación con otros conceptos | |----------|---------------------|-------------------------------| | [Concepto 1] | [...] | [...] | | [Concepto N] | [...] | [...] | ## Tensiones que el libro explora [Contradicciones o tensiones productivas que el autor analiza o resuelve] ## Estructura del libro [Cómo está organizado: partes, capítulos o ejes temáticos] ## Limitaciones conocidas [Qué no cubre el libro · Críticas válidas que el propio autor reconocería] ## Sinopsis para Sherpa [2-3 oraciones en voz del autor. Para responder "¿de qué trata este libro?"] ``` --- ### BLOQUE 3 — Contenido por Sección **Prioridad:** MEDIA — recuperado en preguntas sobre temas o capítulos específicos **Regla:** Cada sección es un chunk **autocontenido** — Sherpa puede responder usando solo ese chunk ```markdown # [TÍTULO] — Fuente Sherpa: [Nombre de Sección] Tipo: Contenido de sección Capítulos cubiertos: [N-M] Temas principales: [keywords para recuperación] ## Idea central de la sección [2-3 oraciones. La tesis específica de este bloque del libro.] ## Desarrollo del argumento [Cómo el autor construye el argumento en esta sección. 3-5 párrafos en voz del autor.] ## Conceptos clave de esta sección | Concepto | Definición | Ejemplo del libro | |----------|-----------|-------------------| | [...] | [...] | [...] | ## Conexión con el resto del libro - Viene de: [Qué sección/argumento prepara esto] - Lleva a: [A qué sección/argumento conduce] --- # [TÍTULO] — Fuente Sherpa: Playbook — [Nombre de Sección] Tipo: Aplicación práctica Sección correspondiente: [Nombre] ## Objetivo del paso [1 oración: qué herramienta gana el lector] ## Qué hacer [Acción concreta en imperativo] ## Cómo hacerlo [Instrucción práctica específica] ## Cuándo aplicarlo [Momento o frecuencia concreta] ## Indicador de progreso [Señal observable y concreta] ## Mini caso genérico [Ejemplo del lector, no del libro] ## Error común a evitar [Error + corrección] [Repetir par Sección + Playbook para cada bloque del libro] ``` --- ### BLOQUE 4 — Contexto Externo **Prioridad:** BAJA — recuperado en preguntas sobre el contexto, comparaciones o recursos ```markdown # [TÍTULO] — Fuente Sherpa: Contexto y Recursos ## Recepción crítica [Cómo fue recibido el libro. Premios, críticas, impacto en el campo.] ## Posición en el campo intelectual [Cómo se ubica respecto a otros autores y corrientes de pensamiento] ## Comparaciones relevantes | Libro / Autor | Similitud | Diferencia clave | |---------------|-----------|-----------------| | [...] | [...] | [...] | ## Lecturas complementarias recomendadas 1. [Libro] — [Por qué complementa] 2. [Libro] — [Por qué complementa] ## Videos y recursos adicionales 1. [Charla / entrevista] — [Qué aporta] ## Sobre el Autor [200-300 palabras en tercera persona. Autoridad + obra completa + dónde encontrar más.] ## Actualizaciones desde la publicación [Si hay desarrollos relevantes desde que se publicó el libro — opcional] ``` --- ## Prompt de Generación — Fase 4 ``` Eres un especialista en estructuración de conocimiento para sistemas RAG. Tu tarea es producir la Fuente Completa de Sherpa: un documento maestro único que integra todo el conocimiento generado en las fases anteriores, optimizado para recuperación semántica. LIBRO: {{titulo}} AUTOR: {{autor}} TIPO DE AUTORÍA: {{tipo_autoria}} TIPO DE LIBRO: {{tipo_libro}} INPUTS DE FASES ANTERIORES: - Investigación del libro y autor (Fase 1A): {{output_fase1A}} - Perfil intelectual y voz (Fase 1B): {{output_fase1B}} - Resumen completo (Fase 3 — Prompt 3.1): {{output_prompt3_1}} - Chunks RAG (Fase 3 — Prompt 3.2): {{output_prompt3_2}} REGLAS DE CONSTRUCCIÓN: 1. ESTRUCTURA FIJA: 4 bloques en este orden exacto: Bloque 1 — Perfil del Autor y Lentes Cognitivos [alta prioridad] Bloque 2 — Mapa Conceptual del Libro [media-alta prioridad] Bloque 3 — Contenido por Sección [pares: contenido + playbook] Bloque 4 — Contexto Externo [baja prioridad] 2. AUTOCONTENCIÓN: Cada chunk del Bloque 3 debe funcionar de forma independiente. Sherpa debe poder responder una pregunta usando solo ese chunk, sin necesitar leer los demás. 3. HEADERS SEMÁNTICOS: Cada chunk comienza con: # [TÍTULO DEL LIBRO] — Fuente Sherpa: [Nombre descriptivo del chunk] Tipo: [tipo de contenido] Temas: [keywords relevantes para recuperación] 4. VOZ CONSISTENTE: Todo el contenido debe estar en la voz del autor, usando su vocabulario característico. No suenes a un documento técnico. 5. PRIORIDAD DE RECUPERACIÓN: Incluir al final de cada chunk: Prioridad RAG: [Alta / Media / Baja] Preguntas que activan este chunk: [2-3 ejemplos de preguntas] 6. BLOQUE 1 PRIMERO Y COMPLETO: El perfil del autor siempre se recupera en preguntas sobre perspectiva, voz o cómo el autor vería algo. Debe contener TODOS los lentes cognitivos y filtros negativos. 7. METADATA FINAL: Al terminar, produce un ÍNDICE DE CHUNKS con: - Nombre de cada chunk - Tipo de contenido - Prioridad de recuperación - Ejemplos de preguntas que lo activan Produce el documento completo en Markdown, estructurado para ser subido directamente al sistema RAG de Sherpa. ``` --- ## Especificaciones Técnicas | Parámetro | Valor | Justificación | |-----------|-------|---------------| | Formato final | `.md` único | Simplicidad · Portabilidad · Compatible con todos los sistemas RAG | | Tamaño por chunk | 200–600 palabras | Equilibrio entre contexto suficiente y precisión de recuperación | | Header semántico | Obligatorio en cada chunk | Permite al sistema RAG identificar el tipo de contenido | | Metadatos mínimos | Tipo + Prioridad + Preguntas activadoras | Optimiza la recuperación semántica | | Versionado | `v1.0`, `v1.1`... en el header del documento | Para cuando el libro se actualice o corrija | --- ## Índice de Chunks — Estructura esperada | # | Nombre del Chunk | Tipo | Prioridad | Preguntas típicas | |---|-----------------|------|-----------|-------------------| | 01 | Perfil del Autor y Lentes | Voz + perspectiva | Alta | "¿Cómo vería el autor...?" "¿Qué diría sobre...?" | | 02 | Mapa Conceptual | Orientación global | Media-Alta | "¿De qué trata el libro?" "¿Cuál es la tesis?" | | 03 | Sección [N] — Contenido | Contenido temático | Media | "¿Qué dice el autor sobre X?" | | 04 | Sección [N] — Playbook | Aplicación práctica | Media | "¿Cómo aplico...?" "¿Qué ejercicio...?" | | ... | ... | ... | ... | ... | | N-1 | Sobre el Autor | Biografía | Baja | "¿Quién es el autor?" "¿Qué otros libros...?" | | N | Contexto y Recursos | Contexto externo | Baja | "¿Cómo se compara con...?" "¿Qué leer después?" | --- ## Checklist de Validación — Fase 4 - [ ] Documento tiene exactamente los 4 bloques en el orden correcto - [ ] Bloque 1 contiene TODOS los lentes cognitivos con evidencia por capítulo - [ ] Bloque 1 contiene TODOS los filtros negativos (mínimo 4) - [ ] Bloque 1 contiene la sección de manejo de incertidumbre - [ ] Bloque 2 tiene tesis central precisa (no genérica) - [ ] Bloque 2 tiene hilo argumental en párrafo continuo - [ ] Cada chunk del Bloque 3 es autocontenido - [ ] Cada sección del libro tiene su chunk de contenido + chunk de playbook - [ ] Todos los chunks tienen header semántico con tipo y temas - [ ] Todos los chunks tienen `Prioridad RAG` y `Preguntas activadoras` - [ ] Vocabulario del autor está presente de forma natural en todo el documento - [ ] Índice de chunks generado al final con tipo y prioridad - [ ] Versión del documento registrada en el header (`v1.0`) - [ ] Documento probado: ¿Sherpa puede responder preguntas básicas usando solo este archivo? --- ## Preguntas Abiertas (a resolver durante implementación) 1. **Versionado:** ¿Cómo se actualiza el documento cuando el libro tiene nuevas ediciones o el QA detecta huecos? 2. **Obras colectivas:** ¿Cómo se estructura el Bloque 1 cuando hay múltiples autores con capítulos propios? 3. **Tamaño límite:** ¿Hay un límite de tokens para el documento maestro que dependa del sistema RAG de la plataforma? 4. **Chunking automático:** ¿El sistema RAG hace su propio chunking o consume el documento tal como está? --- *Fase 4 · Sprint 3 · Master Playbooks Book Factory v2.0*