## Asset Header

- **Asset ID:** SOP-MPX-BookFactory-Fase4-FuenteRAG-v01
- **Version:** v01
- **Status:** Draft
- **Owner:** Victor Heredia
- **IntellBank:** IB-MPX-MasterPlaybooks
- **Tipo:** SOP — Standard Operating Procedure
- **Propósito:** FASE 4 — Fuente Completa para RAG
- **Última actualización:** 2026-04-11

---

# FASE 4 — Fuente Completa para RAG
## El documento maestro que consume Sherpa

> **Status:** 🔲 Sprint 3 — SIGUIENTE A IMPLEMENTAR
> **Posición en el flujo:** Después de Fase 3 · Antes de Fase 5

---

## Propósito

La Fase 3 produce **chunks .md sueltos** como output de producción.
La Fase 4 los integra — junto con material de todas las fases anteriores — en **UN SOLO documento maestro estructurado** que es lo que Sherpa consume vía RAG.

Los chunks de Fase 3 son el **insumo** de Fase 4, no el producto final de RAG.

**Principio clave:** Sherpa nunca debe necesitar ir a múltiples archivos. Todo el conocimiento que necesita para responder como el autor está en este documento único, estructurado para recuperación semántica.

---

## Arquitectura del Documento Maestro

El documento se organiza en **4 bloques fijos** en este orden:

```
┌─────────────────────────────────────────────┐
│  BLOQUE 1 — Perfil del Autor                │ ← Alta prioridad · Siempre recuperable
│  BLOQUE 2 — Mapa Conceptual del Libro       │ ← Orientación global
│  BLOQUE 3 — Contenido por Sección           │ ← Chunks independientes y autocontenidos
│  BLOQUE 4 — Contexto Externo                │ ← Recepción, comparaciones, recursos
└─────────────────────────────────────────────┘
```

---

## Estructura Detallada por Bloque

### BLOQUE 1 — Perfil del Autor y Lentes Cognitivos
**Prioridad:** ALTA — siempre recuperado en preguntas de voz y perspectiva

```markdown
# [TÍTULO] — Fuente Sherpa: Perfil del Autor

## Identidad intelectual
[Quién es el autor como pensador: formación, posición en el campo, por qué su perspectiva es única]

## Lentes cognitivos (frameworks de interpretación)

### Lente 1: [Nombre]
- Definición: [Qué ve el autor a través de este lente]
- Pregunta característica: [La pregunta que haría ante cualquier situación]
- Cómo afecta sus conclusiones: [...]
- Evidencia en el libro: [Capítulos donde aparece]

### Lente N: [Nombre]
[Repetir para cada lente — mínimo 3, máximo 6]

## Voz intelectual

### Vocabulario característico
[10-15 términos o frases del autor con nota de por qué son representativos]

### Patrón retórico
[Cómo construye argumentos: ¿de historia a principio? ¿de dato a aplicación?]

### Registro
[Cómo combina registros: académico / conversacional / narrativo / técnico]

### Tipo de ejemplos preferidos
[Datos / historias / metáforas / casos / experiencia personal — patrón consistente]

## Filtros negativos — Lo que NUNCA diría

1. "[Afirmación específica que el autor rechazaría]"
2. "[Afirmación específica que el autor rechazaría]"
3. "[Afirmación específica que el autor rechazaría]"
4. "[Afirmación específica que el autor rechazaría]"
[mínimo 4 — suficientemente concretas para funcionar como filtro real de Sherpa]

## Manejo de la incertidumbre
[Qué hace cuando la evidencia no es concluyente. Define cómo Sherpa debe responder preguntas que exceden el libro.]
```

---

### BLOQUE 2 — Mapa Conceptual del Libro
**Prioridad:** MEDIA-ALTA — recuperado en preguntas sobre el libro completo

```markdown
# [TÍTULO] — Fuente Sherpa: Mapa Conceptual

## Metadata del libro
- Autor: [Nombre completo]
- Categoría: [Principal · Subcategoría]
- Tipo de libro: [Prescriptivo / Narrativo / Analítico / Académico / Híbrido]
- Tipo de autoría: [Individual / Colectiva]
- Audiencia objetivo: [A quién va dirigido]
- Año de publicación: [Año]

## Tesis central
[La idea principal del libro en 2-3 oraciones precisas. No una descripción genérica — la tesis específica que lo distingue.]

## Hilo argumental
[Párrafo que explica cómo se construye el argumento del libro de principio a fin. El arco intelectual completo.]

## Argumentos clave (en orden lógico)
1. [Argumento 1]
2. [Argumento 2]
3. [Argumento 3]
[mínimo 3, máximo 7]

## Conceptos clave y relaciones
| Concepto | Definición del autor | Relación con otros conceptos |
|----------|---------------------|-------------------------------|
| [Concepto 1] | [...] | [...] |
| [Concepto N] | [...] | [...] |

## Tensiones que el libro explora
[Contradicciones o tensiones productivas que el autor analiza o resuelve]

## Estructura del libro
[Cómo está organizado: partes, capítulos o ejes temáticos]

## Limitaciones conocidas
[Qué no cubre el libro · Críticas válidas que el propio autor reconocería]

## Sinopsis para Sherpa
[2-3 oraciones en voz del autor. Para responder "¿de qué trata este libro?"]
```

---

### BLOQUE 3 — Contenido por Sección
**Prioridad:** MEDIA — recuperado en preguntas sobre temas o capítulos específicos
**Regla:** Cada sección es un chunk **autocontenido** — Sherpa puede responder usando solo ese chunk

```markdown
# [TÍTULO] — Fuente Sherpa: [Nombre de Sección]
Tipo: Contenido de sección
Capítulos cubiertos: [N-M]
Temas principales: [keywords para recuperación]

## Idea central de la sección
[2-3 oraciones. La tesis específica de este bloque del libro.]

## Desarrollo del argumento
[Cómo el autor construye el argumento en esta sección. 3-5 párrafos en voz del autor.]

## Conceptos clave de esta sección
| Concepto | Definición | Ejemplo del libro |
|----------|-----------|-------------------|
| [...] | [...] | [...] |

## Conexión con el resto del libro
- Viene de: [Qué sección/argumento prepara esto]
- Lleva a: [A qué sección/argumento conduce]

---

# [TÍTULO] — Fuente Sherpa: Playbook — [Nombre de Sección]
Tipo: Aplicación práctica
Sección correspondiente: [Nombre]

## Objetivo del paso
[1 oración: qué herramienta gana el lector]

## Qué hacer
[Acción concreta en imperativo]

## Cómo hacerlo
[Instrucción práctica específica]

## Cuándo aplicarlo
[Momento o frecuencia concreta]

## Indicador de progreso
[Señal observable y concreta]

## Mini caso genérico
[Ejemplo del lector, no del libro]

## Error común a evitar
[Error + corrección]

[Repetir par Sección + Playbook para cada bloque del libro]
```

---

### BLOQUE 4 — Contexto Externo
**Prioridad:** BAJA — recuperado en preguntas sobre el contexto, comparaciones o recursos

```markdown
# [TÍTULO] — Fuente Sherpa: Contexto y Recursos

## Recepción crítica
[Cómo fue recibido el libro. Premios, críticas, impacto en el campo.]

## Posición en el campo intelectual
[Cómo se ubica respecto a otros autores y corrientes de pensamiento]

## Comparaciones relevantes
| Libro / Autor | Similitud | Diferencia clave |
|---------------|-----------|-----------------|
| [...] | [...] | [...] |

## Lecturas complementarias recomendadas
1. [Libro] — [Por qué complementa]
2. [Libro] — [Por qué complementa]

## Videos y recursos adicionales
1. [Charla / entrevista] — [Qué aporta]

## Sobre el Autor
[200-300 palabras en tercera persona. Autoridad + obra completa + dónde encontrar más.]

## Actualizaciones desde la publicación
[Si hay desarrollos relevantes desde que se publicó el libro — opcional]
```

---

## Prompt de Generación — Fase 4

```
Eres un especialista en estructuración de conocimiento para sistemas RAG.

Tu tarea es producir la Fuente Completa de Sherpa:
un documento maestro único que integra todo el conocimiento generado
en las fases anteriores, optimizado para recuperación semántica.

LIBRO: {{titulo}}
AUTOR: {{autor}}
TIPO DE AUTORÍA: {{tipo_autoria}}
TIPO DE LIBRO: {{tipo_libro}}

INPUTS DE FASES ANTERIORES:
- Investigación del libro y autor (Fase 1A): {{output_fase1A}}
- Perfil intelectual y voz (Fase 1B): {{output_fase1B}}
- Resumen completo (Fase 3 — Prompt 3.1): {{output_prompt3_1}}
- Chunks RAG (Fase 3 — Prompt 3.2): {{output_prompt3_2}}

REGLAS DE CONSTRUCCIÓN:

1. ESTRUCTURA FIJA: 4 bloques en este orden exacto:
   Bloque 1 — Perfil del Autor y Lentes Cognitivos [alta prioridad]
   Bloque 2 — Mapa Conceptual del Libro [media-alta prioridad]
   Bloque 3 — Contenido por Sección [pares: contenido + playbook]
   Bloque 4 — Contexto Externo [baja prioridad]

2. AUTOCONTENCIÓN: Cada chunk del Bloque 3 debe funcionar de forma
   independiente. Sherpa debe poder responder una pregunta usando
   solo ese chunk, sin necesitar leer los demás.

3. HEADERS SEMÁNTICOS: Cada chunk comienza con:
   # [TÍTULO DEL LIBRO] — Fuente Sherpa: [Nombre descriptivo del chunk]
   Tipo: [tipo de contenido]
   Temas: [keywords relevantes para recuperación]

4. VOZ CONSISTENTE: Todo el contenido debe estar en la voz del autor,
   usando su vocabulario característico. No suenes a un documento técnico.

5. PRIORIDAD DE RECUPERACIÓN: Incluir al final de cada chunk:
   Prioridad RAG: [Alta / Media / Baja]
   Preguntas que activan este chunk: [2-3 ejemplos de preguntas]

6. BLOQUE 1 PRIMERO Y COMPLETO: El perfil del autor siempre se recupera
   en preguntas sobre perspectiva, voz o cómo el autor vería algo.
   Debe contener TODOS los lentes cognitivos y filtros negativos.

7. METADATA FINAL: Al terminar, produce un ÍNDICE DE CHUNKS con:
   - Nombre de cada chunk
   - Tipo de contenido
   - Prioridad de recuperación
   - Ejemplos de preguntas que lo activan

Produce el documento completo en Markdown, estructurado para ser
subido directamente al sistema RAG de Sherpa.
```

---

## Especificaciones Técnicas

| Parámetro | Valor | Justificación |
|-----------|-------|---------------|
| Formato final | `.md` único | Simplicidad · Portabilidad · Compatible con todos los sistemas RAG |
| Tamaño por chunk | 200–600 palabras | Equilibrio entre contexto suficiente y precisión de recuperación |
| Header semántico | Obligatorio en cada chunk | Permite al sistema RAG identificar el tipo de contenido |
| Metadatos mínimos | Tipo + Prioridad + Preguntas activadoras | Optimiza la recuperación semántica |
| Versionado | `v1.0`, `v1.1`... en el header del documento | Para cuando el libro se actualice o corrija |

---

## Índice de Chunks — Estructura esperada

| # | Nombre del Chunk | Tipo | Prioridad | Preguntas típicas |
|---|-----------------|------|-----------|-------------------|
| 01 | Perfil del Autor y Lentes | Voz + perspectiva | Alta | "¿Cómo vería el autor...?" "¿Qué diría sobre...?" |
| 02 | Mapa Conceptual | Orientación global | Media-Alta | "¿De qué trata el libro?" "¿Cuál es la tesis?" |
| 03 | Sección [N] — Contenido | Contenido temático | Media | "¿Qué dice el autor sobre X?" |
| 04 | Sección [N] — Playbook | Aplicación práctica | Media | "¿Cómo aplico...?" "¿Qué ejercicio...?" |
| ... | ... | ... | ... | ... |
| N-1 | Sobre el Autor | Biografía | Baja | "¿Quién es el autor?" "¿Qué otros libros...?" |
| N | Contexto y Recursos | Contexto externo | Baja | "¿Cómo se compara con...?" "¿Qué leer después?" |

---

## Checklist de Validación — Fase 4

- [ ] Documento tiene exactamente los 4 bloques en el orden correcto
- [ ] Bloque 1 contiene TODOS los lentes cognitivos con evidencia por capítulo
- [ ] Bloque 1 contiene TODOS los filtros negativos (mínimo 4)
- [ ] Bloque 1 contiene la sección de manejo de incertidumbre
- [ ] Bloque 2 tiene tesis central precisa (no genérica)
- [ ] Bloque 2 tiene hilo argumental en párrafo continuo
- [ ] Cada chunk del Bloque 3 es autocontenido
- [ ] Cada sección del libro tiene su chunk de contenido + chunk de playbook
- [ ] Todos los chunks tienen header semántico con tipo y temas
- [ ] Todos los chunks tienen `Prioridad RAG` y `Preguntas activadoras`
- [ ] Vocabulario del autor está presente de forma natural en todo el documento
- [ ] Índice de chunks generado al final con tipo y prioridad
- [ ] Versión del documento registrada en el header (`v1.0`)
- [ ] Documento probado: ¿Sherpa puede responder preguntas básicas usando solo este archivo?

---

## Preguntas Abiertas (a resolver durante implementación)

1. **Versionado:** ¿Cómo se actualiza el documento cuando el libro tiene nuevas ediciones o el QA detecta huecos?
2. **Obras colectivas:** ¿Cómo se estructura el Bloque 1 cuando hay múltiples autores con capítulos propios?
3. **Tamaño límite:** ¿Hay un límite de tokens para el documento maestro que dependa del sistema RAG de la plataforma?
4. **Chunking automático:** ¿El sistema RAG hace su propio chunking o consume el documento tal como está?

---

*Fase 4 · Sprint 3 · Master Playbooks Book Factory v2.0*
