Planos de Expansión

Hoja de ruta técnica de architect. Fases de construcción, herramientas en desarrollo y el futuro de la orquestación agéntica.

Fase A

Fundamentos de Extensibilidad

COMPLETADA

La infraestructura sobre la que todo lo demás se apoya. Hooks, guardrails, skills y memoria procedural forman la columna vertebral de extensibilidad del agente.

  • [x] Sistema de Hooks Completo — 10 eventos de lifecycle, bloqueo/modificación de acciones, ejecución async y timeouts.
  • [x] Guardrails de Primera Clase — Archivos protegidos, comandos bloqueados, límites de edición, code rules y quality gates obligatorios.
  • [x] .architect.md + Skills — Contexto de proyecto auto-inyectado y ecosistema de skills reutilizables activadas por glob.
  • [x] Memoria Procedural — Detección de correcciones del usuario, persistencia en disco e inyección automática en sesiones futuras.
Fase B

Persistencia y Reporting

COMPLETADA

Features que hacen a architect viable para tareas largas y entornos CI/CD. Sesiones persistentes, reportes estructurados y flags nativos para pipelines.

  • [x] Session Resume — Persistencia del estado a disco. Si una sesión se interrumpe, se reanuda desde el último punto.
  • [x] Execution Report — Reportes en JSON, Markdown y GitHub PR comment con timeline, costes y quality gates.
  • [x] CI/CD Native Flags--json, --budget, --timeout, --context-git-diff. Exit codes semánticos.
  • [x] Dry Run / Preview — El agente planifica sin ejecutar. Tools de lectura activas, escritura interceptada como plan.
Fase C

Automatización Avanzada

COMPLETADA

Las features que convierten a architect en una herramienta de automatización seria. Loops autónomos, ejecución paralela y workflows multi-step.

  • [x] Ralph Loop Nativo — Loop de corrección automática: ejecutar, verificar checks externos, re-ejecutar con errores. Configurable con presupuesto y tiempo límite.
  • [x] Parallel Runs + Worktrees — Múltiples agentes en git worktrees aislados. Fan-out (misma tarea, varios modelos) o distribución de tareas.
  • [x] Pipeline Mode — Workflows YAML multi-step con variables, condiciones, checkpoints y resume desde cualquier paso.
  • [x] Checkpoints & Rollback — Puntos de restauración basados en git. Rollback a cualquier step anterior.
  • [x] Auto-Review — Patrón writer/reviewer: al completar, un reviewer analiza los cambios y genera correcciones automáticas.
Fase D

Extras y Especialización

COMPLETADA

Features avanzadas que completan la plataforma: sub-agentes, métricas de salud, evaluación competitiva entre modelos y observabilidad.

  • [x] Sub-Agentes / Dispatch — Delegar sub-tareas a agentes con contexto independiente que retornan un resumen.
  • [x] Code Health Delta — Métricas de salud antes/después con radon, eslint. Diff de complejidad en el reporte.
  • [x] Competitive Eval — Misma tarea con diferentes modelos + reporte comparativo de calidad, coste y velocidad.
  • [x] OpenTelemetry Traces — Spans para sesiones, LLM calls, tools y hooks. Exporta a Jaeger, Grafana Tempo, etc.
  • [x] Preset Configs — Templates predefinidos: python, node-react, ci, paranoid.
Hito Conseguido

Lanzamiento v1.0.0 Stable

Release Oficial
Fase de Estabilización

Pruebas Exhaustivas & Hardening

Batería de pruebas de integración, stress tests y corrección de edge cases post-release. Estabilización del core antes de nuevas features.

MONITORIZANDO
Cobertura de Tests
Fase E

Backend Abstraction + Claude SDK

PLANOS APROBADOS

Capa de abstracción para proveedores LLM e integración nativa con Claude Agent SDK como motor de ejecución, manteniendo la capa de control de architect encima.

  • [ ] Backend Abstraction Layer — Interfaz unificada para proveedores LLM con health checks, métricas por backend y switching transparente.
  • [ ] Claude Agent SDK Backend — Backend de Claude Agent SDK para usar las tools nativas de Claude Code como motor, con la capa de control de architect encima.
Fase F

Architect como MCP Server

PLANOS APROBADOS

Architect como servidor MCP nativo para integración bidireccional con Claude Code y otros agentes del ecosistema.

  • [ ] Architect MCP Server — Servidor MCP nativo que expone las capacidades de architect (build, review, plan) como tools remotas para integración bidireccional con Claude Code y otros agentes.
Fase G

Ralph v2 + Guardrails v2 + Reports v2

PLANOS APROBADOS

Profundización de los sistemas core: loops resumables, guardrails por agente con audit trail, pipelines paralelos y reportes en formatos estándar CI/CD.

  • [ ] Ralph Loop v2 — Resumable (si se interrumpe un loop largo, se retoma desde la última iteración). Estrategias de escalación: si lleva 5+ iteraciones fallando, cambia el approach automáticamente.
  • [ ] Guardrails v2 — Scoped por agente (el build puede tocar código, el deploy solo infra). Audit trail JSONL inmutable. allowed_paths como inverso de protected_files.
  • [ ] Pipeline Engine v2 — Steps paralelos, error handling declarativo (on_failure: retry | skip | abort), includes para reutilizar steps entre pipelines.
  • [ ] Reports & Audit Engine — JUnit XML para dashboards CI/CD estándar, formato GitHub PR con secciones colapsables, desglose de coste por paso.
Fase H

Output Modes + Fallback + Int. Tests

PLANOS APROBADOS

Resiliencia de producción: modos de salida configurables, fallback automático entre backends y suite de tests de integración end-to-end.

  • [ ] CLI Output Modes — Modos de salida del CLI configurables y extensibles para distintos contextos de uso.
  • [ ] Backend Health & Fallback — Health check y fallback automático entre backends. Si el proveedor principal cae, architect cambia al fallback sin intervención.
  • [ ] Integration Test Suite — Suite de tests de integración end-to-end para validar flujos completos: build, review, loops, pipelines y parallel.
Horizonte

Futuro

ESTUDIO DE VIABILIDAD

Ideas en evaluación para después del lanzamiento de las fases principales. Sujetas a cambios según feedback de la comunidad.

  • [?] Sandbox Docker — Ejecutar el agente en un contenedor efímero para aislamiento total del sistema host.
  • [?] Watch Mode — Daemon que observa el workspace y reacciona automáticamente a triggers configurados.
  • [?] Streaming Interactivo — Inyección de instrucciones mid-task con Ctrl+M en modo interactivo.
  • [?] .architect.md Jerárquico — Skills por directorio que se fusionan según el contexto de archivos activos.

¿Falta algo en los planos?

La arquitectura es un esfuerzo colaborativo. Propón nuevas herramientas o agentes en nuestro repositorio.

Abrir Issue en GitHub