Fundamentos de Extensibilidad
La infraestructura sobre la que todo lo demás se apoya. Hooks, guardrails, skills y memoria procedural forman la columna vertebral de extensibilidad del agente.
- [x] Sistema de Hooks Completo — 10 eventos de lifecycle, bloqueo/modificación de acciones, ejecución async y timeouts.
- [x] Guardrails de Primera Clase — Archivos protegidos, comandos bloqueados, límites de edición, code rules y quality gates obligatorios.
- [x] .architect.md + Skills — Contexto de proyecto auto-inyectado y ecosistema de skills reutilizables activadas por glob.
- [x] Memoria Procedural — Detección de correcciones del usuario, persistencia en disco e inyección automática en sesiones futuras.
Persistencia y Reporting
Features que hacen a architect viable para tareas largas y entornos CI/CD. Sesiones persistentes, reportes estructurados y flags nativos para pipelines.
- [x] Session Resume — Persistencia del estado a disco. Si una sesión se interrumpe, se reanuda desde el último punto.
- [x] Execution Report — Reportes en JSON, Markdown y GitHub PR comment con timeline, costes y quality gates.
- [x] CI/CD Native Flags —
--json,--budget,--timeout,--context-git-diff. Exit codes semánticos. - [x] Dry Run / Preview — El agente planifica sin ejecutar. Tools de lectura activas, escritura interceptada como plan.
Automatización Avanzada
Las features que convierten a architect en una herramienta de automatización seria. Loops autónomos, ejecución paralela y workflows multi-step.
- [x] Ralph Loop Nativo — Loop de corrección automática: ejecutar, verificar checks externos, re-ejecutar con errores. Configurable con presupuesto y tiempo límite.
- [x] Parallel Runs + Worktrees — Múltiples agentes en git worktrees aislados. Fan-out (misma tarea, varios modelos) o distribución de tareas.
- [x] Pipeline Mode — Workflows YAML multi-step con variables, condiciones, checkpoints y resume desde cualquier paso.
- [x] Checkpoints & Rollback — Puntos de restauración basados en git. Rollback a cualquier step anterior.
- [x] Auto-Review — Patrón writer/reviewer: al completar, un reviewer analiza los cambios y genera correcciones automáticas.
Extras y Especialización
Features avanzadas que completan la plataforma: sub-agentes, métricas de salud, evaluación competitiva entre modelos y observabilidad.
- [x] Sub-Agentes / Dispatch — Delegar sub-tareas a agentes con contexto independiente que retornan un resumen.
- [x] Code Health Delta — Métricas de salud antes/después con radon, eslint. Diff de complejidad en el reporte.
- [x] Competitive Eval — Misma tarea con diferentes modelos + reporte comparativo de calidad, coste y velocidad.
- [x] OpenTelemetry Traces — Spans para sesiones, LLM calls, tools y hooks. Exporta a Jaeger, Grafana Tempo, etc.
- [x] Preset Configs — Templates predefinidos:
python,node-react,ci,paranoid.
Lanzamiento v1.0.0 Stable
Pruebas Exhaustivas & Hardening
Batería de pruebas de integración, stress tests y corrección de edge cases post-release. Estabilización del core antes de nuevas features.
Backend Abstraction + Claude SDK
Capa de abstracción para proveedores LLM e integración nativa con Claude Agent SDK como motor de ejecución, manteniendo la capa de control de architect encima.
- [ ] Backend Abstraction Layer — Interfaz unificada para proveedores LLM con health checks, métricas por backend y switching transparente.
- [ ] Claude Agent SDK Backend — Backend de Claude Agent SDK para usar las tools nativas de Claude Code como motor, con la capa de control de architect encima.
Architect como MCP Server
Architect como servidor MCP nativo para integración bidireccional con Claude Code y otros agentes del ecosistema.
- [ ] Architect MCP Server — Servidor MCP nativo que expone las capacidades de architect (build, review, plan) como tools remotas para integración bidireccional con Claude Code y otros agentes.
Ralph v2 + Guardrails v2 + Reports v2
Profundización de los sistemas core: loops resumables, guardrails por agente con audit trail, pipelines paralelos y reportes en formatos estándar CI/CD.
- [ ] Ralph Loop v2 — Resumable (si se interrumpe un loop largo, se retoma desde la última iteración). Estrategias de escalación: si lleva 5+ iteraciones fallando, cambia el approach automáticamente.
- [ ] Guardrails v2 — Scoped por agente (el build puede tocar código, el deploy solo infra). Audit trail JSONL inmutable.
allowed_pathscomo inverso deprotected_files. - [ ] Pipeline Engine v2 — Steps paralelos, error handling declarativo (
on_failure: retry | skip | abort), includes para reutilizar steps entre pipelines. - [ ] Reports & Audit Engine — JUnit XML para dashboards CI/CD estándar, formato GitHub PR con secciones colapsables, desglose de coste por paso.
Output Modes + Fallback + Int. Tests
Resiliencia de producción: modos de salida configurables, fallback automático entre backends y suite de tests de integración end-to-end.
- [ ] CLI Output Modes — Modos de salida del CLI configurables y extensibles para distintos contextos de uso.
- [ ] Backend Health & Fallback — Health check y fallback automático entre backends. Si el proveedor principal cae, architect cambia al fallback sin intervención.
- [ ] Integration Test Suite — Suite de tests de integración end-to-end para validar flujos completos: build, review, loops, pipelines y parallel.
Futuro
Ideas en evaluación para después del lanzamiento de las fases principales. Sujetas a cambios según feedback de la comunidad.
- [?] Sandbox Docker — Ejecutar el agente en un contenedor efímero para aislamiento total del sistema host.
- [?] Watch Mode — Daemon que observa el workspace y reacciona automáticamente a triggers configurados.
- [?] Streaming Interactivo — Inyección de instrucciones mid-task con Ctrl+M en modo interactivo.
- [?] .architect.md Jerárquico — Skills por directorio que se fusionan según el contexto de archivos activos.
¿Falta algo en los planos?
La arquitectura es un esfuerzo colaborativo. Propón nuevas herramientas o agentes en nuestro repositorio.
Abrir Issue en GitHub