Compliance y marcos regulatorios

Por qué compliance en desarrollo con IA

El uso de agentes IA en desarrollo de software introduce riesgos regulatorios específicos:

Trazabilidad: ¿Quién escribió cada línea de código? ¿Un humano o una IA?
Gobernanza: ¿Cómo se configuran y controlan los agentes IA?
Transparencia: ¿Se documenta adecuadamente el uso de IA?
Seguridad: ¿Existen guardrails para prevenir comportamiento no deseado?
Responsabilidad: ¿Hay revisión humana antes de desplegar código generado por IA?

licit evalúa estos aspectos contra marcos regulatorios establecidos.

EU AI Act (Reglamento UE 2024/1689)

Alcance

El EU AI Act es el primer marco regulatorio integral para inteligencia artificial. Entró en vigor en agosto de 2024, con aplicación gradual hasta agosto de 2027.

licit evalúa los artículos relevantes para equipos de desarrollo que usan agentes IA:

Artículos evaluados

Artículo	Nombre	Qué evalúa licit
Art. 9(1)	Sistema de gestión de riesgos	Guardrails, quality gates, budget limits, security scanning
Art. 10(1)	Datos y gobernanza de datos	Perspectiva deployer — documentar prácticas del proveedor
Art. 12(1)	Record keeping — logging automático	Git history, audit trail, provenance tracking, OTel
Art. 13(1)	Transparencia	Annex IV, changelog de configs, trazabilidad de requisitos
Art. 14(1)	Supervisión humana	Dry-run, human review gate, quality gates, budget limits
Art. 14(4)(a)	Oversight — entender capacidades	Misma evidencia que Art. 14(1)
Art. 14(4)(d)	Oversight — capacidad de intervenir	Dry-run + rollback
Art. 26(1)	Deployer — uso conforme	Configs de agentes presentes
Art. 26(5)	Deployer — monitoreo	Misma evidencia que Art. 12(1)
Art. 27(1)	FRIA	Documento FRIA completado
Annex IV	Documentación técnica	Documento Annex IV generado

Scoring del evaluador

Cada artículo tiene un método de evaluación dedicado con scoring numérico. El score se convierte a status con _score_to_status(score, compliant_at, partial_at):

Artículo	Indicadores (score)	Compliant at	Partial at
Art. 9	Guardrails +1, quality gates +1, budget +1, scanning +1	3+	1+
Art. 10	Siempre PARTIAL (deployer no entrena)	—	—
Art. 12	Git +1, audit trail +2, provenance +1, OTel +1	3+	1+
Art. 13	Annex IV +2, changelog +1, traceability +1	2+	1+
Art. 14	Dry-run +1, review gate +2, quality gates +1, budget +1	3+	1+

El evaluador genera recomendaciones accionables con comandos licit concretos (ej: “Run: licit trace — to start tracking code provenance”).

FRIA — Evaluación de Impacto en Derechos Fundamentales

El FRIA (Fundamental Rights Impact Assessment) es obligatorio para sistemas de IA de alto riesgo según el Art. 27. licit genera un FRIA interactivo en 5 pasos con 16 preguntas y auto-detección de 8 campos:

System Description (5 preguntas): Propósito, tecnología AI, modelos, alcance, revisión humana.
Fundamental Rights Identification (4 preguntas): Datos personales, empleo, seguridad, discriminación.
Impact Assessment (3 preguntas): Nivel de riesgo, impacto máximo, velocidad de detección.
Mitigation Measures (5 preguntas): Guardrails, scanning, testing, audit trail, medidas adicionales.
Monitoring & Review (3 preguntas): Frecuencia de revisión, responsable, proceso de incidentes.

Auto-detección: Para campos como system_purpose, guardrails, security_scanning, testing, y audit_trail, licit infiere la respuesta desde el ProjectContext y EvidenceBundle del proyecto.

Comando:

licit fria            # Cuestionario interactivo nuevo
licit fria --update   # Actualizar FRIA existente

Archivos generados:

.licit/fria-data.json — Datos raw (JSON, reutilizable con --update)
.licit/fria-report.md — Reporte Markdown con template Jinja2

Annex IV — Documentación Técnica

El Anexo IV define la documentación técnica requerida para sistemas de IA. licit genera esta documentación auto-poblándola desde 27 variables de template extraídas de:

Metadatos del proyecto (pyproject.toml, package.json)
Configuración de CI/CD
Configuraciones de agentes IA
Frameworks de testing y herramientas de seguridad
Datos de provenance (% código AI)
Evidencia de guardrails, quality gates, budget limits, FRIA, audit trail

6 secciones auto-generadas:

General Description — Propósito, componentes AI, lenguajes, frameworks
Development Process — Version control, provenance, configs de agentes
Monitoring & Control — CI/CD, audit trail, changelog
Risk Management — Guardrails, quality gates, budget, oversight, FRIA
Testing & Validation — Test framework, security scanning
Changes & Lifecycle — Mecanismos de tracking

Cada sección sin evidencia genera una recomendación accionable (ej: “Run licit trace to begin tracking code provenance”).

Comando:

licit annex-iv --organization "Mi Empresa" --product "Mi Producto"

OWASP Agentic Top 10 (2025)

Alcance

El OWASP Top 10 for Agentic AI Security identifica los 10 principales riesgos de seguridad en aplicaciones que usan agentes IA. licit evalúa la postura del proyecto contra cada riesgo con scoring numérico.

Estado: Implementado desde v0.5.0. Ejecuta con licit verify --framework owasp.

Riesgos evaluados

ID	Riesgo	Qué evalúa licit
ASI01	Excessive Agency	Guardrails, quality gates, budget limits, agent configs
ASI02	Prompt Injection	vigil scanning, guardrails, human review gate
ASI03	Supply Chain Vulnerabilities	SCA tools (Snyk/Semgrep/CodeQL/Trivy), changelog, config versioning
ASI04	Insufficient Logging & Monitoring	Git history, audit trail, provenance, OTel
ASI05	Improper Output Handling	Human review gate, quality gates, test suite
ASI06	Lack of Human Oversight	Human review gate, dry-run, quality gates, rollback
ASI07	Insufficient Sandboxing	Guardrails (blocked commands, protected files), CI/CD, agent configs
ASI08	Unbounded Resource Consumption	Budget limits, quality gates
ASI09	Poor Error Handling	Test suite, CI/CD, rollback capability
ASI10	Sensitive Data Exposure	Protected file guardrails, security scanning, agent scope

Scoring del evaluador

Cada riesgo tiene un método de evaluación dedicado con scoring numérico. El score se convierte a status con _score_to_status(score, compliant_at, partial_at):

Riesgo	Indicadores (score)	Compliant at	Partial at
ASI01	Guardrails +1, quality gates +1, budget +1, agent configs +1	3+	1+
ASI02	vigil +2, guardrails +1, human review +1	3+	1+
ASI03	SCA tools +2, changelog +1, agent configs +1	3+	1+
ASI04	Git +1, audit trail +2, provenance +1, OTel +1	3+	1+
ASI05	Human review +2, quality gates +1, test suite +1	3+	1+
ASI06	Human review +2, dry-run +1, quality gates +1, rollback +1	3+	1+
ASI07	Guardrails +2, CI/CD +1, agent configs +1	3+	1+
ASI08	Budget limits +2, quality gates +1	2+	1+
ASI09	Test suite +1, CI/CD +1, rollback +1	2+	1+
ASI10	Guardrails +1, security scanning +2, agent configs +1	3+	1+

ASI08 y ASI09 usan compliant_at=2 porque tienen menos señales disponibles. El evaluador genera recomendaciones accionables con herramientas concretas (ej: “Add AI-specific security scanning: vigil detects prompt injection patterns”).

Nota de diseño: El evaluador mide la presencia de herramientas de seguridad, no sus hallazgos. Un proyecto con vigil instalado pero 50 findings críticos obtiene el mismo score que uno con 0 findings. Los hallazgos son relevantes para el gap analyzer (Phase 6).

Mapeo a evidencia

Cada riesgo OWASP se mapea a evidencia recopilable del ProjectContext y EvidenceBundle:

ASI01 (Excessive Agency)
  ├── ev.has_guardrails + ev.guardrail_count
  ├── ev.has_quality_gates + ev.quality_gate_count
  ├── ev.has_budget_limits
  └── ctx.agent_configs

ASI02 (Prompt Injection)
  ├── ctx.security.has_vigil (+2 — AI-specific scanning)
  ├── ev.has_guardrails
  └── ev.has_human_review_gate

ASI04 (Logging & Monitoring)
  ├── ctx.git_initialized + ctx.total_commits
  ├── ev.has_audit_trail + ev.audit_entry_count (+2)
  ├── ev.has_provenance + ev.provenance_stats
  └── ev.has_otel

ASI06 (Human Oversight)
  ├── ev.has_human_review_gate (+2 — critical control)
  ├── ev.has_dry_run
  ├── ev.has_quality_gates
  └── ev.has_rollback

ASI08 (Unbounded Resources)
  ├── ev.has_budget_limits (+2 — direct control)
  └── ev.has_quality_gates

Comando:

licit verify --framework owasp   # Evaluar solo OWASP
licit verify --framework all     # Evaluar EU AI Act + OWASP

Cómo evalúa licit el compliance

Proceso de evaluación

1. Detectar    → ProjectDetector analiza el proyecto
2. Recopilar   → EvidenceCollector reúne evidencia
3. Evaluar     → Evaluadores aplican requisitos del marco
4. Clasificar  → Cada requisito: compliant / partial / non-compliant / n/a
5. Reportar    → Reporte con evidencia, brechas y recomendaciones

Fuentes de evidencia

Fuente	Qué aporta	Estado
Git history	Proveniencia del código, contribuidores, frecuencia	Funcional (v0.2.0)
Session logs	Logs de sesión de agentes IA (Claude Code)	Funcional (v0.2.0)
Agent config changelog	Cambios en configs de agentes con severidad	Funcional (v0.3.0)
Agent configs	Guardrails, modelos usados, reglas de código	Funcional (v0.1.0)
CI/CD configs	Human review gates, steps de seguridad	Funcional (v0.1.0)
Architect reports	Audit trail, calidad de ejecución	Fase 7
SARIF files	Hallazgos de seguridad (vulnerabilidades)	Fase 7
`.licit/` data	FRIA, Annex IV, changelog, provenance store	Funcional (v0.4.0+)

La evidencia de provenance (licit trace) alimenta directamente los artículos de transparencia (Art. 13) y trazabilidad (Art. 10) del EU AI Act. El changelog de configs (licit changelog) alimenta los artículos de transparencia (Art. 13) y obligaciones de deployers (Art. 26). Ambos alimentan los controles de monitoring (ASI-06, ASI-10) del OWASP Agentic Top 10.

Niveles de cumplimiento

Estado	Significado	Acción requerida
`compliant`	Requisito totalmente cumplido	Ninguna
`partial`	Requisito parcialmente cumplido	Mejorar evidencia o controles
`non-compliant`	Requisito no cumplido	Implementar controles faltantes
`n/a`	No aplica al proyecto	Ninguna
`not-evaluated`	Aún no evaluado	Ejecutar evaluación

Reportes de compliance

Formatos disponibles

Formato	Uso recomendado
Markdown	Revisión humana, PRs, documentación
JSON	Integración con otras herramientas, dashboards
HTML	Presentación a stakeholders, auditorías

Estructura del reporte

# Compliance Report — Mi Proyecto
Generated: 2026-03-10

## Summary
- EU AI Act: 72% compliant (13/18 controls)
- OWASP Agentic: 60% compliant (6/10 controls)

## EU AI Act
### Article 9 — Risk Management
Status: PARTIAL
Evidence: FRIA exists but incomplete
Recommendation: Complete FRIA sections 3-5

### Article 14 — Human Oversight
Status: COMPLIANT
Evidence: GitHub Actions requires approval for deployment
...

## Gaps
| Priority | Requirement | Gap | Effort |
|---|---|---|---|
| 1 | ART-9-1 | No risk assessment | Medium |
| 2 | ASI-01 | No guardrails | Low |

CI/CD Gate

licit puede actuar como gate de compliance en pipelines de CI/CD:

# .github/workflows/compliance.yml
name: Compliance Check
on: [push, pull_request]

jobs:
  compliance:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
        with:
          fetch-depth: 0   # Necesario para análisis git

      - uses: actions/setup-python@v5
        with:
          python-version: "3.12"

      - name: Install licit
        run: pip install licit-ai-cli

      - name: Run compliance check
        run: licit verify
        # Exit 0 = pass, Exit 1 = fail, Exit 2 = warnings

Códigos de salida:

Código	Resultado	Pipeline
0	Todos los requisitos críticos cumplidos	Pass
1	Algún requisito crítico no cumplido	Fail
2	Algún requisito parcialmente cumplido	Warning (configurable)

Marcos futuros (V1+)

licit está diseñado para soportar marcos adicionales:

Marco	Estado	Descripción
NIST AI RMF	Planificado (V1)	Risk Management Framework del NIST
ISO/IEC 42001	Planificado (V1)	Sistema de gestión de IA
SOC 2 AI	Considerado	Controles SOC 2 específicos de IA
IEEE 7000	Considerado	Diseño ético de sistemas

La arquitectura de frameworks/ permite añadir nuevos marcos implementando un evaluador con la interfaz Protocol correspondiente.