Saltar al contenido principal
El dashboard de failproofai es una aplicación web local para monitorear tus sesiones de agentes de IA y gestionar políticas. Descubre qué hicieron tus agentes mientras no estabas.

Iniciar el dashboard

failproofai
Se abre en http://localhost:8020. El dashboard lee directamente del sistema de archivos — las carpetas de proyectos de Claude Code y los archivos de configuración de failproofai. No se escribe nada en ningún servicio remoto.

Páginas

Proyectos

Lista todos los proyectos de Claude Code, OpenAI Codex, GitHub Copilot CLI (beta), Cursor Agent (beta), OpenCode (beta), Pi (beta) y Gemini CLI (beta) encontrados en tu máquina. Los proyectos de Claude se descubren desde ~/.claude/projects/ (o la ruta definida por CLAUDE_PROJECTS_PATH); los proyectos de Codex se descubren escaneando cada transcripción en ~/.codex/sessions/<YYYY>/<MM>/<DD>/*.jsonl y agrupando por el cwd registrado en el primer registro de cada sesión; los proyectos de Copilot CLI se descubren escaneando cada ~/.copilot/session-state/<sessionId>/workspace.yaml (configurable mediante COPILOT_HOME) y agrupando por su campo cwd; los proyectos de Cursor Agent se descubren escaneando metadatos por sesión en ~/.cursor/agent-sessions/<sessionId>/ (configurable mediante CURSOR_HOME, con conversations/ y sessions/ como alternativas) para un escalar cwd en meta.json / session.json / workspace.yaml; los proyectos de OpenCode se descubren consultando su base de datos SQLite en ~/.local/share/opencode/opencode.db mediante opencode db --format json (leemos las tablas session y project y agrupamos por project_id); los proyectos de Pi se descubren escaneando transcripciones JSONL por sesión en ~/.pi/agent/sessions/<encoded-cwd>/<timestamp>_<uuid>.jsonl (configurable mediante PI_SESSIONS_DIR) y extrayendo el cwd del primer registro de cada sesión; los proyectos de Gemini CLI se descubren escaneando ~/.gemini/tmp/<basename>/chats/session-<timestamp>-<uuid-prefix>.jsonl (configurable mediante GEMINI_SESSIONS_DIR) y recuperando el cwd canónico desde el marcador de texto hermano .project_root. Un proyecto que ha sido utilizado por múltiples CLIs se muestra como una sola fila con todas las insignias correspondientes. Usa el desplegable CLI sobre la tabla para filtrar por un agente CLI específico; la URL conserva tu selección como ?cli=claude|codex|copilot|cursor|opencode|pi|gemini. Cada proyecto muestra:
  • Nombre del proyecto (derivado de la ruta de la carpeta)
  • Una insignia de CLI — Claude Code (naranja), OpenAI Codex (morado), GitHub Copilot (azul), Cursor Agent (esmeralda), OpenCode (ámbar), Pi (rosa) y/o Gemini CLI (celeste)
  • Fecha de la actividad de sesión más reciente
Haz clic en un proyecto para ver sus sesiones.

Sesiones

Lista todas las sesiones dentro de un proyecto. Cada sesión muestra:
  • ID de sesión
  • Marcas de tiempo de inicio y fin
  • Número de llamadas a herramientas
  • Recuento de actividad de hooks (políticas que se activaron)
Usa el filtro de rango de fechas y la búsqueda por ID de sesión para acotar la lista. Las sesiones están paginadas. Haz clic en una sesión para abrir el visor de sesiones.

Visor de sesiones

El visor de sesiones responde la pregunta clave sobre los agentes autónomos: ¿qué hizo el agente y se mantuvo en el camino correcto? Una insignia de CLI junto al encabezado indica si la sesión es una transcripción de Claude Code, OpenAI Codex, GitHub Copilot CLI, Cursor Agent, OpenCode, Pi o Gemini CLI. Muestra una línea de tiempo de todo lo que ocurrió en una sesión:
  • Mensajes — Respuestas de texto de Claude y prompts del usuario
  • Llamadas a herramientas — Cada herramienta que Claude invocó, con su entrada y salida
  • Actividad de políticas — Para cada llamada a herramienta, qué políticas se activaron y qué decisión devolvieron
La barra de estadísticas en la parte superior muestra la duración de la sesión, el total de llamadas a herramientas y un resumen de las decisiones de hooks (conteos de allow / deny / instruct). Haz clic en el botón Download Logs para exportar la sesión. Para sesiones de Claude Code, Codex, Copilot, Cursor, Pi y Gemini obtienes la transcripción JSONL original en disco byte a byte; para OpenCode (cuyas sesiones viven en SQLite, no en disco) obtienes un documento JSON que refleja las tablas subyacentes session / messages / parts.

Audit

Un informe con personalidad sobre cómo ha estado comportándose realmente tu agente a lo largo de sesiones pasadas. Ejecuta el mismo análisis que el CLI failproofai audit pero lo presenta como un dashboard de seis secciones:
  1. Identity — clasifica tu agente en uno de 8 arquetipos (the optimist, the cowboy, the explorer, the goldfish, the paranoid architect, the precision builder, the hammer, the ghost) según qué detectores y políticas se activaron y con qué intensidad. Renderiza un símbolo de píxeles 8×8, el eslogan del arquetipo, el encuadre “common in” / “primary risk” y el cierre de una sola línea.
  2. Show off your agent — captura la tarjeta de identidad como un PNG de 1200×630 apto para publicar en X / LinkedIn (haz clic en make poster).
  3. Strengths — comportamientos marcados en verde que tu agente ya hace bien, derivados de los datos de auditoría en vivo (tasa de llamadas a herramientas limpias, duración promedio de sesión, cero filtraciones de credenciales, cero tormentas de reintentos, etc.).
  4. Score + leaderboard — puntuación de 0 a 100 con calificación en letras (S/A/B/C/D/F), un histograma de distribución que muestra dónde te ubicas en el grupo, texto en prosa (“a B starts at 71. you’re 13 points away.”) y una tabla de clasificación con tu fila resaltada.
  5. Findings — tarjetas por hallazgo ordenadas por impacto. Cada tarjeta muestra qué ocurrió, qué costo tiene, una muestra de evidencia con comandos reales capturados y la política de failproofai que detectaría el mismo patrón ($ failproof policy add <slug>, haz clic para copiar).
  6. Prescribed policies + return loop — una cuadrícula de todas las políticas integradas no habilitadas que cerrarían una brecha, con una proyección de puntuación, más un CTA de “re-auditar en 7 días”.
Impulsado por el runtime de failproofai audit — consulta Audit CLI para conocer el motor de análisis subyacente, los indicadores admitidos y las invariantes de caché por transcripción. El dashboard almacena en caché el último resultado en ~/.failproofai/audit-dashboard.json (modo 0600, ranura única, las nuevas ejecuciones sobrescriben) para que las revisitas sean instantáneas; hacer clic en [ Re-run ↻ ] hace un POST a /api/audit/run y el dashboard consulta /api/audit/status a 1Hz hasta que la ejecución finaliza. El estado vacío (sin caché) y el estado de cero sesiones (caché existe pero el análisis no encontró transcripciones) se presentan por separado.

Políticas

Una página de dos pestañas para gestionar políticas y revisar actividad.
  • Selecciona múltiples CLIs de agentes que failproofai protegerá desde un único panel — Claude Code, OpenAI Codex, GitHub Copilot, Cursor Agent, OpenCode, Pi y Gemini CLI tienen una fila con el estado de instalación (Active / Detected / Inactive), la ruta de configuración de ámbito de usuario y un acento de color de marca. Marca o desmarca los CLIs que desees y haz clic en Apply changes para instalar/desinstalar la diferencia en un solo paso. Los CLIs cuyo binario se detecta en el PATH vienen pre-seleccionados.
  • Activa o desactiva políticas individuales con un solo clic (escribe en ~/.failproofai/policies-config.json — compartido entre todos los CLIs instalados)
  • Expande una política para configurar sus parámetros (para políticas que admiten policyParams)
  • Establece una ruta de archivo de políticas personalizadas

Actualización automática

El dashboard tiene un selector de actualización automática en la navegación superior. Cuando está habilitado, la página actual se refresca periódicamente para mostrar nuevas sesiones y actividad de políticas a medida que aparecen. Esencial para monitorear sesiones de agentes autónomos de larga duración.

Deshabilitar páginas

Si solo necesitas algunas partes del dashboard, configura FAILPROOFAI_DISABLE_PAGES con una lista separada por comas de nombres de páginas:
FAILPROOFAI_DISABLE_PAGES=policies failproofai
Valores válidos: policies, projects, audit.

Configurar la ruta de proyectos

Por defecto, el dashboard lee desde el directorio estándar de proyectos de Claude Code. Cámbialo para configuraciones personalizadas:
CLAUDE_PROJECTS_PATH=/custom/path/to/projects failproofai

Acceder desde un host que no sea localhost

Cuando ejecutas el dashboard en modo dev (npm run dev) y accedes desde un hostname distinto a localhost — por ejemplo, un dominio personalizado, una IP remota o una URL tunelizada — puedes ver una advertencia como:
⚠ Blocked cross-origin request to Next.js dev resource /_next/webpack-hmr from "dashboard.example.com".
Esto es Next.js bloqueando el acceso de origen cruzado a su websocket HMR (recarga de módulos en caliente), que es una función exclusiva del modo dev. Para permitir tu host, usa el indicador --allowed-origins:
npm run dev -- --allowed-origins dashboard.example.com
Para múltiples hosts o IPs, pasa una lista separada por comas:
npm run dev -- --allowed-origins dashboard.example.com,192.168.1.5
También puedes configurar la variable de entorno FAILPROOFAI_ALLOWED_DEV_ORIGINS en su lugar:
FAILPROOFAI_ALLOWED_DEV_ORIGINS=dashboard.example.com npm run dev
Esto solo aplica al modo dev. Cuando ejecutas failproofai (modo producción), no hay websocket HMR ni problema de recursos dev de origen cruzado.