
SHIELDAI
Sistema empresarial de anonimización inteligente desarrollado para Scalian que protege datos personales enviados a LLMs, combinando IA, detección de PII y procesamiento en tiempo real para el cumplimiento normativo GDPR
El Problema
Las organizaciones necesitan utilizar LLMs (inteligencia artificial) para procesar información, pero esto implica enviar datos personales a servicios externos. Carecen de herramientas que protejan automáticamente la información personal antes de enviarla a los LLMs mientras cumplen con GDPR. Los procesos manuales son propensos a errores y no escalan.
La Solución
Desarrollo de una plataforma que actúa como intermediario seguro entre las empresas y los LLMs. El sistema detecta automáticamente información personal usando modelos de IA especializados para español, la reemplaza con datos sintéticos mediante Faker antes de enviar consultas a los LLMs, y restaura los datos originales en las respuestas recibidas. Todo esto mediante mapeos almacenados en Redis con TTL. Incluye interfaz React con streaming en tiempo real mostrando tres paneles: datos anonimizados enviados, respuesta del LLM, y respuesta final con datos restaurados.
Impacto
Permite a las organizaciones utilizar LLMs de forma segura cumpliendo con GDPR, automatiza la protección de datos personales, reduce tiempos de procesamiento y proporciona trazabilidad completa con sistema de monitoreo Prometheus/Grafana. Sistema optimizado con procesamiento de ~500 documentos por minuto, ~50ms por documento en anonimización, <100ms de latencia en streaming y ~10ms por operación de desanonimización.
Categoría
Inteligencia Artificial & Full Stack
Fecha de finalización
Octubre de 2025
Stack tecnológico
Puntos destacados
- Protección automática de datos personales enviados a LLMs
- Detección de PII con transformers optimizados para español
- Anonimización inteligente con datos sintéticos usando Faker
- Sistema de desanonimización con mapeos en Redis y TTL configurable
- Procesamiento de múltiples formatos: texto, PDF, Word, Excel, imágenes
- Anonimización de imágenes con detección facial (RetinaFace, MTCNN)
- Streaming en tiempo real con tres paneles sincronizados
- Stack de monitoreo completo: Prometheus, Grafana, AlertManager
Arquitectura

Demostración
Monitoreo y Métricas

Características principales
- Intermediario seguro entre empresas y LLMs externos (Groq API)
- Backend FastAPI con endpoints RESTful y documentación Swagger automática
- Detección de patrones regex mejorados: DNI, NIE, IBAN, teléfonos, emails con validación
- Mapeo consistente: mismas entidades generan mismos reemplazos sintéticos
- Sesiones aisladas: cada proceso mantiene su propio contexto sin mezcla de datos
- Frontend React con Tailwind CSS, drag & drop para archivos
- Sistema de métricas en tiempo real: detecciones, rendimiento, errores
- Exportación de resultados en múltiples formatos con preservación de estructura
Siguiente proyecto
LOGOTRACKERPRO