Pepe

Ruiz

Full Stack & AI Developer

SHIELD AI

SHIELDAI

Sistema empresarial de anonimización inteligente desarrollado para Scalian que protege datos personales enviados a LLMs, combinando IA, detección de PII y procesamiento en tiempo real para el cumplimiento normativo GDPR

El Problema

Las organizaciones necesitan utilizar LLMs (inteligencia artificial) para procesar información, pero esto implica enviar datos personales a servicios externos. Carecen de herramientas que protejan automáticamente la información personal antes de enviarla a los LLMs mientras cumplen con GDPR. Los procesos manuales son propensos a errores y no escalan.

La Solución

Desarrollo de una plataforma que actúa como intermediario seguro entre las empresas y los LLMs. El sistema detecta automáticamente información personal usando modelos de IA especializados para español, la reemplaza con datos sintéticos mediante Faker antes de enviar consultas a los LLMs, y restaura los datos originales en las respuestas recibidas. Todo esto mediante mapeos almacenados en Redis con TTL. Incluye interfaz React con streaming en tiempo real mostrando tres paneles: datos anonimizados enviados, respuesta del LLM, y respuesta final con datos restaurados.

Impacto

Permite a las organizaciones utilizar LLMs de forma segura cumpliendo con GDPR, automatiza la protección de datos personales, reduce tiempos de procesamiento y proporciona trazabilidad completa con sistema de monitoreo Prometheus/Grafana. Sistema optimizado con procesamiento de ~500 documentos por minuto, ~50ms por documento en anonimización, <100ms de latencia en streaming y ~10ms por operación de desanonimización.

Categoría

Inteligencia Artificial & Full Stack

Fecha de finalización

Octubre de 2025

Stack tecnológico

PythonFastAPIReactRedisDockerHuggingFace TransformersGroq APIFakerTailwind CSSPrometheusGrafanaOpenCVRetinaFaceMTCNNNginx

Puntos destacados

  • Protección automática de datos personales enviados a LLMs
  • Detección de PII con transformers optimizados para español
  • Anonimización inteligente con datos sintéticos usando Faker
  • Sistema de desanonimización con mapeos en Redis y TTL configurable
  • Procesamiento de múltiples formatos: texto, PDF, Word, Excel, imágenes
  • Anonimización de imágenes con detección facial (RetinaFace, MTCNN)
  • Streaming en tiempo real con tres paneles sincronizados
  • Stack de monitoreo completo: Prometheus, Grafana, AlertManager

Arquitectura

SHIELD AI - Arquitectura

Demostración

Monitoreo y Métricas

SHIELD AI - Monitoreo y Métricas

Características principales

  • Intermediario seguro entre empresas y LLMs externos (Groq API)
  • Backend FastAPI con endpoints RESTful y documentación Swagger automática
  • Detección de patrones regex mejorados: DNI, NIE, IBAN, teléfonos, emails con validación
  • Mapeo consistente: mismas entidades generan mismos reemplazos sintéticos
  • Sesiones aisladas: cada proceso mantiene su propio contexto sin mezcla de datos
  • Frontend React con Tailwind CSS, drag & drop para archivos
  • Sistema de métricas en tiempo real: detecciones, rendimiento, errores
  • Exportación de resultados en múltiples formatos con preservación de estructura

Siguiente proyecto

LOGOTRACKERPRO
Pepe Ruiz - Full Stack Developer & Data Scientist