Una tarde buscando un precedente en un sistema de consulta judicial, escribí exactamente lo que necesitaba: términos precisos, fecha aproximada, tipo de actuación. El sistema me devolvió cero resultados. Sabía que el precedente existía — lo había visto antes en papel. Después de media hora buscando con términos distintos, reformulando, probando combinaciones que no debería tener que probar, lo encontré. El documento estaba ahí. El sistema no lo ocultó deliberadamente. Simplemente no lo había indexado de la manera que yo buscaba.
Ese momento me quedó dando vueltas. Porque lo que pasó no fue un error técnico menor. Fue una decisión —tomada por alguien, en algún momento— sobre cómo organizar la información, y esa decisión tuvo consecuencias reales en mi trabajo ese día. Pudo haberlas tenido en una decisión judicial.
Qué es la indexación, sin hablar como ingeniero
Cuando un sistema de información recibe miles de documentos, necesita una forma de organizarlos para que puedan buscarse después. Ese proceso de organización se llama indexación.
Piénsalo como el índice de un libro: el autor decide qué palabras merecen aparecer en el índice y qué palabras no. Si una idea importante solo aparece mencionada de pasada, sin un término clave que el índice recoja, esa idea queda invisible para quien busca rápido.
Los sistemas digitales hacen algo parecido, pero a escala masiva y con reglas que nadie leyó en la reunión de usuarios.
Esas reglas deciden qué campos de un documento son buscables. Qué texto se incluye en el índice y qué se almacena pero no se puede consultar. Con qué términos se etiqueta un tipo de actuación y cuáles sinónimos reconoce el sistema. Cuánto pesa la fecha frente al contenido cuando el sistema ordena los resultados.
Todo eso es la indexación. Y cuando funciona mal — o simplemente no fue diseñada pensando en quien la usa — la información no desaparece, pero queda efectivamente invisible.
Lo que he visto desde adentro
He trabajado con varios sistemas de gestión y consulta judicial en Colombia. No voy a hacer un listado de fallas específicas de sistemas concretos — ese no es el punto, y sería fácilmente malinterpretado como una crítica a personas que están haciendo su mejor esfuerzo con recursos limitados. El punto es el patrón que se repite.
Los sistemas judiciales colombianos tienen expedientes en formato electrónico, bases de datos jurisprudenciales, registros de actuaciones, estadísticas de despachos. Toda esa información existe digitalmente. Pero la capacidad de encontrarla depende de cómo fue indexada, y los criterios de indexación casi nunca están documentados para quienes los usan.
Un juez que busca precedentes sobre un tipo específico de medida cautelar puede encontrar diez resultados o ciento cincuenta, dependiendo de qué términos use — y no sabe de antemano cuál de las dos posibilidades es más cercana a la realidad del sistema.
Un litigante que intenta rastrear el historial de actuaciones de un despacho para entender sus tiempos promedio puede llegar a conclusiones completamente distintas dependiendo del rango de fechas que configure, porque el sistema filtra por fecha de registro, no por fecha de la actuación.
Construí Sherlock-docs precisamente para abordar parte de este problema: poder analizar documentos judiciales con más control sobre qué se busca y cómo. No como solución definitiva — soy un desarrollador, no el Consejo Superior de la Judicatura — sino como herramienta que pone algo de poder de consulta en manos del que trabaja con los documentos. Pero la experiencia de construirla me hizo ver con claridad lo que un sistema de información judicial opaco le cuesta a quien trabaja con derecho todos los días.
El nombre jurídico de este problema
En derecho, la información relevante para un proceso no puede quedar arbitrariamente fuera del alcance de las partes ni del juez. Eso es parte de lo que protege el debido proceso.
El artículo 29 de la Constitución Política colombiana garantiza el derecho a un proceso público con todas las garantías. La jurisprudencia constitucional ha desarrollado ese derecho hacia la noción de que las partes deben tener acceso a los elementos que informan las decisiones que las afectan.
Cuando un sistema de información judicial no indexa correctamente un precedente, o cuando los criterios de búsqueda favorecen ciertos tipos de actuaciones sobre otras, el resultado no es neutro. Alguien que busca jurisprudencia sobre un tipo de caso puede encontrar solo la que el sistema decidió — sin saberlo — hacer visible. Un juez que revisa estadísticas de carga para evaluar una decisión de redistribución puede estar mirando un subconjunto de la realidad, no su totalidad.
Eso tiene consecuencias procesales. Y nadie firmó un documento diciendo que esas serían las reglas.
Transparencia algorítmica: el concepto que el derecho empieza a usar
La transparencia algorítmica es el principio según el cual cualquier persona afectada por una decisión automatizada tiene derecho a saber cómo funciona el sistema que tomó esa decisión.
El Reglamento General de Protección de Datos europeo (RGPD) reconoce este derecho en su artículo 22 — el derecho a no ser objeto de decisiones basadas únicamente en tratamiento automatizado. La inteligencia artificial de la Unión Europea, aprobada en 2024, va más lejos y exige explicabilidad para los sistemas de IA de alto riesgo, incluyendo explícitamente los usados en administración de justicia.
Colombia no tiene aún una legislación equivalente de IA. Pero los principios que sustentan la transparencia algorítmica no son ajenos al ordenamiento jurídico colombiano — están contenidos en el derecho de acceso a la información pública (Ley 1712 de 2014), en el habeas data (Ley 1581 de 2012) y en la jurisprudencia constitucional sobre transparencia en la función pública.
La pregunta que queda abierta es si esos marcos existentes son suficientes cuando el sistema que toma decisiones no es un funcionario — es un algoritmo que nadie auditó.
Cómo deberían diseñarse estos sistemas
No tengo una respuesta completa. Pero sí tengo criterios que emergieron de trabajar con este problema desde adentro.
Un sistema de información judicial debería documentar sus criterios de indexación en lenguaje accesible para sus usuarios finales — no solo en especificaciones técnicas para los desarrolladores. Si el sistema prioriza ciertos tipos de actuaciones sobre otras, eso debería ser explícito.
Debería tener mecanismos de auditoría. No solo logs técnicos que nadie revisa, sino indicadores que permitan detectar sesgos sistemáticos: ¿qué tipos de documentos aparecen con mayor frecuencia en los resultados? ¿Qué períodos están subrepresentados? ¿Hay diferencias en la indexación entre distintos tipos de despachos?
Debería involucrar a quienes lo usan en su diseño. Eso no es una observación obvia — el diseño participativo en sistemas de gobierno es costoso, lento y políticamente complicado. Pero un sistema de consulta judicial diseñado exclusivamente por ingenieros sin que ningún juez, litigante o auxiliar judicial haya participado en la definición de qué debe ser buscable es un sistema que resuelve el problema equivocado.
Y debería haber responsabilidad cuando falla. No en abstracto — alguien que pueda decir: este sistema produjo resultados que indujeron a error, aquí están las consecuencias, aquí está lo que cambiará.
El algoritmo que nadie auditó
Termino donde empecé. Un precedente que existía pero no aparecía. Media hora buscando lo que debería haber tomado treinta segundos.
Ese sistema fue diseñado por alguien. Fue aprobado por alguien. Está siendo usado hoy por jueces, litigantes y funcionarios que confían en que lo que ven en pantalla refleja la realidad del expediente.
En muchos casos, refleja algo más pequeño: la realidad que el índice decidió hacer visible.
El sesgo de indexación no es deliberado. Nadie se sentó a diseñar un sistema que ocultara ciertos precedentes. Pero la ausencia de intención maliciosa no elimina el efecto. Un algoritmo que produce resultados sesgados de manera sistemática tiene consecuencias jurídicas reales, independientemente de si quien lo diseñó quiso eso o no.
La transparencia algorítmica no es una demanda tecnológica. Es una demanda jurídica que la tecnología hace urgente. Y el sistema judicial colombiano todavía no tiene una respuesta clara para ella.
Este post es parte de la serie [Pensando] — donde exploro las tensiones entre tecnología, derecho y las instituciones del sistema judicial colombiano.