Tercer Milenio

En colaboración con ITA

Justicia y big data

La inteligencia artificial saca argumentos de sentencias con decenas de folios en segundos

Juristas de Unizar e ingenieros de Itainnova han desarrollado y entrenado una herramienta capaz de extraer la información básica: qué se pedía, qué resolvió el juez y con qué argumentos.

Las herramientas basadas en inteligencia artificial empiezan a llegar al ámbito jurídico.
Las herramientas basadas en inteligencia artificial empiezan a llegar al ámbito jurídico.

La costumbre de los juristas de redactar frases muy extensas no se lo pone nada fácil a la inteligencia artificial que está aprendiendo a leer sentencias judiciales. Juristas e ingenieros de Itainnova trabajan codo a codo en un proyecto pionero, Bidaraciv, liderado por la Universidad de Zaragoza, cuyo objetivo es el análisis mediante big data de la argumentación jurídica contenida en las resoluciones de la jurisdicción civil. El resultado es un modelo basado en redes neuronales que se ha entrenado, y seguirá entrenándose, para reconocer argumentos y peticiones. Identifica etiquetas, imprescindibles para que una máquina entienda un texto. En este proyecto se han puesto, humanamente, por dos juristas, 57.000 etiquetas en casi 3.100 sentencias referidas a la custodia (compartida o individual) de los hijos menores de edad.

Pese a que "las dificultades son numerosas –reconoce José Félix Muñoz Soro, coordinador del proyecto–, según los resultados preliminares, las etiquetas que identifica el modelo en las sentencias utilizadas para el test coinciden en un 84% con las que habían puesto los etiquetadores humanos". Es un resultado que esperan mejorar, pero que, "en principio, resulta prometedor". "La simple operación preliminar de dividir el texto en frases se topa con numerosos inconvenientes –precisa–, como errores en la redacción de las sentencias o la costumbre de los juristas de redactar frases muy extensas". Pero "seguramente la principal dificultad es la complejidad, y en ocasiones oscuridad, del lenguaje jurídico".

De él han aprendido mucho los ingenieros de Itainnova, "sobre todo cómo este lenguaje debe ser codificado en la máquina", señala Rafael del Hoyo, responsable del proyecto en Itainnova. Ahora ya saben "cómo abordar la extracción de conocimiento, en este caso las argumentaciones, de las sentencias judiciales".

Rosa María Montañés, investigadora en inteligencia artificial del proyecto, indica que, "con los datos que hemos tenido, nos hemos dado cuenta de la gran flexibilidad que tiene el ‘deep learning’ para aprender un lenguaje humano como es el judicial". Además, "hemos visto que puede tener una capacidad de clasificar las sentencias casi al mismo nivel que un ser humano. El mayor problema que encontramos es que la red neuronal es una gran devoradora de datos". Destaca que "realmente el ahorro de tiempo es inmenso: poder sacar el argumentario de un documento de decenas de páginas en segundos permite encontrar rápidamente y sacar conclusiones en un momento, y poder escalarlo a todas las sentencias".

El investigador de Itainnova Francisco Lacueva asegura que esta herramienta, "permitirá mejorar la justicia, pues ayudará a jueces y abogados encontrando fallos y contradicciones en las sentencias". Tanto el conjunto de sentencias etiquetadas como el modelo se compartirán, bajo una licencia libre, en GitHub.

La colaboración entre ingenieros y juristas ha sido intensa. Desde Unizar, han participado 12 personas del grupo de investigación Gestión Jurídica de Negocios, Instrumentos y Organizaciones Innovadoras; y otras cinco desde el grupo Integración y Desarrollo de Sistemas de Big Data y Eléctricos de Itainnova. Para Lacueva, "realmente se obtienen muchas sinergias, ya que el lenguaje jurídico es bastante complejo al principio de entender, al igual que les pasa a los juristas con las redes neuronales".

En opinión de Muñoz Soro, investigador Araid, "la colaboración ha resultado muy positiva. Desde luego los lenguajes son muy distintos y los ingenieros han tenido que familiarizarse con muchos términos jurídicos y con los procedimientos de derecho de familia". Por otra parte, los juristas "han adquirido habilidades en el manejo de herramientas informáticas poco habituales en su ámbito y conocimientos básicos sobre la inteligencia artificial y sus posibilidades". Para ello se han celebrado seminarios interdisciplinares, en los que los investigadores han intercambiado el conocimiento de sus áreas respectivas. El pasado viernes tuvo lugar el webinar ‘La inteligencia artificial y la actividad judicial’.

Justicia predictiva

La información obtenida de las sentencias ha basado una investigación para conocer la probabilidad de éxito en casos de custodia.

En cuando a género, el análisis de las sentencias, todas de segunda instancia, ya que son las únicas que se encuentran disponibles en formato electrónico, ha revelado que el 82,1% de los hombres solicita la custodia compartida y el 86,5% de las mujeres la custodia individual. Por tanto, la situación más común (47%) es un hombre que solicita que se establezca una custodia compartida frente a la individual de la madre, lo que el tribunal solo concede en un 20% de los casos.

Resumiendo: quién pidió qué, qué decidió el juez y por qué

El modelo de inteligencia artificial que se está desarrollando para apoyar a la justicia separa el grano de la paja. "Las sentencias suelen incluir extensas citas de otras sentencias (por ejemplo, del Tribunal Supremo) y también de la legislación. Explican también los argumentos alegados por las partes y, en caso de reconvención, las peticiones que ha realizado la parte demandada o apelada. Además, en las sentencias de segunda instancia se incluye una descripción, normalmente bastante extensa y completa, del procedimiento de primera instancia", explica Muñoz Soro. En fin, que "una parte muy importante de su texto no resulta útil si lo que queremos es saber directamente qué pidió la parte actora, qué ha decidido el tribunal y cuáles son los principales argumentos en los que se ha basado". Este modelo ha sido entrenado, precisamente, para reconocer esos tres elementos dentro de todo el texto de la sentencia e identificar su sentido; es "una operación típica de extracción de información mediante procesamiento del lenguaje natural".

Las aplicaciones de la extracción de información en documentos jurídicos pueden ser muy variadas. "Una de ellas sería la recuperación de sentencias que traten de una cuestión concreta que interese al jurista, por ejemplo, una mujer que pide la custodia compartida y no se le da porque tiene dificultades de conciliación con el trabajo. Esta herramienta permite una precisión mucho mayor que las actualmente en uso porque puede identificar el sexo de la demandante, lo que pide, lo que decide el tribunal y si la disponibilidad ha sido uno de los argumentos utilizados". 

Además, extrayendo la información de grandes conjuntos de sentencias, se pueden desarrollar herramientas de justicia predictiva. Carlos Serrano, catedrático de Unizar, indica que, "al fin y al cabo, lo que un cliente quiere saber cuando visita a un abogado es qué probabilidades de prosperar tiene su pretensión. Con estos instrumentos podemos calcular en qué sentido resuelven los tribunales un tipo concreto de peticiones en función de factores como relación de los progenitores entre sí, disponibilidad de medios y tiempo para el cuidado de los hijos o dedicación a ellos durante el tiempo de convivencia".

En el mundo

A nivel mundial ya se utilizan diversas herramientas basadas en inteligencia artificial (IA) en el ámbito jurídico. "Entre las más extendidas se encuentran las que permiten revisar un contrato, comprobando que tiene todas las cláusulas y detectando posibles errores. También hay sistemas de ayuda a la decisión especializados en materias concretas como, por ejemplo, la normativa financiera o de protección de datos, y se utilizan sobre todo en el ‘compliance’", indica el coordinador del proyecto, José Félix Muñoz Soro.

El mundo del derecho se diferencia de otras áreas en que el conocimiento a utilizar es distinto en cada país. Así, "mientras que una herramienta desarrollada para la medicina puede ser utilizada inmediatamente en España, no ocurre lo mismo con las del ámbito jurídico. Por ello, cada país tendrá que desarrollar sus propios sistemas lo cual, por otra parte, es una oportunidad, y más en el caso de España, que podría liderar la aplicación de la IA al ámbito jurídico en los países de habla hispana".

-Ir al suplemento Tercer Milenio

Apúntate y recibe cada semana en tu correo la newsletter de Tercer Milenio

Comentarios
Debes estar registrado para poder visualizar los comentarios Regístrate gratis Iniciar sesión