Los secretos de Google

Zaragoza alberga la quinta edición de la Conferencia Española de Recuperación de la Información.

Martínez, Nogueras y Cachelas, en el Campus Río Ebro de la Universidad de Zaragoza
Martínez, Nogueras y Cachelas, en el Campus Río Ebro de la Universidad de Zaragoza
C. I.

¿Recuerda aquella vez que, tras buscar información sobre un alojamiento o producto concreto, comenzaron a aparecerle anuncios relacionados en diversas páginas? ¿Se ha preguntado por qué ocurre este fenómeno? Seguramente se trate de uno de los secretos mejor guardados en la actualidad, ya que ser conocedor de estas técnicas puede permitirnos triunfar o fracasar en la red. Precisamente sobre este y otros temas se debate durante estos días en el edificio I+D+i del Campus Río Ebro donde se desarrolla la quinta edición de la Conferencia Española de Recuperación de la Información.

Más de una treintena de investigadores y profesionales informáticos de todo el mundo participan en este encuentro organizado por la Sociedad Española de Recuperación de la Información (SERI) y por investigadores del Instituto de Investigación en Ingeniería de Aragón (I3A). Durante las dos jornadas en las que se ha desarrollado esta actividad, los asistentes han profundizado en lo que hay detrás de buscadores como Google, tratando de comprender aquello que no se ve pero que, sin embargo, forma parte de nuestro día a día.

Y es que, detrás de buscadores tan conocidos como Google se expande una tecnología denominada Recuperación de la información, en definitiva, aquella que hace que al realizar cualquier búsqueda aparezcan sugerencias relacionadas. “Es un sistema que te da datos de cada usuario y que nos permite, en un momento como el actual en el que existe una cantidad ingente de información, conectar a internautas con contenidos de su interés”, resume Fidel Cacheda, experto en predicción de clickthrough –es decir, estudio de la conexión existente entre emociones y comportamiento de los usuarios de la red- de la Universidad de La Coruña.

Sin embargo, su uso en la actualidad no siempre cae en las manos adecuadas, y es entonces cuando se producen toda una serie de ciberdelitos que son muy complicados de detectar y, sobre todo, de frenar a tiempo. Precisamente Cacheda trabaja en el campo de la recuperación aplicado a la detección temprana de ciberataques: “Tratamos de predecir estos fenómenos y detectar una serie de síntomas previos ya que, normalmente, cuando nos damos cuenta ya es demasiado tarde”.

En su opinión, la legislación siempre va un paso por detrás de estos fenómenos, debido a que los delitos informáticos avanzan a pasos agigantados, “como ocurre con la evolución tecnológica”, indica. Sin embargo, durante el congreso también se ha intentado poner en valor el papel de los investigadores que trabajan en el sector de la recuperación de datos. “A veces parece que solo nos quedamos con lo malo”, asegura Miguel Martínez, experto en análisis de noticias a nivel mundial en Signa. Sin embargo, lo que muchos no saben es que gracias a esta ciencia existen los subtítulos en muchos canales de televisión o los filtros que evitan que nos lleguen cientos de correos catalogados de SPAM.

“Gracias a esta ciencia existe un filtro que nos permite llegar a contenidos que realmente pueden ser útiles para nosotros”, reivindica Martínez. La realidad es que en estos momentos, casi todas las páginas con buscadores están relacionadas: “A día de hoy las grandes compañías continúan trabajado en la privacidad de los internautas en pro de la objetividad y de los contenidos diversos, aunque creo que los gobiernos deberían de pronunciarse a este respecto”.

En su empresa, Signal, analizan diariamente más de tres millones de noticias de distintos medios de comunicación del mundo, lo que les permite discernir, entre otras cuestiones, de qué se está hablando en el mundo, cuál es la evolución de la actualidad y cómo puede cambiar de la noche a la mañana la reputación on line de una marca. “Un ejemplo muy claro fue el de Uber, que pasó de ser considera una empresa puntera y pionera en la aplicación tecnológica a relacionarse con el intrusismo y el trabajo pirata a nivel mundial”, añade.

El vandalismo web

Otro de los grandes temas que se ha abordado durante esta conferencia ha sido el del vandalismo en las webs colaborativas como la conocida Wikipedia, y el riesgo de los datos sesgados o erróneos en estas plataformas de acceso libre a miles de autores. “Hoy en día no se puede publicar cualquier cosa en esta plataforma sino que existe un sistema de inspectores que revisa de forma altruista estos contenidos, y sobre todo una serie de filtros de tipo comercial”, explica Javier Nogueras. Investigador I3A y miembro de la organización del evento.

En su opinión, es importante tener en cuenta el tremendo alcance de internet y de las redes sociales, ya que cualquier cosa publicada puede llegar a millones de personas en cuestión de segundos. “La ciencia de la Recuperación de la información nace en los años 70 y ha ido evolucionando hasta nuestros días, pero no es algo nuevo, siempre ha estado ahí”, asegura. En su caso, su labor como investigador se centra en el estudio de los recursos culturales de varias bibliotecas: “Analizamos la calidad de los vocabularios aplicados y la utilización de palabras clave para tratar que sea lo más universal posible. Nuestro objetivo es que la información llegue bien”.

Comentarios
Debes estar registrado para poder visualizar los comentarios Regístrate gratis Iniciar sesión