Premio a la mejor tesis doctoral en el ámbito de SISTEDES, 2021

SISTEDES se complace en anunciar el ganador del Premio a la Mejor Tesis Doctoral en el ámbito de SISTEDES, 2021.

El premio ha recaído en el Dr. D. Sergi Nadal por la tesis Doctoral

Metadata-Driven Data Integration

dirigida por los profesores Alberto Abelló (UPC) , Oscar Romero (UPC) y Stijn Vansummeren (ULB).

Nos gustaría destacar la gran calidad de todas las tesis presentadas, lo que ha supuesto una dificultad añadida a la hora de seleccionarlas, según las condiciones y criterios previstos en la convocatoria.

El premio se entregará durante las Jornadas SISTEDES 2021 en Málaga, y está dotado con 800€ y diploma acreditativo, además de una bolsa de viaje de 300€ para cubrir los gastos de transporte y alojamiento.


Sergi Nadal es doctor en Informática por la Universidad Politécnica de Catalunya (UPC) y la Université Libre de Bruxelles (ULB). Màster en Information Technologies for Business Intelligence por la ULB, UFRT y ULB. Actualmente, es investigador posdoctoral del Departamento de Ingeniería de Servicios y Sistemas de Información de la UPC, así como profesor asociado en la Facultad de Informática de Barcelona. Su ámbito de investigación se sitúa en el área de gestión de datos e información, con el objetivo principal de proporcionando métodos y herramientas automáticos para democratizar el acceso a datos a los usuarios no nativos informáticos. Su investigación actual se centra en el ámbito del data discovery, una de las fases iniciales dentro del área de integración de datos el cual es especialmente relevante hoy en día dada la extendida presencia de ecosistemas de datos abiertos y a gran escala. Pueden encontrar más información aquí.


La tesis

Sergi defendió su tesis doctoral Metadata-Driven Data Integration en 2019, en el marco del programa europeo de doctorado Erasmus Mundus Joint Doctorate: Information Technologies for Business Intelligence Doctoral College entre la Universitat Politècnica de Catalunya (UPC) y la Université Libre de Bruxelles (ULB), obteniendo la calificación de Sobresaliente Cum Laude y la mención de Doctorado Internacional. La tesis fue codirigida por los profesores Alberto Abelló (UPC), Oscar Romero (UPC) y Stijn Vansummeren (ULB).

Resumen

Los datos tienen un impacto indudable en la sociedad. El almacenamiento y procesamiento de aquellos datos disponibles es actualmente uno de los factores clave para el éxito de una organización. No obstante, recientemente estamos viviendo un cambio representado por cantidades enormes y heterogéneas de datos. De hecho, el 90% de los datos del mundo se han generado en los dos últimos años. Por lo tanto, para llevar a cabo estas tareas de explotación de datos, las organizaciones primero deben realizar la integración de datos combinando datos de múltiples fuentes para producir una vista unificada sobre ellos. Sin embargo, la integración de volumenes masivos y heterogéneos de datos requiere revisar los métodos tradicionales de integración para hacer frente a los nuevos requisitos que plantean estos nuevos entornos.

Esta tesis doctoral tiene como objetivo proporcionar un marco novedoso para la integración de datos en el contexto de ecosistemas intensivos en datos. Esto implica tratar con un gran volumen de datos heterogéneos, de múltiples fuentes y en su formato original. Para ello, abogamos por un proceso de integración consistente en actividades secuenciales gobernadas por una capa semántica, implementadas a través de un repositorio compartido de metadatos. Desde una perspectiva de administración, estas actividades son el despliegue de una arquitectura de integración de datos, seguida de la población de tales metadatos compartidos. Desde la perspectiva del consumo de datos, las actividades son de integración de datos virtuales y materializados, la primera una tarea exploratoria y la segunda una tarea de consolidación. Siguiendo el marco propuesto, nos enfocamos en brindar contribuciones a cada una de las cuatro actividades. Comenzamos proponiendo una arquitectura de referencia de software para sistemas intensivos en datos gobernados por una capa semántica. Dicha arquitectura sirve como modelo para implementar un conjunto de sistemas, cuyo núcleo es el repositorio de metadatos. A continuación, proponemos un modelo de metadatos basado en grafos como formalismo para la gestión de metadatos. Nos enfocamos en apoyar la evolución de esquemas y fuentes de datos, un factor predominante en las fuentes heterogéneas disponibles. Para la integración virtual, proponemos algoritmos de reescritura de consultas que se basan en el modelo de metadatos propuesto anteriormente. Además, consideramos heterogeneidades semánticas en las fuentes de datos, que los algoritmos propuestos son capaces de resolver automáticamente. Finalmente, la tesis se centra en la actividad de integración materializada y, para ello, propone un método para seleccionar resultados intermedios para materializarlos en flujos intensivos en datos. En general, los resultados de esta tesis sirven como contribución al campo de la integración de datos en ecosistemas contemporáneos intensivos en datos.


La convocatoria

SISTEDES convocó en 2021 la séptima edición de premio a la mejor tesis doctoral realizada en torno a temas que correspondan al ámbito de la Sociedad. El texto completo de la convocatoria está disponible en https://www.sistedes.es/convocatoria-premio-sistedes-la-mejor-tesis-doctoral-2021.

El Comité Evaluador estuvo formado por los siguientes profesores:

  • Juan Hernández (Universidad de Extremadura), Vice-Presidente de SISTEDES
  • Silvia Abrahão (Universidad Politécnica de Valencia), Presidenta del Comité de Programa de JISBD 2021
  • Pablo Fernández (Universidad de Sevilla), Presidente del Comité de Programa de JCIS 2021
  • Narciso Martí (Universidad Complutense de Madrid), Presidente del Comité de Programa de PROLE 2021
  • María Alpuente (Universidad de Politécnica de Valencia), Coordinadora del premio y Secretaria del Comité (sin voto)

Los criterios utilizados para evaluar las solicitudes fueron los siguientes:

  1. Publicaciones: número de páginas del artículo, la calidad de la revista, número de firmantes y el orden de firma, número de citas
  2. Congresos: calidad del congreso, número de firmantes y orden de firma, número de citas
  3. Estancias: duración y prestigio del centro de destino.
  4. Transferencia: herramientas realizadas y patentes.
  5. Otros: participación en proyectos y premios.

Sobre Sistedes

La Sociedad de Ingeniería del Software y Tecnología de Desarrollo de Software (SISTEDES) es una asociación sin ánimo de lucro creada en 2005 con el principal objetivo de contribuir al desarrollo científico y tecnológico de nuestro país en el área de la Ingeniería del Software y las Tecnologías de Desarrollo de Software, así como de promover la investigación, la innovación y la transferencia de tecnología entre los distintos agentes involucrados en el avance de estas disciplinas.

Entre sus actividades, SISTEDES organiza, con carácter anual, las Jornadas Científicas SISTEDES, que engloban las conferencias nacionales sobre Ingeniería del Software y Bases de Datos (JISBD), Ciencia e Ingeniería de Servicios (JCIS) y Programación y Lenguajes (PROLE).

Con el ánimo de incentivar la investigación y la docencia en los temas dentro del ámbito de la Sociedad, SISTEDES organiza todos los años una serie de premios entre los que destaca el Premio a la Mejor Tesis Doctoral en el ámbito de SISTEDES, como reconocimiento a la labor investigadora; y el Premio al Mejor Trabajo presentado en JENUI dentro del ámbito de SISTEDES, para promover la calidad docente.

–>