Aprendizaje Automático Responsable e Interpretable para la Gobernanza Sociotécnica en Sistemas de Información: de la Madurez Digital Juvenil a la Democratización de los Datos

dc.contributor.advisorValogianni, Konstantina
dc.contributor.authorSiddiqui, Aqib
dc.contributor.rorhttps://ror.org/02jjdwm75
dc.date.accessioned2026-05-29T12:27:40Z
dc.date.defense2026-05-07
dc.date.issued2026
dc.description.abstractAs machine learning becomes embedded in organizational and societal systems, information systems research faces a dual challenge: leveraging ML’s analytical power while ensuring that resulting models remain interpretable, feasible, and aligned with human values. This dissertation addresses that challenge through three studies that develop and apply interpretable, cost-aware, and value-sensitive ML approaches to two domains exemplifying contemporary socio-technical complexity: adolescents’ digital maturity and European data governance. The first study proposes an operational assessment system for children’s digital maturity that is accurate, interpretable, and feasible for routine use in schools and related settings. Using a cluster-then-predict workflow on multi-country survey data, it discovers distinct maturity profiles and trains supervised models to classify individuals into profiles. To reduce measurement burden without sacrificing decision quality, it introduces a reinforcement learning agent that learns to replicate full-information classifications using only a small subset of the most informative inputs, enabling brief, scalable screening. Model interpretability is integrated through feature attribution methods that identify the competencies most strongly driving predictions, supporting targeted interventions and resource allocation. The second study examines digital maturity as a developmental process rather than a stable individual trait. It combines explainable machine learning with confirmatory statistical testing to identify which dimensions of digital maturity are most strongly associated with developmental stage, how these relationships change across adolescence, and whether patterns differ by gender. The analysis reveals both foundational capabilities and phasespecific constraints, and documents meaningful within-age heterogeneity, highlighting limits of one-size-fits-all age-based approaches to youth digital governance. The third study shifts from individual assessment to institutional design, analyzing how values and stakeholder priorities shape large-scale data governance. Using transformerbased natural language processing within a value-sensitive design framework, it maps value emphases across stakeholder consultation letters and the EU Data Act, identifies convergences and tensions, and derives meta-requirements that operationalize data democratization through implementable policy mechanisms. Methodologically, the dissertation demonstrates how ML-enabled pattern discovery can be combined with confirmatory statistical testing to produce theory-relevant claims without sacrificing inferential rigor. Theoretically, it advances IS research by reframing ML as sociotechnical decision infrastructure and by showing how interpretability, information costs, and value alignment can be treated as central design requirements rather than post-hoc considerations. It contributes to IS literature on digital capabilities by conceptualizing youth digital maturity as both profile-based and developmentally dynamic, and it extends IS perspectives on data governance by linking stakeholder value tensions to concrete regulatory mechanisms that enable or constrain data democratization. Practically, the dissertation offers deployable implications: a scalable, low-burden approach for digital maturity screening and intervention targeting in educational and youth-facing contexts, and an evidence-based set of policy metarequirements that can guide regulators, firms, and civil society in implementing fair access to data while balancing competing values. Taken together, it contributes a coherent view of ML in information systems as models that are not only predictive tools, but socio-technical instruments that must remain interpretable, operationally feasible, and aligned with human and institutional priorities.
dc.description.abstractA medida que el aprendizaje automático se integra en sistemas organizativos y sociales, la investigación en sistemas de información se enfrenta a un doble desafío: aprovechar la potencia analítica del aprendizaje automático y, al mismo tiempo, garantizar que los modelos resultantes sean interpretables, viables en la práctica y coherentes con valores humanos. Esta tesis doctoral aborda ese desafío mediante tres estudios que desarrollan y aplican enfoques de aprendizaje automático interpretables, sensibles al coste y sensibles a los valores en dos dominios que ejemplifican la complejidad sociotécnica contemporánea: la madurez digital de los adolescentes y la gobernanza europea de los datos. El primer estudio propone un sistema operativo de evaluación de la madurez digital infantil que es preciso, interpretable y factible para su uso rutinario en centros educativos y contextos afines. A partir de un pipeline de agrupamiento y predicción (cluster-then-predict) sobre datos de encuestas multinacionales, identifica perfiles diferenciados de madurez y entrena modelos supervisados para clasificar a los individuos en dichos perfiles. Para reducir la carga de medición sin sacrificar la calidad de la decisión, introduce un agente de aprendizaje por refuerzo que aprende a reproducir clasificaciones con información completa utilizando solo un subconjunto reducido de las entradas más informativas, lo que permite un cribado breve y escalable. La interpretabilidad se integra mediante métodos de atribución de características que identifican las competencias que impulsan con mayor fuerza las predicciones, apoyando intervenciones focalizadas y una asignación de recursos más eficiente. El segundo estudio examina la madurez digital como un proceso de desarrollo, en lugar de un rasgo individual estable. Combina aprendizaje automático explicable con contrastes estadísticos confirmatorios para identificar qué dimensiones de la madurez digital se asocian con mayor intensidad a la etapa evolutiva, cómo cambian estas relaciones a lo largo de la adolescencia y si los patrones difieren por género. El análisis revela tanto capacidades fundacionales como restricciones específicas por fase, y documenta una heterogeneidad sustantiva dentro de cada grupo de edad, subrayando los límites de los enfoques uniformes basados exclusivamente en la edad para la gobernanza digital juvenil. El tercer estudio desplaza el foco desde la evaluación individual hacia el diseño institucional, analizando cómo los valores y las prioridades de los grupos de interés configuran la gobernanza de los datos a gran escala. Mediante procesamiento del lenguaje natural basado en transformadores, integrado en un marco de diseño sensible a los valores, cartografía los énfasis valorativos en cartas de consulta de actores relevantes y en la Ley de Datos de la Unión Europea, identifica convergencias y tensiones, y deriva meta-requisitos que operacionalizan la democratización de los datos mediante mecanismos de política implementables. Desde el punto de vista metodológico, la tesis demuestra cómo el descubrimiento de patrones habilitado por aprendizaje automático puede combinarse con pruebas estadísticas confirmatorias para producir afirmaciones relevantes para la teoría sin perder rigor inferencial. En términos teóricos, contribuye a la investigación en sistemas de información al replantear el aprendizaje automático como infraestructura sociotécnica de decisión y al mostrar que la interpretabilidad, los costes de información y la alineación con valores pueden tratarse como requisitos centrales de diseño, y no como consideraciones posteriores. Aporta a la literatura sobre capacidades digitales al conceptualizar la madurez digital juvenil como simultáneamente basada en perfiles y dinámicamente evolutiva, y amplía las perspectivas de sistemas de información sobre gobernanza de datos al vincular tensiones valorativas de los actores con mecanismos regulatorios concretos que habilitan o restringen la democratización de los datos. En el plano práctico, la tesis ofrece implicaciones desplegables: un enfoque escalable y de baja carga para el cribado de madurez digital y la focalización de intervenciones en contextos educativos y orientados a jóvenes, y un conjunto de meta-requisitos, sustentados empíricamente, que pueden guiar a reguladores, empresas y sociedad civil en la implementación de un acceso justo a los datos equilibrando valores en conflicto. En conjunto, la tesis propone una visión coherente del aprendizaje automático en sistemas de información como modelos que no son solo herramientas predictivas, sino instrumentos sociotécnicos que deben seguir siendo interpretables, viables en términos operativos y alineados con prioridades humanas e institucionales.
dc.description.peerreviewedYes
dc.description.responsabilityPouloudi, Athanasia (PRESIDENTE)
dc.description.responsabilityArenas, Álvaro (SECRETARIO)
dc.description.responsabilityPolyviou, Ariana (VOCAL)
dc.description.statusPublished
dc.formatapplication/pdf
dc.identifier.citationSiddiqui, A. (2026). Aprendizaje Automático Responsable e Interpretable para la Gobernanza Sociotécnica en Sistemas de Información: de la Madurez Digital Juvenil a la Democratización de los Datos = Responsible and Interpretable Machine Learning for Socio-Technical Governance in Information Systems: From Youth Digital Maturity to Data Democratization. (Tesis doctoral) IE University, Segovia. https://doi.org/10.63537/SA1191591
dc.identifier.doihttps://doi.org/10.63537/SA1191591
dc.identifier.urihttps://hdl.handle.net/20.500.14417/4381
dc.language.isospa
dc.language.isoeng
dc.page.total156
dc.publisherIE University
dc.relation.departmentInformation Systems & Technology
dc.relation.entityIE University
dc.relation.schoolIE Business School
dc.rightsAttribution-NonCommercial 4.0 International
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subject.keywordsDigital Maturity
dc.subject.keywordsExplainable AI
dc.subject.keywordsAdolescent Development
dc.subject.keywordsDigital Inequality
dc.subject.keywordsGender Differences
dc.subject.odsODS 9 - Industria, innovación e infraestructura
dc.subject.odsODS 10 - Reducción de las desigualdades
dc.subject.unesco12 Matemáticas::1203 Ciencia de los ordenadores
dc.titleAprendizaje Automático Responsable e Interpretable para la Gobernanza Sociotécnica en Sistemas de Información: de la Madurez Digital Juvenil a la Democratización de los Datos
dc.title.alternativeResponsible and Interpretable Machine Learning for Socio-Technical Governance in Information Systems: From Youth Digital Maturity to Data Democratization
dc.typeinfo:eu-repo/semantics/doctoralThesis
dc.version.typeinfo:eu-repo/semantics/publishedVersion
dspace.entity.typePublication

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
1191591_siddiqui_publicacion_tesis.pdf
Tamaño:
14.85 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.71 KB
Formato:
Item-specific license agreed to upon submission
Descripción:

Colecciones