<?xml version="1.0" encoding="UTF-8"?>
<mets:METS xmlns:mets="http://www.loc.gov/METS/" xmlns:xlink="http://www.w3.org/TR/xlink/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dim="http://www.dspace.org/xmlns/dspace/dim" OBJEDIT="/xmlui/admin/item?itemID=110866" OBJID="/xmlui/handle/11531/109207" PROFILE="DSPACE METS SIP Profile 1.0" LABEL="DSpace Item" ID="hdl:11531/109207">
<mets:dmdSec GROUPID="group_dmd_0" ID="dmd_1">
<mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="DIM">
<mets:xmlData>
<dim:dim dspaceType="ITEM">
<dim:field authority="e22ad760-2afe-40cb-98bd-6ca47063fad6" element="contributor" qualifier="advisor" confidence="UNCERTAIN" language="es-ES" mdschema="dc">de Lucas David, Alfonso</dim:field>
<dim:field authority="33b7ac3d-1ea3-4ea8-9d06-be66526d05e2" element="contributor" qualifier="author" confidence="UNCERTAIN" language="es-ES" mdschema="dc">González Lavín, Miguel</dim:field>
<dim:field element="contributor" qualifier="other" language="es_ES" mdschema="dc">Universidad Pontificia Comillas, Escuela Técnica Superior de Ingeniería (ICAI)</dim:field>
<dim:field element="date" qualifier="accessioned" mdschema="dc">2026-03-17T11:34:38Z</dim:field>
<dim:field element="date" qualifier="available" mdschema="dc">2026-03-17T11:34:38Z</dim:field>
<dim:field element="date" qualifier="issued" language="es_ES" mdschema="dc">2026</dim:field>
<dim:field element="identifier" qualifier="uri" mdschema="dc">http://hdl.handle.net/11531/109207</dim:field>
<dim:field element="description" language="es_ES" mdschema="dc">Máster Universitario en Ingeniería de Telecomunicación + Máster Universitario en Big Data</dim:field>
<dim:field element="description" qualifier="abstract" language="es-ES" mdschema="dc">Este Trabajo de Fin de Máster desarrolla un sistema de predicción de curvas S de producción para proyectos de construcción residencial, en colaboración con Arpada S.A. Las curvas S representan el avance acumulado del gasto o producción a lo largo del tiempo y son una herramienta fundamental en la gestión y control de proyectos. El reto principal consiste en predecir, desde etapas tempranas del proyecto, la forma que tomará dicha curva para cada código de compra.
El sistema ingiere datos históricos de proyectos reales desde una base de datos SQL Server y construye un pipeline de machine learning que incluye ingeniería de características condicionada al horizonte de observación. Se diseñan y evalúan seis modelos bajo una validación cruzada leave-one-out (LOO): desde una media ponderada como línea base (M1) hasta modelos paramétricos logísticos (M6), pasando por LightGBM (M3) y Random Forest (M4). Estos dos últimos obtienen los mejores resultados, con un error RMSE de aproximadamente 3,5 puntos porcentuales, frente a los 15,26 pp del modelo base, lo que supone una reducción del error de en torno al 77%.
El sistema se implementa en una aplicación interactiva desarrollada con Streamlit, estructurada en cuatro pestañas: Dashboard general, Curvas por código, Predicción y Cronograma. La aplicación se conecta en tiempo real a la base de datos mediante JDBC y aplica la identidad corporativa de Arpada. Entre los aspectos técnicos destacados figuran la restricción de forma de las curvas (garantizando la monotonicidad no decreciente desde cero) y la optimización del rendimiento mediante caché.
Los resultados demuestran la viabilidad de aplicar técnicas de machine learning a la planificación de proyectos de construcción, proporcionando a los gestores una herramienta de apoyo a la toma de decisiones basada en datos históricos reales.</dim:field>
<dim:field element="description" qualifier="abstract" language="en-GB" mdschema="dc">This Master's Thesis develops a machine learning system to predict production S-curves for residential construction projects, carried out in collaboration with Arpada S.A. S-curves represent the cumulative progress of expenditure or production over time and are a key instrument in project planning and control. The central challenge is to forecast, from early project stages, the shape each S-curve will take for a given purchase code.
The system ingests historical data from real construction projects stored in a SQL Server database and builds a machine learning pipeline that incorporates horizon-conditioned feature engineering. Six models are designed and evaluated using leave-one-out (LOO) cross-validation across five observation horizons: from a weighted average baseline (M1) to parametric logistic models (M6), including LightGBM (M3) and Random Forest (M4). The latter two achieve the best performance, with an RMSE of approximately 3.5 percentage points compared to the 15.26 pp baseline — representing an error reduction of roughly 77%.
The system is deployed as an interactive application built with Streamlit, organised into four tabs: a general Dashboard, Curves by Code, Prediction, and Schedule. The application connects in real time to the database via JDBC and adopts Arpada's corporate visual identity. Key technical contributions include enforcing curve shape integrity (ensuring non-decreasing, zero-starting curves) and optimising load performance through resource caching.
The results demonstrate the feasibility of applying machine learning techniques to construction project planning, providing project managers with a data-driven decision-support tool grounded in real historical data.</dim:field>
<dim:field element="format" qualifier="mimetype" language="es_ES" mdschema="dc">application/pdf</dim:field>
<dim:field element="language" qualifier="iso" language="es_ES" mdschema="dc">es-ES</dim:field>
<dim:field element="rights" language="es_ES" mdschema="dc">Attribution-NonCommercial-NoDerivs 3.0 United States</dim:field>
<dim:field element="rights" qualifier="uri" language="es_ES" mdschema="dc">http://creativecommons.org/licenses/by-nc-nd/3.0/us/</dim:field>
<dim:field element="subject" qualifier="other" language="es_ES" mdschema="dc">H0Z</dim:field>
<dim:field element="title" language="es_ES" mdschema="dc">Desarrollo de un modelo predictivo de costes y optimización de la cadena de suministro en el sector de la construcción mediante técnicas de Big Data</dim:field>
<dim:field element="type" language="es_ES" mdschema="dc">info:eu-repo/semantics/masterThesis</dim:field>
<dim:field element="rights" qualifier="accessRights" language="es_ES" mdschema="dc">info:eu-repo/semantics/openAccess</dim:field>
<dim:field element="keywords" language="es-ES" mdschema="dc">Curva S, Predicción de series temporales, Big Data, Construcción</dim:field>
<dim:field element="keywords" language="en-GB" mdschema="dc">S- curve, Time series forecasting, Big Data, Construction</dim:field>
</dim:dim>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:fileSec>
<mets:fileGrp USE="CONTENT">
<mets:file CHECKSUMTYPE="MD5" GROUPID="group_file_862753" ID="file_862753" MIMETYPE="application/pdf" SIZE="5781308" CHECKSUM="4c89c0d654db815f81c30e9399a23c7b">
<mets:FLocat LOCTYPE="URL" xlink:title="TFM - Gonzalez Lavin, Miguel.pdf" xlink:label="Trabajo Fin de Máster" xlink:type="locator" xlink:href="/xmlui/bitstream/handle/11531/109207/TFM%20-%20Gonzalez%20Lavin%2c%20Miguel.pdf?sequence=1&amp;isAllowed=y"/>
</mets:file>
<mets:file CHECKSUMTYPE="MD5" GROUPID="group_file_862754" ID="file_862754" MIMETYPE="application/pdf" SIZE="409598" CHECKSUM="af31da7ba5ddc51d303abca3bab35d65">
<mets:FLocat LOCTYPE="URL" xlink:title="Anexo I.pdf" xlink:label="Autorización" xlink:type="locator" xlink:href="/xmlui/bitstream/handle/11531/109207/Anexo%20I.pdf?sequence=2&amp;isAllowed=y"/>
</mets:file>
</mets:fileGrp>
</mets:fileSec>
<mets:structMap LABEL="DSpace" TYPE="LOGICAL">
<mets:div DMDID="dmd_1" TYPE="DSpace Item">
<mets:div ID="div_2" TYPE="DSpace Content Bitstream">
<mets:fptr FILEID="file_862753"/>
</mets:div>
<mets:div ID="div_3" TYPE="DSpace Content Bitstream">
<mets:fptr FILEID="file_862754"/>
</mets:div>
</mets:div>
</mets:structMap>
</mets:METS>
