Big Data

Permanent URI for this collectionhttps://hdl.handle.net/10334/8161

Browse

Now showing 1 - 4 of 4

Master Thesis
Análisis de segmentación de clientes en ventas minoristas mediante aprendizaje automático
(Universidad Internacional de Andalucía, 2023) Torroba Moreno, José; Torroba Moreno, José
Trabajo Fin de Máster en Big Data (2022-23). Tutores: Dr. D. Diego Marín Santos ; Dr. D. Manuel Emilio Gegúndez Arias. In the retail sector, customer segmentation plays a pivotal role in understanding buying behavior and designing effective marketing strategies. This study addresses an analysis of consumer goods sales in a retail establishment using unsupervised machine learning techniques. With a dataset containing over 64.000 transactions from 22.000 customers over the course of a year, algorithms like K-Means, Hierarchical Clustering, and DBSCAN are applied to segment the store's audience based on recency, frequency, and investment. A valuable insight into purchase patterns and customer loyalty is provided, offering potential for enhancing business strategies in the retail sector.
Master Thesis
Clasificación de muestras de agua para determinar su potabilidad mediante el uso de algoritmos de aprendizaje automático
(Universidad Internacional de Andalucía, 2023) González Andújar, Daniel; González Andújar, Daniel
Trabajo Fin de Máster en Big Data (2022-23). Tutores: Dr. D. Diego Marín Santos ; Dr. D. Manuel Emilio Gegúndez Arias. The main porpuse of this work is to analyze the results obtained in the classification of different water samples through the use of algorithms and machine learning methods. Access to safe drinking water services is still a problem for approximately 2,000 million people around the world, which makes it even more necessary to study and predict the potability of water samples, this analysis is a tool for the prevention of disease and even death. A dataset with water samples has been extracted from the Kaggle website, specifically, the database is made up of a total of 3,276 instances of water samples, where 59.67% correspond to non-potable water samples. Different supervised learning methods such as K-NN, Random Forest or SVM have been used to classify the water samples, and they have been evaluated with different methodologies. The results obtained with the different classifiers, depending on the methodology, vary significantly. The algorithm which we have obtained the best results has been SVM, which is capable of working with an AUC of 0.75, Hit Rate of 0.72, Sensitivity of 0.71 and Specificity of 0.73. Although these results are susceptible of improvement, they indicate that the application of algorithms based on machine learning can constitute an important tool to predict non-potable water samples.
Master Thesis
Curvas de potencia eólica: modelado y evaluación del rendimiento predictivo
(Universidad Internacional de Andalucía, 2023) Moreno Arispón, Javier; Moreno Arispón, Javier
Trabajo Fin de Máster en Big Data (2022-23). Tutor: Dr. D. Antonio Jesús Sánchez Fuentes. En la industria de la energía eólica, la curva de potencia es un elemento esencial que vincula la velocidad del viento a la potencia activa de los aerogeneradores. Esta relación es fundamental en diversas aplicaciones cruciales, como la selección de aerogeneradores, la estimación del factor de capacidad, el pronóstico de la energía eólica y el seguimiento del rendimiento de los parques eólicos. Para lograr una implementación efectiva de estas aplicaciones, es esencial contar con un modelo de curva de potencia preciso que se ajuste a las condiciones específicas de cada parque eólico En este proyecto, se propone el desarrollo de un algoritmo que aborde varios aspectos críticos en el procesamiento y modelado de datos relacionados con la energía eólica. Este algoritmo llevará a cabo un análisis exhaustivo de los datos, seleccionará los inputs óptimos, detectará valores atípicos, los procesará y aplicará técnicas de filtrado. A continuación, utilizará diversas técnicas de aprendizaje automático para modelar la curva de potencia. Además, categorizará las predicciones resultantes en tres niveles de rendimiento: alto, medio y bajo. Esto permitirá a los usuarios anticiparse a posibles problemas y aprovechar oportunidades de mejora en la operación de los aerogeneradores. La experimentación se ha llevado a cabo con un conjunto de datos anónimos, proporcionados de manera confidencial por un propietario de sistemas SCADA. Este conjunto de datos comprende 29 variables diferentes recopiladas a lo largo de 9 meses. Los datos corresponden a aerogeneradores del modelo AE-52 de 850 kW de potencia, fabricados por la empresa MADE. Los resultados obtenidos en este proyecto indican que el modelado de la curva de potencia desarrollado podría resultar altamente beneficioso para los usuarios cuando se implemente en entornos de producción. El algoritmo proporciona una aproximación precisa de la curva de potencia, y las predicciones alcanzan niveles de acierto superiores al 95% en la categoría de "Alto Rendimiento". Esto demuestra su utilidad en la monitorización y gestión eficiente de parques eólicos.
Master Thesis
Desarrollo de un modelo de sistema de recomendación de ventas para la toma de decisiones en empresas - Aplicación de un caso real
(Universidad Internacional de Andalucía, 2023) Marín García, Ana Isabel; Marín García, Ana Isabel
Trabajo Fin de Máster en Big Data (2022-23). Tutor: Dr. D. Gonzalo Antonio Aranda Corral. Los sistemas de recomendación se utilizan con cada vez más frecuencia en las empresas para proporcionar sugerencias personalizadas y automáticas a sus clientes sobre nuevos productos y servicios a contratar. Son herramientas que utiliza algoritmos de aprendizaje automático para sugerir productos, servicios o contenido que puedan ser de interés para un usuario en particular. En este proyecto se desarrolla un sistema de recomendación de tipo colaborativo a partir del análisis formal de conceptos (FCA). Se trata de una técnica de minería de datos que se utiliza para extraer información y conocimiento de conjuntos de datos. FCA es especialmente útil para analizar conjuntos de datos relacionales, en los que cada registro tiene un conjunto de atributos y valores asociados. Además, permite la identificación de patrones y la agrupación de datos en conceptos formales, lo que facilita la interpretación y el análisis de los datos. El objetivo de nuestro sistema de recomendación es mejorar la experiencia del usuario al personalizar las sugerencias que recibe, y poder incorporarlas en los sistemas informáticos de las tiendas de la empresa. Se utilizan datos reales de una empresa de muebles que cuenta con nueve sedes a lo largo de Andalucía, con una facturación anual alrededor de 600 mil € anuales (2020) y que se encuentra en proceso de crecimiento. En resumen, este proyecto tiene como objetivo desarrollar un sistema de recomendación eficiente y personalizado utilizando técnicas de minería de datos y aprendizaje automático, con el fin de poder incorporar estas recomendaciones de productos a comprar por nuestros clientes en los sistemas informáticos de las tiendas de la empresa. Los resultados del SR concluyen que se ha logrado proporcionar una recomendación de ventas adecuada y personalizada para nuestros clientes basándonos en los datos históricos de clientes similares.

Browse

Browsing Big Data by Subject "Aprendizaje automático"