Big Data

Permanent URI for this collectionhttps://dspace.unia.es/handle/10334/8161

Browse

Recent Submissions

Now showing 1 - 7 of 7
  • Open AccessTrabajo académico
    Análisis de segmentación de clientes en ventas minoristas mediante aprendizaje automático
    (Universidad Internacional de Andalucía, 2023) Torroba Moreno, José; Torroba Moreno, José
    Trabajo Fin de Máster en Big Data (2022-23). Tutores: Dr. D. Diego Marín Santos ; Dr. D. Manuel Emilio Gegúndez Arias. In the retail sector, customer segmentation plays a pivotal role in understanding buying behavior and designing effective marketing strategies. This study addresses an analysis of consumer goods sales in a retail establishment using unsupervised machine learning techniques. With a dataset containing over 64.000 transactions from 22.000 customers over the course of a year, algorithms like K-Means, Hierarchical Clustering, and DBSCAN are applied to segment the store's audience based on recency, frequency, and investment. A valuable insight into purchase patterns and customer loyalty is provided, offering potential for enhancing business strategies in the retail sector.
  • Open AccessTrabajo académico
    Curvas de potencia eólica: modelado y evaluación del rendimiento predictivo
    (Universidad Internacional de Andalucía, 2023) Moreno Arispón, Javier; Moreno Arispón, Javier
    Trabajo Fin de Máster en Big Data (2022-23). Tutor: Dr. D. Antonio Jesús Sánchez Fuentes. En la industria de la energía eólica, la curva de potencia es un elemento esencial que vincula la velocidad del viento a la potencia activa de los aerogeneradores. Esta relación es fundamental en diversas aplicaciones cruciales, como la selección de aerogeneradores, la estimación del factor de capacidad, el pronóstico de la energía eólica y el seguimiento del rendimiento de los parques eólicos. Para lograr una implementación efectiva de estas aplicaciones, es esencial contar con un modelo de curva de potencia preciso que se ajuste a las condiciones específicas de cada parque eólico En este proyecto, se propone el desarrollo de un algoritmo que aborde varios aspectos críticos en el procesamiento y modelado de datos relacionados con la energía eólica. Este algoritmo llevará a cabo un análisis exhaustivo de los datos, seleccionará los inputs óptimos, detectará valores atípicos, los procesará y aplicará técnicas de filtrado. A continuación, utilizará diversas técnicas de aprendizaje automático para modelar la curva de potencia. Además, categorizará las predicciones resultantes en tres niveles de rendimiento: alto, medio y bajo. Esto permitirá a los usuarios anticiparse a posibles problemas y aprovechar oportunidades de mejora en la operación de los aerogeneradores. La experimentación se ha llevado a cabo con un conjunto de datos anónimos, proporcionados de manera confidencial por un propietario de sistemas SCADA. Este conjunto de datos comprende 29 variables diferentes recopiladas a lo largo de 9 meses. Los datos corresponden a aerogeneradores del modelo AE-52 de 850 kW de potencia, fabricados por la empresa MADE. Los resultados obtenidos en este proyecto indican que el modelado de la curva de potencia desarrollado podría resultar altamente beneficioso para los usuarios cuando se implemente en entornos de producción. El algoritmo proporciona una aproximación precisa de la curva de potencia, y las predicciones alcanzan niveles de acierto superiores al 95% en la categoría de "Alto Rendimiento". Esto demuestra su utilidad en la monitorización y gestión eficiente de parques eólicos.
  • Open AccessTrabajo académico
    Desarrollo de un modelo de sistema de recomendación de ventas para la toma de decisiones en empresas - Aplicación de un caso real
    (Universidad Internacional de Andalucía, 2023) Marín García, Ana Isabel; Marín García, Ana Isabel
    Trabajo Fin de Máster en Big Data (2022-23). Tutor: Dr. D. Gonzalo Antonio Aranda Corral. Los sistemas de recomendación se utilizan con cada vez más frecuencia en las empresas para proporcionar sugerencias personalizadas y automáticas a sus clientes sobre nuevos productos y servicios a contratar. Son herramientas que utiliza algoritmos de aprendizaje automático para sugerir productos, servicios o contenido que puedan ser de interés para un usuario en particular. En este proyecto se desarrolla un sistema de recomendación de tipo colaborativo a partir del análisis formal de conceptos (FCA). Se trata de una técnica de minería de datos que se utiliza para extraer información y conocimiento de conjuntos de datos. FCA es especialmente útil para analizar conjuntos de datos relacionales, en los que cada registro tiene un conjunto de atributos y valores asociados. Además, permite la identificación de patrones y la agrupación de datos en conceptos formales, lo que facilita la interpretación y el análisis de los datos. El objetivo de nuestro sistema de recomendación es mejorar la experiencia del usuario al personalizar las sugerencias que recibe, y poder incorporarlas en los sistemas informáticos de las tiendas de la empresa. Se utilizan datos reales de una empresa de muebles que cuenta con nueve sedes a lo largo de Andalucía, con una facturación anual alrededor de 600 mil € anuales (2020) y que se encuentra en proceso de crecimiento. En resumen, este proyecto tiene como objetivo desarrollar un sistema de recomendación eficiente y personalizado utilizando técnicas de minería de datos y aprendizaje automático, con el fin de poder incorporar estas recomendaciones de productos a comprar por nuestros clientes en los sistemas informáticos de las tiendas de la empresa. Los resultados del SR concluyen que se ha logrado proporcionar una recomendación de ventas adecuada y personalizada para nuestros clientes basándonos en los datos históricos de clientes similares.
  • Open AccessTrabajo académico
    Clasificación de muestras de agua para determinar su potabilidad mediante el uso de algoritmos de aprendizaje automático
    (Universidad Internacional de Andalucía, 2023) González Andújar, Daniel; González Andújar, Daniel
    Trabajo Fin de Máster en Big Data (2022-23). Tutores: Dr. D. Diego Marín Santos ; Dr. D. Manuel Emilio Gegúndez Arias. The main porpuse of this work is to analyze the results obtained in the classification of different water samples through the use of algorithms and machine learning methods. Access to safe drinking water services is still a problem for approximately 2,000 million people around the world, which makes it even more necessary to study and predict the potability of water samples, this analysis is a tool for the prevention of disease and even death. A dataset with water samples has been extracted from the Kaggle website, specifically, the database is made up of a total of 3,276 instances of water samples, where 59.67% correspond to non-potable water samples. Different supervised learning methods such as K-NN, Random Forest or SVM have been used to classify the water samples, and they have been evaluated with different methodologies. The results obtained with the different classifiers, depending on the methodology, vary significantly. The algorithm which we have obtained the best results has been SVM, which is capable of working with an AUC of 0.75, Hit Rate of 0.72, Sensitivity of 0.71 and Specificity of 0.73. Although these results are susceptible of improvement, they indicate that the application of algorithms based on machine learning can constitute an important tool to predict non-potable water samples.
  • Open AccessTrabajo académico
    Diseño e implementación de un cuadro de mandos en CRM Analytics
    (Universidad Internacional de Andalucía, 2023) Martín Chamorro, Alejandro; Martín Chamorro, Alejandro
    Trabajo Fin de Máster en Big Data (2022-23). Tutor: Dr. D. Jesús Medina Moreno. This project describes how to create a reporting model with CRM Analytics, for a company that has Salesforce implemented as a CRM. The main objective is to collect all the information generated by the company and store it in different datasets. All this to visually represent all the data so that the company is able to make objective decisions much more quickly and be able to relate data from different sources to extract valuable insights. It will be carried out as a practical case of a dashboard in CRM Analytics for a utilities company.
  • Open AccessTrabajo académico
    Análisis de redes neuronales convolucionales para Eye-Tracking
    (Universidad Internacional de Andalucía, 2023) Miranda Torres, Antonio Jesús; Miranda Torres, Antonio Jesús
    Trabajo Fin de Máster en Big Data. Tutores: D. Diego Marín Santos; D. Manuel E. Gegúndez Arias. El Eye-tracking o detección de la mirada ha sido históricamente un problema ampliamente analizado por métodos de Inteligencia Artificial debido a sus numerosas integraciones posibles en los sistemas cotidianos. Sin embargo, las tecnologías que han mostrado resultados suficientemente buenos para ser aplicadas en el mundo real son costosas y requieren de equipamiento adicional. En este trabajo se analizan los resultados sobre dos arquitecturas entrenadas del estado del arte de Deep Learning como son VGG-16 y ResNet-50, comparando sus resultados con respecto a una nueva arquitectura propuesta más sencilla, que obtiene resultados tan buenos como la mejor de las anteriores, consiguiendo una precisión del 99,86% sobre un dataset formado por 14.400 imágenes pertenecientes a cuatro categorías (ojo cerrado, mirando hacia adelante, mirando hacia la izquierda y mirando hacia la derecha), que se ha dividido en 80 %, 10% y 10% para entrenamiento, validación y prueba. En base a los resultados obtenidos en la experimentación, se propone la extensión del problema a cualquier entorno de imágenes similares, con el fin de generar una tecnología que sea capaz de clasificar imágenes en tiempo real. No obstante, los resultados alcanzados para este segundo objetivo no son tan prometedores, y son indicadores de que sería necesario entrenar los modelos sobre un conjunto de imágenes tomadas por un dispositivo de las mismas características que la salida final para lograr resultados óptimos en una aplicación como la propuesta.
  • Open AccessTrabajo académico
    Predicción de pérdida de potencia en paneles fotovoltaicos mediante el análisis de imágenes
    (Universidad Internacional de Andalucía, 2023) Rodríguez Álvarez, José Alberto; Rodríguez Álvarez, José Alberto
    Trabajo Fin de Máster en Big Data. Tutores: D.Diego Marín Santos; D. Manuel E. Gegúndez Arias. La inspección de paneles fotovoltaicos en busca de desperfectos que comprometan el rendimiento de los mismos es una tarea que, generalmente, se realiza de manera visual por los operarios encargados del mantenimiento de las instalaciones. Esta técnica supone una gran carga de trabajo en instalaciones grandes y requiere de una especialización para detectar correctamente los problemas. El objetivo de este proyecto es el análisis de imágenes de paneles fotovoltaicos mediante un sistema basado en técnicas de Big Data y Deep Learning para predecir las posibles pérdidas energéticas ocasionadas por la acumulación de suciedad en la superficie del panel analizado. Para abordar el proyecto, se ha diseñado una red neuronal convolucional que nos permita resolver el problema de regresión planteado. Además, como comparación, vamos a usar la red VGG16 para adaptarla a nuestro problema. La experimentación se ha llevado a cabo en un conjunto de 45754 imágenes de paneles fotovoltaicos en la que, cada imagen, tiene la información de la pérdida de potencia debido a la acumulación de suciedad. El entrenamiento, validación y evaluación de la red se realizó sobre el 80%, 10% y 10% del total de imágenes, respectivamente. El error absoluto medio obtenido en la red neuronal convolucional diseñada ha sido 3.729, mientras que el error absoluto medio obtenido en la red VGG16 ha sido 3.754, resultados bastante similares entre ambos modelos. Por lo tanto, teniendo en cuenta los resultados obtenidos, se podría afirmar que tanto la red CNN propuesta como la red VGG16 podrían utilizarse en la tarea del análisis de paneles fotovoltaicos para detectar aquellos paneles en los que la acumulación de suciedad pueda provocar una pérdida en el rendimiento.