dc.contributor.author | Alonso Graverán, Gretel | |
dc.date.accessioned | 2024-04-10T07:07:33Z | |
dc.date.available | 2024-04-10T07:07:33Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/10334/8678 | |
dc.description | VI, 81 páginas. | es |
dc.description.abstract | Trabajo de Máster Universitario en Economía, Finanzas y Computación (2022-23). Tutor: Dr. D. Antonio J. Tallón Ballesteros. Con el aumento significativo del uso de Internet y los servicios en línea en los últimos
tiempos, principalmente por parte de gobiernos e instituciones financieras, el riesgo de ataques de
phishing ha ido en constante aumento, por lo que la protección contra las amenazas a la seguridad
en línea se vuelve de vital importancia. En este contexto, este trabajo se enfoca en la detección de
phishing para prevenir la filtración de información privada y las pérdidas económicas, mediante
la implementación de múltiples técnicas de aprendizaje automático supervisado. Este estudio se
sustenta en la metodología del KDD para la búsqueda del modelo de aprendizaje más efectivo
para discriminar entre URLs legítimas y fraudulentas, que incluye la preparación de datos, el
manejo del desbalance de datos, la optimización de modelos y la ingeniería de características,
y además, se complementa con un análisis exploratorio de los datos. Finalmente, se obtiene
que el algoritmo Extra Trees (19 atributos + hiperparámetros por defecto), con una exactitud
del 97,15 %, un AUC-ROC de 97,0 %, Sensibilidad del 95,48 % y Valor Predictivo Negativo de
96,38 % constituye el modelo optimo, pues garantiza una discriminación adecuada entre clases y
ofrece un mejor equilibrio entre eficiencia y precisión. | es |
dc.description.abstract | With the significant increase in the use of the Internet and online services in recent times,
mainly by governments and financial institutions, the risk of phishing attacks has been constantly
increasing. Consequently, protection against security threats online becomes very important. In
this context, this work focuses on the detection of phishing to prevent the leakage of private
information and economic losses, through the implementation of multiple supervised machine
learning techniques. This study is based on the KDD methodology for the search for the most
effective learning model to discriminate between legitimate and fraudulent URLs, which includes
data preparation, data imbalance management, model optimization and feature engineering. and
furthermore, it is complemented with an exploratory analysis of the data. Finally, it is obtained
that the Extra Trees algorithm (19 attributes + hyperparameters by default), with an accuracy of
97,15 %, an AUC-ROC of 97,0 %, Sensitivity of 95,48 % and Negative Predictive Value of 96,38 %
constitutes the optimal model, as it guarantees adequate discrimination between classes and offers
a better balance between efficiency and precision. | en |
dc.language.iso | spa | es |
dc.publisher | Universidad Internacional de Andalucía | es |
dc.relation.ispartofseries | Máster Oficial en Economía, Finanzas y Computación | es |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Phishing | es |
dc.subject | URL | es |
dc.subject | Aprendizaje automático supervisado | es |
dc.subject | Algoritmos de clasificación | es |
dc.subject | Árbol de decisión | es |
dc.title | Técnicas de aprendizaje automático para la detección de phishing de URL | es |
dc.type | masterThesis | es |
dc.rights.accessRights | openAccess | es |