Mejora de la predicción en tareas de aprendizaje automático supervisado : imputación de valores perdidos
Autoría
Fecha
Palabra(s) clave
Editorial
Resumen
Trabajo de Máster en Economía, Finanzas y Computación. Tutor: Dr. D. Antonio J. Tallón Ballesteros. En el presente trabajo, se analiza y estudia la problemática recurrente que suelen presentar las bases de datos: los missing data o valores perdidos. Se evalúan seis métodos de imputación tras su aplicación a conjuntos datos de regresión en presencia de valores ausentes. Además, se determinan los porcentajes de mejora en la predicción según RMSE (raíz del error cuadrático medio) y R2 para tres algoritmos diferentes en ocho bases de datos, siendo el objetivo central del mismo determinar si existe un método de imputación con mejor rendimiento para todos los casos donde existan valores perdidos, o por el contrario, resulta conveniente adoptar distintos procedimientos de imputación de acuerdo al método de regresión aplicado y a la base de datos analizada.
Trabajo de Máster en Economía, Finanzas y Computación. Tutor: Dr. D. Antonio J. Tallón Ballesteros. En el presente trabajo, se analiza y estudia la problemática recurrente que suelen presentar las bases de datos: los missing data o valores perdidos. Se evalúan seis métodos de imputación tras su aplicación a conjuntos datos de regresión en presencia de valores ausentes. Además, se determinan los porcentajes de mejora en la predicción según RMSE (raíz del error cuadrático medio) y R2 para tres algoritmos diferentes en ocho bases de datos, siendo el objetivo central del mismo determinar si existe un método de imputación con mejor rendimiento para todos los casos donde existan valores perdidos, o por el contrario, resulta conveniente adoptar distintos procedimientos de imputación de acuerdo al método de regresión aplicado y a la base de datos analizada.