Skip to contents

Funciones a comparar:

En este artículo se compara le rendimiento de las funciones nuevas en relación a al funciones anteriores en la realización de una misma tarea:

El input para la prueba de rendimiento son 100 notas de la Revista Puerto.

Comparativa entre acep_cleaning() vs acep_clean()

FUN.v1 <- system.time({ acep_clean(df$nota) })

FUN.v2 <- system.time({ acep_cleaning(df$nota) })

cat("La nueva versión (acep_cleaning) procesa los datos ingresados en", FUN.v2[3], "segundos.", 
    "\nLa vieja versión (acep_clean) procesa los datos ingresados en", FUN.v1[3], "segundos.", 
    "\nLa diferencia es de", FUN.v1[3]-FUN.v2[3])
#> La nueva versión (acep_cleaning) procesa los datos ingresados en 1.474 segundos. 
#> La vieja versión (acep_clean) procesa los datos ingresados en 4.554 segundos. 
#> La diferencia es de 3.08

Comparativa entre acep_count() vs acep_men()

FUN.v1 <- system.time({ acep_men(df$nota, dicc, tolower = FALSE) })

FUN.v2 <- system.time({ acep_count(df$nota, dicc) })

cat("La nueva versión (acep_count) procesa los datos ingresados en", FUN.v2[3], "segundos.", 
    "\nLa vieja versión (acep_men) procesa los datos ingresados en", FUN.v1[3], "segundos.", 
    "\nLa diferencia es de", FUN.v1[3]-FUN.v2[3])
#> La nueva versión (acep_count) procesa los datos ingresados en 0.14 segundos. 
#> La vieja versión (acep_men) procesa los datos ingresados en 0.21 segundos. 
#> La diferencia es de 0.07

Resultados

Las mejoras en el rendimiento son significativas, en especial entre las dos versiones de la función de limpieza y normalización de texto.