Conflictividad laboral en la pesca
Agustín Nieto
2022-11-29
Source:vignettes/conflictividad_soip.Rmd
conflictividad_soip.Rmd
Introducción
En este artículo desarrollaremos una introducción al análisis de la conflictividad laboral en la industria pesquera argentina con un enfoque de diccionario en base a las funciones del paquete ACEP. En esta oportunidad pondremos el foco en la conflictividad laboral protagonizada por el Sindicato Obrero de la Industria del Pescado (SOIP) en la ciudad de Mar del Plata entre los años 2009 y 2020.
El corpus de notas
Las notas que componen el corpus utilizado en este ejercicio fueron
raspadas del sitio revistapuerto.com.ar con las
funciones del paquete rvest
. Se compone de 7816 notas y 6
variables: fecha, titulo, bajada, nota, imagen, link. El corpus de notas
cubre desde el 2 de marzo de 2009 hasta el 29 de diciembre de 2020. Para
cargar todas las notas haremos uso de la función
acep_load_base()
.
# Cargamos la librería ACEP
library(ACEP)
# Definimos la url
url <- acep_bases$rp_mdp
# Descargamos el corpus de notas de la Revista Puerto
rev_puerto <- acep_load_base(url)
#> Descargando...
# Imprimimos la base en consola
rev_puerto
#> # A tibble: 7,816 × 6
#> fecha titulo bajada nota imagen link
#> * <date> <chr> <chr> <chr> <chr> <chr>
#> 1 2020-12-29 ¡Feliz Año 2021 para todos nuestros ami… Con m… "Con… https… http…
#> 2 2020-12-28 Mapa del trabajo esclavo en aguas inter… Un re… "El … https… http…
#> 3 2020-12-24 Plantas piden tener garantizada la prov… En Ch… "El … https… http…
#> 4 2020-12-24 Los obreros navales despiden el año ana… En Ma… "El … https… http…
#> 5 2020-12-23 El incumplimiento del régimen de cuotif… Se ll… "Las… https… http…
#> 6 2020-12-23 Otro fallo ratifica cautelar contra el … La Cá… "La … https… http…
#> 7 2020-12-22 Recomendaciones de SENASA para las expo… Desde… "En … https… http…
#> 8 2020-12-22 Trelew consolida su inserción en la ind… En 20… "Ins… https… http…
#> 9 2020-12-21 El CFP presentó el estado y la captura … En la… "Ant… https… http…
#> 10 2020-12-21 La flota amarilla cierra el año con sos… Puert… "El … https… http…
#> # … with 7,806 more rows
Los diccionarios
Una vez descargada la base de notas vamos a crear variables numéricas
que contenga las frecuencias de palabras totales y de cada diccionario
usado para cada una de las notas. En esta parte del código haremos uso
de tres funciones y un diccionario del paquete ACEP:
acep_frec()
, acep_men()
,
acep_load_base()
y acep_diccionarios
. También
crearemos dos diccionarios breves para usarlos en la función
acep_men()
con un doble objetivo: 1) identificar las notas
que refieran a huelgas; 2) identificar las notas que refieran a lxs
trabajadorxs del procesamiento de pescado en tierra en la ciudad de Mar
del Plata.
# Creamos la variable con la frecuencia de palabras por nota
rev_puerto$frec_palabras <- acep_frec(rev_puerto$nota)
# Cargamos el diccionario de palabras que refieren a conflictividad
dicc_conflictos <- acep_load_base(acep_diccionarios$dicc_confl_sismos)
#> Descargando...
# Creamos la variable con la frecuencia de palabras que refieren a conflictividad
rev_puerto$frec_conflictos <- acep_men(rev_puerto$nota, dicc_conflictos)
# Creamos el diccionario de palabras que refieren a huelgas
dicc_huelgas <- c("en paro", "al paro", "huelga", "huelguistas", "paro y movil",
"paro de actividades", "conciliación obligatoria", "un paro",
"paro total", "paro parcial", "trabajo a reglamento",
"el paro", "de brazos caídos")
# Creamos la variable con la frecuencia de palabras que refieren a huelgas
rev_puerto$frec_huelgas <- acep_men(rev_puerto$nota, dicc_huelgas)
# Creamos el diccionario de palabras que refieren a lxs obrerxs del pescado
dicc_soip <- c("soip", "sindicato obrero de la industria del pescado",
"sindicato de la industria del pescado", "huelguistas",
"obreras de la industria del pescado", "obreras del pescado",
"obreros de la industria del pescado", "obreros del pescado",
"fileteros", "fileteras", "obreros del filet", "obreras del filet")
# Creamos la variable con la frecuencia de palabras que
# refieren a lxs obrerxs del pescado
rev_puerto$frec_soip <- acep_men(rev_puerto$nota, dicc_soip)
# Imprimimos la base en consola
rev_puerto
#> # A tibble: 7,816 × 10
#> fecha titulo bajada nota imagen link frec_…¹ frec_…² frec_…³ frec_…⁴
#> <date> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
#> 1 2020-12-29 ¡Feliz … Con m… "Con… https… http… 31 0 0 0
#> 2 2020-12-28 Mapa de… Un re… "El … https… http… 1128 4 0 0
#> 3 2020-12-24 Plantas… En Ch… "El … https… http… 530 3 0 0
#> 4 2020-12-24 Los obr… En Ma… "El … https… http… 483 8 0 0
#> 5 2020-12-23 El incu… Se ll… "Las… https… http… 525 4 2 0
#> 6 2020-12-23 Otro fa… La Cá… "La … https… http… 462 6 0 0
#> 7 2020-12-22 Recomen… Desde… "En … https… http… 650 0 0 0
#> 8 2020-12-22 Trelew … En 20… "Ins… https… http… 830 4 0 0
#> 9 2020-12-21 El CFP … En la… "Ant… https… http… 1434 3 0 0
#> 10 2020-12-21 La flot… Puert… "El … https… http… 1056 4 0 0
#> # … with 7,806 more rows, and abbreviated variable names ¹frec_palabras,
#> # ²frec_conflictos, ³frec_huelgas, ⁴frec_soip
Los índices
Ya construidas las variables de frecuencia de palabras y menciones
nos ocuparemos de elaborar nuevas variables con índices de intensidad en
base al ratio entre las frecuencias de palabras totales y las menciones
de los diccionarios sobre trabajadorxs del pescado, conflictos y
huelgas. Para la elaboración de estos índices haremos uso de la función
acep_int()
del paquete ACEP.
# Creamos la variable con el índice de conflictividad general
rev_puerto$i_conf_gral <- acep_int(rev_puerto$frec_conflictos,
rev_puerto$frec_palabras)
# Creamos la variable con el índice de incidencia
# de lxs trabajadorxs del pescado
rev_puerto$i_soip <- acep_int(rev_puerto$frec_soip,
rev_puerto$frec_palabras)
# Creamos la variable con el índice de huelgas
rev_puerto$i_huelgas <- acep_int(rev_puerto$frec_huelgas,
rev_puerto$frec_conflictos)
# Filtramos para quedarnos con los índices mayores a 0
# en la variable del índice de conflictividad general
rev_puerto <- rev_puerto[rev_puerto$i_conf_gral > 0, ]
# Filtramos para quedarnos con los índices mayores a 0
# en el índice de incidencia de lxs trabajadorxs del pescado
rev_puerto <- rev_puerto[rev_puerto$i_soip > 0, ]
# Imprimimos la base en consola
rev_puerto
#> # A tibble: 888 × 13
#> fecha titulo bajada nota imagen link frec_…¹ frec_…² frec_…³ frec_…⁴
#> <date> <chr> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
#> 1 2020-12-04 SOIP pi… "El g… "Lue… https… http… 500 4 0 2
#> 2 2020-11-27 Se acor… "Es u… "Tal… https… http… 517 2 0 1
#> 3 2020-11-24 Mardi, … "Con … "Tra… https… http… 1125 1 0 4
#> 4 2020-11-16 Cierran… "El v… "Des… https… http… 380 4 0 5
#> 5 2020-11-13 CaIPA-S… "Las … "Lo … https… http… 376 3 0 5
#> 6 2020-10-30 Conflic… "El S… "La … https… http… 680 3 0 3
#> 7 2020-10-12 Obreros… "Pert… "Un … https… http… 421 6 0 2
#> 8 2020-10-07 Langost… "El m… "El … https… http… 1104 5 0 2
#> 9 2020-09-15 Corvina… "Áfri… "La … https… http… 661 5 0 1
#> 10 2020-08-31 Peón de… "Es u… "Víc… https… http… 747 5 0 2
#> # … with 878 more rows, 3 more variables: i_conf_gral <dbl>, i_soip <dbl>,
#> # i_huelgas <dbl>, and abbreviated variable names ¹frec_palabras,
#> # ²frec_conflictos, ³frec_huelgas, ⁴frec_soip
Al realizar los filtros la base se redujo a 888 notas que presentan al menos una mención de una palabra que refiere a conflicto y al menos un término que refiere a lxs trabajadorxs del pescado.
Serie temporal de índices
En esta parte del código usaremos la función acep_rst()
para calcular los índices agrupados por año y mes. Primero construimos
la serie de tiempo para la conflictividad general.
# Calculamos el índice anual de conflictividad general en el
# ámbito de la industrial del procesado de pescado en tierra
# Pero primero preparamos el marcos de datos para ser procesado
# por la función acep_rst()
# Estos pasos previos se deben realizar porque en este ejemplo no hicimos uso
# de la función acep_db() que calcula frecuencia, menciones e intensidad y
# deja el marco de datos resultante en un formato adecuado para ser usado
# con la función acep_rst()
datos <- data.frame(
fecha = rev_puerto$fecha,
n_palabras = rev_puerto$frec_palabras,
conflictos = rev_puerto$frec_conflictos,
intensidad = rev_puerto$i_conf_gral
)
# Luego construimos los vectores
fecha <- datos$fecha
n_palabras <- datos$n_palabras
conflictos <- datos$conflictos
# Ahora agrupamos por mes la conflictividad general del sector
conf_gral_anio <- acep_rst(datos,
fecha,
n_palabras,
conflictos,
st = "anio")
# Imprimimos la base en consola
conf_gral_anio |> head()
#> st frecn csn frecp frecm intac intensidad int_notas_confl
#> 1 2009 51 36 41178 251 0.3315 0.0061 0.7059
#> 2 2010 50 37 40036 308 0.4259 0.0077 0.7400
#> 3 2011 106 79 74779 648 1.0012 0.0087 0.7453
#> 4 2012 149 121 119419 1020 1.3347 0.0085 0.8121
#> 5 2013 101 67 80654 596 0.7576 0.0074 0.6634
#> 6 2014 84 60 50679 430 0.7425 0.0085 0.7143
# Calculamos el índice mensual de conflictividad general en el
# ámbito de la industrial del procesado de pescado en tierra
# Pero primero preparamos el marcos de datos para ser procesado
# por la función acep_rst()
datos <- data.frame(
fecha = rev_puerto$fecha,
n_palabras = rev_puerto$frec_palabras,
conflictos = rev_puerto$frec_conflictos,
intensidad = rev_puerto$i_conf_gral
)
# Nos quedamos con los datos del año 2012
datos <- datos[datos$fecha < "2013-01-01", ]
datos <- datos[datos$fecha > "2011-12-31", ]
# Luego construimos los vectores
fecha <- datos$fecha
n_palabras <- datos$n_palabras
conflictos <- datos$conflictos
# Ahora agrupamos por mes la conflictividad general del sector
conf_gral <- acep_rst(datos,
fecha,
n_palabras,
conflictos)
# Imprimimos la base en consola
conf_gral |> head()
#> st frecn csn frecp frecm intac intensidad int_notas_confl
#> 1 2012-01 14 12 10930 78 0.1180 0.0071 0.8571
#> 2 2012-02 5 5 3122 22 0.0355 0.0070 1.0000
#> 3 2012-03 18 10 12100 61 0.0980 0.0050 0.5556
#> 4 2012-04 11 11 8615 89 0.1206 0.0103 1.0000
#> 5 2012-05 12 11 10194 133 0.1641 0.0130 0.9167
#> 6 2012-06 17 15 14001 163 0.1961 0.0116 0.8824
En la siguiente parte del código construimos la serie de tiempo para la conflictividad huelguística.
# Calculamos el índice mensual de conflictividad huelguística en el
# ámbito de la industrial del procesado de pescado en tierra
# Pero primero preparamos el marcos de datos para ser procesado
# por la función acep_rst()
datosh <- data.frame(
fecha = rev_puerto$fecha,
n_palabras = rev_puerto$frec_palabras,
conflictos = rev_puerto$frec_huelgas,
intensidad = rev_puerto$i_huelgas
)
# Nos quedamos con los datos del año 2012
datosh <- datosh[datosh$fecha < "2013-01-01", ]
datosh <- datosh[datosh$fecha > "2011-12-31", ]
# Luego construimos los vectores
fechah <- datosh$fecha
n_palabrash <- datosh$n_palabras
conflictosh <- datosh$conflictos
# Ahora agrupamos por mes la conflictividad huelguística del sector
huelgas <- acep_rst(datosh,
fechah,
n_palabrash,
conflictosh)
# Imprimimos la base en consola
huelgas |> head()
#> st frecn csn frecp frecm intac intensidad int_notas_confl
#> 1 2012-01 14 0 10930 0 0.0000 0.0000 0.0000
#> 2 2012-02 5 0 3122 0 0.0000 0.0000 0.0000
#> 3 2012-03 18 0 12100 0 0.0000 0.0000 0.0000
#> 4 2012-04 11 0 8615 8 0.9010 0.0009 0.0000
#> 5 2012-05 12 2 10194 17 1.2651 0.0017 0.1667
#> 6 2012-06 17 2 14001 19 1.4480 0.0014 0.1176
Las visualizaciones
En este último apartado haremos uso de las funciones
acep_plot_st()
y acep_plot_rst()
para
visualizar la variación anual de la conflictividad general protagonizada
por lxs trabajadorxs del pescado entre marzo de 2009 y diciembre de
2020. También visualizaremos la variación mensual durante el año 2012,
el más conflictivo de período bajo análisis.
# Visualizaremos el índice de conflictividad general
# agrupado por año para el período 2009-2020
acep_plot_st(
conf_gral_anio$st,
conf_gral_anio$frecm,
t = "Indice anual de conflictividad en la industria pesquera (MdP)",
ejey = "Menciones del diccionario",
etiquetax = "vertical"
)
# Visualizaremos el índice de conflictividad general
# agrupado por año para el período 2009-2020
acep_plot_rst(conf_gral_anio, tagx = "vertical")
# Visualizaremos el índice de conflictividad general
# agrupado por mes para el 2012
acep_plot_st(
conf_gral$st,
conf_gral$frecm,
t = "Indice mensual de conflictos en la industria pesquera (MdP)",
ejey = "Menciones del diccionario",
etiquetax = "vertical"
)
# Visualizaremos el índice de conflictividad huelguística
# agrupado por mes para el 2012
acep_plot_st(
huelgas$st,
huelgas$frecm,
t = "Indice mensual de huelgas en la industria pesquera (MdP)",
ejey = "Menciones del diccionario",
etiquetax = "vertical"
)
Las distintas métricas nos ayudan a identificar al año 2012 como el más conflictivo del período en el ámbito de la industria pesquera de procesado en tierra en la ciudad de Mar del Plata, con epicentro en los meses de junio, julio y agosto para la conflictividad general y con epicentro en los meses de mayo, junio y julio para los movimientos huelguísticos.
Comentarios finales
A lo largo de este breve tutorial sobre algunas de las funciones del paquete ACEP buscamos ejemplificar de qué modo se puede adoptar un enfoque de diccionario para realizar un primer análisis exploratorio de un corpus de notas periodísticas. Los resultados son alentadores. Con la combinación de distintos diccionarios se pudo identificar la temporalidad de la conflictividad protagonizada por lxs obrerxs del pescado en la ciudad de Mar del Plata. En próximos artículos avanzaremos con otras funciones del paquete ACEP para el análisis computacional de la conflictividad en la industria pesquera argentina.