Skip to contents

Funcion que devuelve cinco objetos data.frame con etiquetado POS (modelo udpipe) y relaciones sintacticas (modelo rsyntax) que permiten reconstruir estructuras sintacticas como SVO y Sujeto-Predicado. Una vez seleccionadas las notas periodisticas referidas a conflictos, esta funcion permite extraer sujetos de la protesta, accion realizada y objeto(s) de la accion.

Usage

acep_svo_udpipe(
  texto,
  modelo = "spanish",
  prof_s = 2,
  prof_o = 2,
  relaciones = c("flat", "fixed", "appos"),
  conexiones = FALSE,
  rel_s = c("nsubj", "conj", "nmod"),
  rel_o = c("obj", "obl", "amod"),
  rel_evs = "nsubj",
  rel_evp = "obj",
  u = 1
)

Arguments

texto

vector con los textos a procesar.

modelo

idioma del modelo de etiquetado POS del paquete udpipe.

prof_s

es un numero entero positivo que determina la profundidad a la que se buscan las relaciones dentro del sujeto. Este parametro se hereda del la funcion children() del paquete rsyntax. Se recomienda no superar el valor 2.

prof_o

es un numero entero positivo que determina la profundidad a la que se buscan las relaciones dentro del objeto. Este parametro se hereda del la funcion children() del paquete rsyntax. Se recomienda no superar el valor 2.

relaciones

vector con las etiquetas de relaciones que se usaran en la funcion de relleno. Este parametro se hereda de la funcion custom_fill() del paquete rsyntax.

conexiones

es un parametro heredado del paquete rsyntax que controla el comportamiento si la profundidad es > 1 y se utilizan filtros. Si es FALSE, se recuperan todos los padres/hijos hasta la profundidad dada, y luego se filtran. De esta manera, los nietos que satisfacen las condiciones del filtro se recuperan incluso si sus padres no satisfacen las condiciones. Si es TRUE, el filtro se aplica en cada nivel de profundidad, de modo que solo se recuperan las ramas totalmente conectadas de los nodos que satisfacen las condiciones. Este parametro se hereda de la funcion custom_fill() del paquete rsyntax.

rel_s

vector de etiquetas de relaciones sintacticas en el sujeto. Este parametro se hereda del la funcion children() del paquete rsyntax.

rel_o

vector de etiquetas de relaciones sintacticas en el objeto. Este parametro se hereda del la funcion children() del paquete rsyntax.

rel_evs

etiqueta de relaciones a ser agregada en la reconstruccion del sujeto.

rel_evp

etiqueta de relaciones a ser agregada en la reconstruccion del predicado.

u

numero entero que indica el umbral de palabras del objeto en la reconstruccion SVO.

Value

Si todas las entradas son correctas, la salida sera una lista con tres bases de datos en formato tabular.

References

Welbers, K., Atteveldt, W. van, & Kleinnijenhuis, J. 2021. Extracting semantic relations using syntax: An R package for querying and reshaping dependency trees. Computational Communication Research, 3-2, 1-16. (link al articulo)

Examples

texto <- "El SOIP declara la huelga en demanda de aumento salarial."
texto_svo <- acep_svo_udpipe(texto)
#> Downloading udpipe model from https://raw.githubusercontent.com/jwijffels/udpipe.models.ud.2.5/master/inst/udpipe-ud-2.5-191206/spanish-gsd-ud-2.5-191206.udpipe to /home/runner/work/ACEP/ACEP/docs/reference/spanish-gsd-ud-2.5-191206.udpipe
#>  - This model has been trained on version 2.5 of data from https://universaldependencies.org
#>  - The model is distributed under the CC-BY-SA-NC license: https://creativecommons.org/licenses/by-nc-sa/4.0
#>  - Visit https://github.com/jwijffels/udpipe.models.ud.2.5 for model license details.
#>  - For a list of all models and their licenses (most models you can download with this package have either a CC-BY-SA or a CC-BY-SA-NC license) read the documentation at ?udpipe_download_model. For building your own models: visit the documentation by typing vignette('udpipe-train', package = 'udpipe')
#> Downloading finished, model stored at '/home/runner/work/ACEP/ACEP/docs/reference/spanish-gsd-ud-2.5-191206.udpipe'
texto_svo$acep_list_svo
#> # A tibble: 1 × 7
#>   doc_id parrafo_id oracion_id eventos                   sujeto verbo   objeto
#>    <int>      <int>      <int> <chr>                     <chr>  <chr>   <chr> 
#> 1      1          1          1 SOIP -> declara -> huelga SOIP   declara huelga