Funcion para extraer triplets SVO (Sujeto-Verbo-Objeto).
Source:R/acep_svo_udpipe.R
acep_svo_udpipe.Rd
Funcion que devuelve cinco objetos data.frame con etiquetado POS (modelo udpipe) y relaciones sintacticas (modelo rsyntax) que permiten reconstruir estructuras sintacticas como SVO y Sujeto-Predicado. Una vez seleccionadas las notas periodisticas referidas a conflictos, esta funcion permite extraer sujetos de la protesta, accion realizada y objeto(s) de la accion.
Arguments
- texto
vector con los textos a procesar.
- modelo
idioma del modelo de etiquetado POS del paquete udpipe.
- prof_s
es un numero entero positivo que determina la profundidad a la que se buscan las relaciones dentro del sujeto. Este parametro se hereda del la funcion children() del paquete rsyntax. Se recomienda no superar el valor 2.
- prof_o
es un numero entero positivo que determina la profundidad a la que se buscan las relaciones dentro del objeto. Este parametro se hereda del la funcion children() del paquete rsyntax. Se recomienda no superar el valor 2.
- relaciones
vector con las etiquetas de relaciones que se usaran en la funcion de relleno. Este parametro se hereda de la funcion custom_fill() del paquete rsyntax.
- conexiones
es un parametro heredado del paquete rsyntax que controla el comportamiento si la profundidad es > 1 y se utilizan filtros. Si es FALSE, se recuperan todos los padres/hijos hasta la profundidad dada, y luego se filtran. De esta manera, los nietos que satisfacen las condiciones del filtro se recuperan incluso si sus padres no satisfacen las condiciones. Si es TRUE, el filtro se aplica en cada nivel de profundidad, de modo que solo se recuperan las ramas totalmente conectadas de los nodos que satisfacen las condiciones. Este parametro se hereda de la funcion custom_fill() del paquete rsyntax.
- rel_s
vector de etiquetas de relaciones sintacticas en el sujeto. Este parametro se hereda del la funcion children() del paquete rsyntax.
- rel_o
vector de etiquetas de relaciones sintacticas en el objeto. Este parametro se hereda del la funcion children() del paquete rsyntax.
- rel_evs
etiqueta de relaciones a ser agregada en la reconstruccion del sujeto.
- rel_evp
etiqueta de relaciones a ser agregada en la reconstruccion del predicado.
- u
numero entero que indica el umbral de palabras del objeto en la reconstruccion SVO.
Value
Si todas las entradas son correctas, la salida sera una lista con tres bases de datos en formato tabular.
References
Welbers, K., Atteveldt, W. van, & Kleinnijenhuis, J. 2021. Extracting semantic relations using syntax: An R package for querying and reshaping dependency trees. Computational Communication Research, 3-2, 1-16. (link al articulo)
Examples
texto <- "El SOIP declara la huelga en demanda de aumento salarial."
texto_svo <- acep_svo_udpipe(texto)
#> Downloading udpipe model from https://raw.githubusercontent.com/jwijffels/udpipe.models.ud.2.5/master/inst/udpipe-ud-2.5-191206/spanish-gsd-ud-2.5-191206.udpipe to /home/runner/work/ACEP/ACEP/docs/reference/spanish-gsd-ud-2.5-191206.udpipe
#> - This model has been trained on version 2.5 of data from https://universaldependencies.org
#> - The model is distributed under the CC-BY-SA-NC license: https://creativecommons.org/licenses/by-nc-sa/4.0
#> - Visit https://github.com/jwijffels/udpipe.models.ud.2.5 for model license details.
#> - For a list of all models and their licenses (most models you can download with this package have either a CC-BY-SA or a CC-BY-SA-NC license) read the documentation at ?udpipe_download_model. For building your own models: visit the documentation by typing vignette('udpipe-train', package = 'udpipe')
#> Downloading finished, model stored at '/home/runner/work/ACEP/ACEP/docs/reference/spanish-gsd-ud-2.5-191206.udpipe'
texto_svo$acep_list_svo
#> # A tibble: 1 × 7
#> doc_id parrafo_id oracion_id eventos sujeto verbo objeto
#> <int> <int> <int> <chr> <chr> <chr> <chr>
#> 1 1 1 1 SOIP -> declara -> huelga SOIP declara huelga