Inducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalán

Resultado de la investigación: Contribución a una revistaArtículorevisión exhaustiva

1 Cita (Scopus)

Resumen

This paper presents a methodological proposal por the automatic induction of a multilingual taxonomy of discourse markers which, in the case of English, correspond to units such as however, therefore, by the way, etc. First, a method is proposed to separate such units from the rest of the vocabulary using a measure of information, followed by a method to group them using a parallel corpus. Finally, this categorization is used as the basis for the extraction and classification of new units. Apart from the method, the first results are described, which consist of a database that currently surpasses 2600 units.

Título traducido de la contribuciónAutomatic induction of a multilingual taxonomy of discourse markers: first results in Spanish, English, French, German and Catalan
Idioma originalEspañol
Páginas (desde-hasta)127-138
Número de páginas12
PublicaciónProcesamiento de Lenguaje Natural
Volumen67
DOI
EstadoPublicada - sept. 2021
Publicado de forma externa

Palabras clave

  • computational lexicography
  • discourse markers
  • discurse particles
  • taxonomy induction

Huella

Profundice en los temas de investigación de 'Inducción automática de una taxonomía multilingüe de marcadores discursivos: primeros resultados en castellano, inglés, francés, alemán y catalán'. En conjunto forman una huella única.

Citar esto