Uso de tecnologias linguı́sticas para estudar a evolução dos sufixos-ÇOM e-VEL no galego-português medieval a partir de corpora históricos

Translated title of the contribution: Use of Linguistic Technologies for Analysing the Evolution of Sufixes -C ̧ OM and -VELin Medieval Galician-Portuguese from Historical Corpora

Pablo Gamallo, Jose Ramom Pichel, José Martinho Montero Santalha, Marco Neves

Research output: Contribution to journalArticlepeer-review

1 Downloads (Pure)

Abstract

O trabalho apresentado neste artigo tem dois objectivos. Por um lado, descreve a adaptação de duas ferramentas de processamento da língua natural ao galego-português medieval, nomeadamente um analisador morfossintático e um reconhededor de variedades medievais, e por outro, visa testar hipóteses linguísticas sobre a evolução de sufixos medievais mediante o uso dessas ferramentas em corpora históricos. Apesar de o desempenho das ferramentas ser inferior do que quando utilizadas para variedades modernas mais estandardizadas e com menos variabilidade formal, mostramos que é possível usá-las com grande fiabilidade para estudos quantitativos baseados em corpus. O estudo linguístico baseado em corpus permite-nos conferir que, pela sua distribuição de frequências, a presença dos sufixos-CION e-BLE nos textos medievais da Galiza foi provavelmente influenciada pelo castelhano baixo medieval.

The work presented in this paper has two objetives. On the one hand, it describes how to adapt two natural language processing tools to medieval Galician-Portuguese, namely a morphosyntactic
analyzer and a medieval language recognizer, and on
the other hand, it verifies linguistic hypotheses about
the evolution of medieval suffixes by using these tools by using historical corpora. Although the performance of the tools is inferior to those used for more standardized modern varieties with less formal variability, we show that it is possible to use them with
great reliability for quantitative corpus-based studies. The corpus-based linguistic study allows us to verify that, on the basis of their frequency distribution, the presence of the suffixes -CION and -BLE in medieval Galician texts is probably influenced by medieval
Castilian
Translated title of the contributionUse of Linguistic Technologies for Analysing the Evolution of Sufixes -C ̧ OM and -VELin Medieval Galician-Portuguese from Historical Corpora
Original languagePortuguese
Pages (from-to)3-17
Number of pages15
JournalLINGUAMATICA
Volume13
Issue number2
DOIs
Publication statusPublished - 2021

Keywords

  • Etiquetagem morfossint´atica
  • Reconhecedor de l´ınguas
  • Linguística histórica
  • Humanidades digitais
  • Part-of-speech tagging
  • Language recognizer
  • Historical linguistics
  • Digital humanities

Fingerprint

Dive into the research topics of 'Use of Linguistic Technologies for Analysing the Evolution of Sufixes -C ̧ OM and -VELin Medieval Galician-Portuguese from Historical Corpora'. Together they form a unique fingerprint.

Cite this