Abstract
A exploração de corpora para a extração de léxico de especialidade é um método consensual e comum na construção de recursos lexicais. No entanto, as metodologias empregadas não são explicitamente discutidas, dificultando a comparação e a determinação de abordagens robustas. Para preencher essa lacuna, neste artigo apresentamos e discutimos uma metodologia detalhada para extração de léxico de especialidade a partir de corpora, conjugando abordagens linguísticas e estatísticas. O método proposto prevê tanto o uso de corpora de especialidade como de corpora monitores e inclui: i) análise de dados de frequência; ii) extração de concordâncias e colocações; iii) extração de informação de ordem textual, permitindo a extração de unidades lexicais atómicas e multipalavra e de relações semânticas relevantes. Desse modo, o objetivo da metodologia é a determinação de listas de potenciais unidades lexicais de especialidade e de informações relevantes para a sua descrição que permitam uma validação final rápida e eficiente, maximizando o valor informacional da interação com os especialistas.
| Translated title of the contribution | Exploiting corpora for extracting and describing specialized lexicon : Towards a solid and sustained methodology |
|---|---|
| Original language | Portuguese |
| Pages (from-to) | 69-104 |
| Number of pages | 20 |
| Journal | Linha d’Água |
| Volume | 33 |
| Issue number | 1 |
| DOIs | |
| Publication status | Published - 2020 |
Keywords
- Specialized Lexicon Extraction
- Methodology
- Corpora
- Concordances
- Collocations
Fingerprint
Dive into the research topics of 'Exploiting corpora for extracting and describing specialized lexicon : Towards a solid and sustained methodology'. Together they form a unique fingerprint.Cite this
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver