NovaIntell: projecto de text-Mining para a língua portuguesa numa empresa de Gestão de Informação e Conhecimento

Pedro Gonçalo Jorge Rolim, Miguel de Castro Neto (Advisor)

Research output: ThesisMaster's Thesis

Abstract

O constante aumento da informação escrita disponível cria um crescente problema de capacidade de análise dos conteúdos textuais. Ao contrário da informação numérica ou categorizada sobre a qual está disseminada a utilização de processos analíticos com vista à extracção de conhecimento, a informação textual é não estruturada. Nesta medida, a sua análise seja mais complexa, menos eficiente e insuficiente tendo em consideração o volume de informação a tratar. Por outro lado, no momento do lançamento do projecto Novaintell, as soluções analíticas de texto que contemplem processos específicos para a língua portuguesa não se encontravam suficientemente desenvolvidas para que fossem adoptadas como alternativas viáveis e eficazes ao tratamento dos conteúdos textuais realizado de forma manual pelos analistas de informação. Foi com o objectivo de solucionar o problema do tratamento da informação textual que se desenvolveu o projecto NovaIntell, resultado da constituição de um consórcio co-promovido pela empresa de gestão de informação Manchete e pelo Instituto Superior de Estatística e Gestão de Informação da Universidade Nova de Lisboa, apoiado por fundos comunitários no âmbito do Quadro de Referência Estratégico Nacional (QREN). Neste contexto, os trabalhos efectuados ao longo do projecto NovaIntell resultaram no desenvolvimento de um módulo linguístico capaz de analisar o conteúdo de documentos escritos na língua portuguesa, com vista à extracção de conhecimento accionável com base na informação produzida pelos órgãos de comunicação social portugueses.(...)
Original languagePortuguese
QualificationMaster of Science
Awarding Institution
  • NOVA Information Management School (NOVA IMS)
Supervisors/Advisors
  • Neto, Miguel de Castro, Supervisor
Award date12 Oct 2011
Publication statusPublished - 12 Oct 2011

Cite this