CorrefSum: revisão da coesão referencial em sumários extrativos

AUTOR(ES)
DATA DE PUBLICAÇÃO

2008

RESUMO

Com o avanço da Internet, cada vez mais convivemos com a sobrecarga de informação. É nesse contexto que a área de sumarização automática de textos tem se tornado uma área proeminente de pesquisa. A sumarização é o processo de discernir as informações mais importantes dos textos para produzir uma versão resumida. Sumarizadores extrativos escolhem as sentenças mais relevantes do texto e as reagrupam para formar o sumário. Muitas vezes, as frases selecionadas do texto não preservam a coesão referencial necessária para o entendimento do texto. O foco deste trabalho é, portanto, na análise e recuperação da coesão referencial desses sumários. O objetivo é desenvolver um sistema que realiza a manutenção da coesão referencial dos sumários extrativos usando como fonte de informação as cadeias de correferência presentes no texto-fonte. Para experimentos e avaliação dos resultados foram utilizados dois sumarizadores: Gist-Summ e SuPor-2. Foram utilizadas duas formas de avaliação: automática e subjetiva. Os resultados mostram o potencial dessa abordagem e indicam maneiras de avançar nesta pesquisa.

ASSUNTO(S)

sumarização automática natural language processing ciencia da computacao textual cohesion língua natural cadeias de correferência coreference chains processamento coherence coerência coesão textual automatic summarization

Documentos Relacionados