Avaliando o impacto da qualidade de um algoritmo de stemming na recuperação de informações / Assessing the impact of a stemming algorithm’s accuracy on information retrieval

AUTOR(ES)
DATA DE PUBLICAÇÃO

2010

RESUMO

A qualidade de um algoritmo de stemming é tipicamente medida de duas formas: (i) quão corretamente o algoritmo mapeia as diferentes formas de uma palavra para o mesmo stem; ou (ii) qual o nível de melhora que o algoritmo proporciona à Recuperação de Informações. O presente trabalho apresenta o desenvolvimento de uma ferramenta que implementa o método de Paice, o qual serve para avaliar os algoritmos de stemming de acordo com a primeira métrica mencionada acima. Além disso, diversos algoritmos de stemming para a língua portuguesa são avaliados de acordo com as duas métricas, a fim de verificar se os stemmers de maior qualidade são também aqueles que trazem o maior ganho para a Recuperação de Informações. Os resultados mostram que essa relação existe, porém ela não é tão forte quanto se poderia esperar.

ASSUNTO(S)

stemming stemmer recuperacao : informacao paice’s method information retrieval evaluation

Documentos Relacionados