DESENVOLVIMENTO DE UMA METODOLOGIA PARA MINERAÇÃO DE TEXTOS / DEVELOPMENT OF A METHODOLOGY FOR TEXT MINING
AUTOR(ES)
JOAO RIBEIRO CARRILHO JUNIOR
DATA DE PUBLICAÇÃO
2007
RESUMO
A seguinte dissertação tem como objetivo explorar a Mineração de Textos através de um estudo amplo e completo do que atualmente é considerado estado da arte. Esta nova área, considerada por muitos como uma evolução natural da Mineração de Dados, é bastante interdisciplinar e vem obtendo importantes colaborações de estudiosos e pesquisadores de diversas naturezas, como Lingüística, Computação, Estatística e Inteligência Artificial. Entretanto, muito se discute sobre como deve ser um processo completo de investigação textual, de forma a tirar máximo proveito das técnicas adotadas nas mais variadas abordagens. Desta forma, através de um encadeamento sistemático de procedimentos, pode-se chegar a uma conclusão do que seria a metodologia ideal para a Mineração de Textos, conforme já se chegou para a de Dados. O presente trabalho explora um modelo de processo, do início ao fim, que sugere as seguintes etapas: coleta de dados, pré-processamento textual, indexação, mineração e análise. Este sequenciamento é uma tendência encontrada em trabalhos recentes, sendo minuciosamente discutido nos capítulos desta dissertação. Finalmente, a fim de se obter enriquecimento prático, foi desenvolvido um sistema de Mineração de Textos que possibilitou a apresentação de resultados reais, obtidos a partir da aplicação de algoritmos em documentos de natureza geral.
ASSUNTO(S)
machine learning recuperacao de informacao text mining aprendizado de maquina information retrieval mineracao de texto
ACESSO AO ARTIGO
Documentos Relacionados
- Metodologia de mineração de dados para ambientes educacionais online
- Avaliação de métodos não-supervisionados de seleção de atributos para mineração de textos
- BOOKISH: Uma ferramenta para contextualização de documentos utilizando mineração de textos e expansão de consulta
- Implementação de uma metodologia para mineração de dados aplicada ao estudo de núcleos convectivos
- UMA ABORDAGEM DE PRÉ-PROCESSAMENTO AUTOMÁTICO PARA MINERAÇÃO DE TEXTOS EM PORTUGUÊS: SOB O ENFOQUE DA INTELIGENCIA COMPUTACIONAL