MÃtodos de Cluster para intervalos usando algoritmos do tipo nuvens dinÃmicas

AUTOR(ES)
DATA DE PUBLICAÇÃO

2003

RESUMO

A analise de dados simbolicos (Symbolic Data Analysis) e uma nova abordagem na area de descoberta automatica de conhecimentos que visa desenvolver metodos para dados descritos por varaveis onde existem conjuntos de categorias, intervalos ou distribuic~oes de probabilidade nas celulas das tabelas de dados. O objetivo deste trabalho e introduzir metodos de cluster para intervalos usando algoritmos de nuvens din^amicas. Estes algoritmos consistem em obter, simultaneamente, uma partic~ao em classes e identicar um conjunto de representantes das classes minimizando um criterio que mede a adequac~ao entre as classes e os prototipos. Os algoritmos de nuvens din^amicas com dist^ancias adaptativas tambem encontram uma partic~ao e um conjunto de representantes minimizando uma func~ao criterio, mas em cada iterac~ao existe uma dist^ancia diferente para comparar cada classe com o seu prototipo. A vantagem das dist^ancias adaptativas e que o algoritmo de agrupamento e capaz de reconhecer classes de formas e tamanhos diferentes. Neste trabalho, foi desenvolvido um metodo de nuvens din^amicas usando a dist^ancia L1 para intervalos. Alem deste metodo, foram tambem introduzidos tr^es metodos com, respectivamente, as dist^ancias L1, L2 e L1 adaptativas para intervalos. Para validar os metodos, foram realizados experimentos com um conjunto de especies de peixes e dois conjuntos de dados articiais de intervalos com diferentes graus de diculdade de classicac~ao. Os resultados fornecidos pelos metodos t^em sido avaliados por um ndice externo na estrutura de uma experi^encia Monte Carlo e testes estatsticos evidenciam que o desempenho dos metodos adaptativos e superior ao dos metodos n~ao adaptativos

ASSUNTO(S)

distÃncias adaptativas dados de tipo intervalos algoritmos de nuvens dinÃmicas anÃlise de dados simbÃlicos ciencia da computacao

Documentos Relacionados