Algoritmos distribuidos para localização de falhas e difusão de mensagens em hipercubos defeituosos
AUTOR(ES)
Saulo Rodrigues do Nascimento
DATA DE PUBLICAÇÃO
2000
RESUMO
Após investigação das soluções existentes na literatura para o problema da difusão de mensagens em máquinas paralelas tipo hipercubo com falhas de enlace e de nó, este trabalho faz uma análise detalhada das mesmas comparando os fatores que determinam qual é mais adequada para cada tipo de aplicação. Em seguida, efetua-se uma pesquisa sobre os métodos existentes para a detecção e localização de falhas em sistemas multicomputadores. Como resultado, constata-se a ausência de um método específico para hipercubos e propõese um algoritmo distribuído que explora as propriedades desta topologia na detecção e localização de enlaces e nós falhos. Finalmente, é proposto um algoritmo tolerante a falhas para difusão eficiente de mensagens, reunindo e superando as características positivas dos melhores algo ritmos existentes. O algoritmo proposto tolera até n-l falhas, sendo elas de enlaces, nós ou uma combinação de ambas, e realiza todo o processo de difusão em no máximo n+2 etapas, para um hipercubo de dimensão n. Um grande número de testes efetuados em um hipercubo comercial atesta a correção desta solução e a sua posição de vantagem em relação às existentes
ASSUNTO(S)
hipercubo tolerancia a falha (computação)
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=vtls000202777Documentos Relacionados
- Algoritmos para eleição de lider em sistemas distribuidos
- Protocolos para difusão confiavel de mensagens em grupos de comunicação
- Injeção de falhas de comunicação em ambientes distribuídos
- Uma biblioteca de padrões de especificação em Event-B para mecanismos de troca de mensagens em sistema distribuídos
- Condução de experimentos de injeção de falhas em banco de dados distribuídos