ROBUST TEXT-INDEPENDENT SPEAKER IDENTIFICATION USING MULTIPLE CLASSIFIERS IN SUB-BANDS / IDENTIFICAÇÃO DE LOCUTOR ROBUSTA E INDEPENDENTE DO TEXTO USANDO MÚLTIPLOS CLASSIFICADORES EM SUB-BANDAS
AUTOR(ES)
EDUARDO ESTEVES VALE
DATA DE PUBLICAÇÃO
2010
RESUMO
Esta tese destina-se ao desenvolvimento de novas técnicas de combinação de classificadores aplicados em sub-bandas visando melhorar a identificação de locutor robusta e independente do texto. As vantagens observadas nas pesquisas utilizando múltiplos classificadores em sub-bandas para o reconhecimento de locutor robusto motivaram o desenvolvimento de técnicas de combinação desses algoritmos. Nessa tese foram propostas novas abordagens para a combinação das respostas dos classificadores nas sub-bandas. O principal objetivo é melhorar a taxa de acerto em situações onde nada se sabe sobre o tipo de ruído que pode estar corrompendo os sinais de voz usados no teste do sistema. As diferentes propostas consistem no emprego de pesos não-uniformes, espaço nulo, treinamento em múltiplas condições, atributos dinâmicos e coeficientes de autocorrelação ¿ MFCC. A aplicação das novas propostas contribui significativamente para a melhoria da taxa de acerto do sistema de reconhecimento. Obteve-se, por exemplo, um aumento na taxa de reconhecimento, em relação à técnica de combinação Soma apresentada na literatura, de aproximadamente 47% em testes com ruído branco, e de 32% em testes com ruído não-branco em 15 segundos de fala e 10 dB de RSR (Relação Sinal Ruído), apenas utilizando uma nova estratégia que emprega o espaço nulo na combinação de classificadores em sub-bandas. Resultados mais significativos foram obtidos empregando-se as demais propostas apresentadas no presente trabalho.
ASSUNTO(S)
sub-banda sub-band mÚltiplos classificadores espaco nulo atributos dinÂmicos coeficientes de autocorrelaÇÃo
ACESSO AO ARTIGO
Documentos Relacionados
- INDEPENDENT TEXT ROBUST SPEAKER RECOGNITION IN THE PRESENCE OF NOISE USING PAC-MFCC AND SUB BAND CLASSIFIERS
- Transições ópticas em heteroestruturas semicondutoras Zincblende com duas sub-bandas
- STUDY ON SPEECH CODING IN SUB-BANDS AT 16 KBITS/S
- Codificação digital de voz em sub-bandas
- SUB-BAND CODING OF IMAGES USING INTER-BAND VECTOR QUANTIZATION