Processo de decisão de Markov limitados por linguagem / Language limited Markov decision processes
AUTOR(ES)
Jeronimo Pellegrini
DATA DE PUBLICAÇÃO
2006
RESUMO
Processos de decisão de Markov (MDPs) são usados para modelar situações onde é necessário executar ações em sequência em ambientes com incerteza. Este trabalho define uma nova formulação dos processos de decisão de Markov, adicionando a estes a possibilidade de restringir as ações e observações a serem consideradas a cada época de decisão. Estas restrições são descritas na forma de um autômato finito ? assim, a sequência de possíveis ações e observações consideradas na busca pela política ótima passa a ser uma linguagem regular. Chamamos estes processos de Markov limitados por linguagem (LLMDPs e LL-POMDPs). O uso de autômatos para a especificação de restrições facilita o processo de modelagem de problemas. Apresentamos diferentes abordagens para a solução destes problemas, e comparamos seus desempenhos, mostrando que a solução é viável, e mostramos também que em algumas situações o uso de restrições pode ser usado para acelerar a busca por uma solução. Além disso, apresentamos uma modificação nos LLPOMDPs de forma que seja possível especificar duração probabilística discreta para as ações e observações
ASSUNTO(S)
probabilidades teoria da decisão decision theory processos de markoff processes markov probability inteligencia artificial artificial intelligence
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=vtls000412307Documentos Relacionados
- Compact representations of Markov decision processes and their application to printer management.
- Controle de admissões de pacientes eletivos: uma aplicação de processos markovianos de decisão
- Transformação de redes de Petri coloridas em processos de decisão markovianos com probabilidades imprecisas.
- Tabela de decisão adaptativa na tomada de decisão multicritério.
- ON INCREASING MARKOV PROCESSES