Publicação
Trabalho Conjunto em Ambientes Complexos
| Resumo: | Esta dissertação aborda a construção de agentes, capazes de actuar em ambiente estocástico, parcialmente observável e com comunicação limitada. Os agentes cooperam para alcançar um bem comum (e.g. mitigar os efeitos de um desastre). O problema é o da busca-e-salvamento (simulado no RoboCupRescue), onde diversos agentes, com objectivos individuais (e.g. sobrevivência), tencionam satisfazer, em conjunto, vários objectivos colectivos (e.g. extinguir incêndios). São propostas três componentes para construir os agentes: uma arquitectura, um método para (re)constituição de equipas e um modelo de decisão. As componentes exploram duas grandes classes de comportamento - a actividade (local) no terreno e a coordenação (global) dessa actividade - e conciliam a sua influência recíproca. A arquitectura integra comportamentos reactivos, com a capacidade de exercer escolha sobre objectivos, e com o respeito por compromissos sociais. A implementação permitiu participar na fase final da competição internacional RoboCupRescue. O método para (re)constituição de equipas adopta a perspectiva centralizada da coordenação e formula um problema de decisão com incerteza, baseado num modelo 'a priori' do ambiente. A ilustração do método evidencia a sua aplicabilidade. O modelo de decisão considera que a escolha individual coexiste com a escolha colectiva e que a coordenação surge (se aprende) da relação continuada (no tempo) das escolhas exercidas nesses dois níveis (individual e colectivo). Adicionalmente, a coordenação incide nas acções de alto nível (numa organização hierárquica de acções abstractas) e não nas acções primitivas de cada um dos agentes. O problema da coordenação de múltiplos táxis é utilizado para validar o modelo de decisão |
|---|---|
| Autores principais: | Trigo, Paulo |
| Assunto: | Inteligência artificial sistemas multi-agente ambiente RoboCupRescue modelação de agentes formação de equipas decisão com incerteza aprendizagem |
| Ano: | 2007 |
| País: | Portugal |
| Tipo de documento: | tese de doutoramento |
| Tipo de acesso: | acesso restrito |
| Instituição associada: | Universidade de Lisboa |
| Idioma: | português |
| Origem: | Repositório da Universidade de Lisboa |
| Resumo: | Esta dissertação aborda a construção de agentes, capazes de actuar em ambiente estocástico, parcialmente observável e com comunicação limitada. Os agentes cooperam para alcançar um bem comum (e.g. mitigar os efeitos de um desastre). O problema é o da busca-e-salvamento (simulado no RoboCupRescue), onde diversos agentes, com objectivos individuais (e.g. sobrevivência), tencionam satisfazer, em conjunto, vários objectivos colectivos (e.g. extinguir incêndios). São propostas três componentes para construir os agentes: uma arquitectura, um método para (re)constituição de equipas e um modelo de decisão. As componentes exploram duas grandes classes de comportamento - a actividade (local) no terreno e a coordenação (global) dessa actividade - e conciliam a sua influência recíproca. A arquitectura integra comportamentos reactivos, com a capacidade de exercer escolha sobre objectivos, e com o respeito por compromissos sociais. A implementação permitiu participar na fase final da competição internacional RoboCupRescue. O método para (re)constituição de equipas adopta a perspectiva centralizada da coordenação e formula um problema de decisão com incerteza, baseado num modelo 'a priori' do ambiente. A ilustração do método evidencia a sua aplicabilidade. O modelo de decisão considera que a escolha individual coexiste com a escolha colectiva e que a coordenação surge (se aprende) da relação continuada (no tempo) das escolhas exercidas nesses dois níveis (individual e colectivo). Adicionalmente, a coordenação incide nas acções de alto nível (numa organização hierárquica de acções abstractas) e não nas acções primitivas de cada um dos agentes. O problema da coordenação de múltiplos táxis é utilizado para validar o modelo de decisão |
|---|