Publicação

Trabalho Conjunto em Ambientes Complexos

Detalhes bibliográficos
Resumo:	Esta dissertação aborda a construção de agentes, capazes de actuar em ambiente estocástico, parcialmente observável e com comunicação limitada. Os agentes cooperam para alcançar um bem comum (e.g. mitigar os efeitos de um desastre). O problema é o da busca-e-salvamento (simulado no RoboCupRescue), onde diversos agentes, com objectivos individuais (e.g. sobrevivência), tencionam satisfazer, em conjunto, vários objectivos colectivos (e.g. extinguir incêndios). São propostas três componentes para construir os agentes: uma arquitectura, um método para (re)constituição de equipas e um modelo de decisão. As componentes exploram duas grandes classes de comportamento - a actividade (local) no terreno e a coordenação (global) dessa actividade - e conciliam a sua influência recíproca. A arquitectura integra comportamentos reactivos, com a capacidade de exercer escolha sobre objectivos, e com o respeito por compromissos sociais. A implementação permitiu participar na fase final da competição internacional RoboCupRescue. O método para (re)constituição de equipas adopta a perspectiva centralizada da coordenação e formula um problema de decisão com incerteza, baseado num modelo 'a priori' do ambiente. A ilustração do método evidencia a sua aplicabilidade. O modelo de decisão considera que a escolha individual coexiste com a escolha colectiva e que a coordenação surge (se aprende) da relação continuada (no tempo) das escolhas exercidas nesses dois níveis (individual e colectivo). Adicionalmente, a coordenação incide nas acções de alto nível (numa organização hierárquica de acções abstractas) e não nas acções primitivas de cada um dos agentes. O problema da coordenação de múltiplos táxis é utilizado para validar o modelo de decisão
Autores principais:	Trigo, Paulo
Assunto:	Inteligência artificial sistemas multi-agente ambiente RoboCupRescue modelação de agentes formação de equipas decisão com incerteza aprendizagem
Ano:	2007
País:	Portugal
Tipo de documento:	tese de doutoramento
Tipo de acesso:	acesso restrito
Instituição associada:	Universidade de Lisboa
Idioma:	português
Origem:	Repositório da Universidade de Lisboa

Descrição
Resumo:	Esta dissertação aborda a construção de agentes, capazes de actuar em ambiente estocástico, parcialmente observável e com comunicação limitada. Os agentes cooperam para alcançar um bem comum (e.g. mitigar os efeitos de um desastre). O problema é o da busca-e-salvamento (simulado no RoboCupRescue), onde diversos agentes, com objectivos individuais (e.g. sobrevivência), tencionam satisfazer, em conjunto, vários objectivos colectivos (e.g. extinguir incêndios). São propostas três componentes para construir os agentes: uma arquitectura, um método para (re)constituição de equipas e um modelo de decisão. As componentes exploram duas grandes classes de comportamento - a actividade (local) no terreno e a coordenação (global) dessa actividade - e conciliam a sua influência recíproca. A arquitectura integra comportamentos reactivos, com a capacidade de exercer escolha sobre objectivos, e com o respeito por compromissos sociais. A implementação permitiu participar na fase final da competição internacional RoboCupRescue. O método para (re)constituição de equipas adopta a perspectiva centralizada da coordenação e formula um problema de decisão com incerteza, baseado num modelo 'a priori' do ambiente. A ilustração do método evidencia a sua aplicabilidade. O modelo de decisão considera que a escolha individual coexiste com a escolha colectiva e que a coordenação surge (se aprende) da relação continuada (no tempo) das escolhas exercidas nesses dois níveis (individual e colectivo). Adicionalmente, a coordenação incide nas acções de alto nível (numa organização hierárquica de acções abstractas) e não nas acções primitivas de cada um dos agentes. O problema da coordenação de múltiplos táxis é utilizado para validar o modelo de decisão