An Accelerated Gradient Method for Multi-Agent Planning in Factored MDPs

An Accelerated Gradient Method for Multi-Agent Planning in Factored MDPs Sue Ann Hong Geoff Gordon Carnegie Mellon University

Multi-agent planning Optimize Shared constraints resources Individual constraints Individual objective

Factored MDPs[Guestrin et al., 2002] • Want: an efficient, distributed solver Piece-wise linear constraints on shared resources Optimize Shared constraints resources MDP: maximize linear reward Fast solver: value iteration Individual constraints Individual objective

Distributed optimizationLagrangian relaxation Resource 1 @ $100 • How to set the prices? Gradient-based methods. 2 NO NO 1 2 Solve in a distributed fashion $300 $50 $80 $200 $100

FISTA for factored MDPs • linear objective  : augment with a strongly convex function: causal entropy[Ziebart et al., 2010] • Usually regularization towards a more uniform policy • Retains a fast individual planner (softmax value iteration) • Introduces smoothing error (to the linear objective) • We show that the gain in convergence can outweigh the approximation (smoothing) error.

An Accelerated Gradient Method for Multi-Agent Planning in Factored MDPs

An Accelerated Gradient Method for Multi-Agent Planning in Factored MDPs

Presentation Transcript

Optimistic Initialization and Greediness Lead to Polynomial-Time Learning in Factored MDPs

Conjugate Gradient Method for Indefinite Matrices

Multi-Agent Based Multi-Knowledge Acquisition Method for Rough Set

CONJUGATE GRADIENT METHOD

Multi-Agent Planning

Factored MDPs

A Framework for Agent Collaboration in Multi-Agent Systems

Value and Planning in MDPs

An Introduction to Multi-agent Simulation

A Distributed, Complete Method for Multi-Agent Constraint Optimization

Efficient Solution Algorithms for Factored MDPs

Planning and Coordination in A Multi-Agent Environment.

Distributed Planning in Hierarchical Factored MDPs

Multi-agent Planning

Factored Planning

Agent Communication in Multi Agent Systems

An Observation Framework for Multi-Agent Systems

Path Planning for Multi Agent Systems

Cojugate Gradient Method

Accelerated Subspace Iteration Method for Computing

Multi-Layered Impostors for Accelerated Rendering

Multiagent Coordination, Planning, Learning and Generalization with Factored MDPs