User: Guest  Login
Original title:
Multi-Agent Reinforcement Learning for the Computation of Market Equilibria
Translated title:
Multi-Agent Reinforcement Learning für die Berechnung von Marktgleichgewichten
Author:
Kohring, Nils
Year:
2024
Document type:
Dissertation
Faculty/School:
TUM School of Computation, Information and Technology
Advisor:
Bichler, Martin (Prof. Dr.)
Referee:
Bichler, Martin (Prof. Dr.); Matthes, Florian (Prof. Dr.); Panageas, Ioannis (Prof., Ph.D.)
Language:
en
Subject group:
DAT Datenverarbeitung, Informatik
Keywords:
Auction Theory, Equilibrium Computation, Machine Learning, Multi-Agent Reinforcement Learning
Translated keywords:
Auktionstheorie, Gleichgewichtsberechnung, Maschinelles Lernen, Multi-Agent Reinforcement Learning
TUM classification:
MAT 920; WIR 523
Abstract:
This thesis proposes a general and scalable approach for equilibrium computation in markets based on reinforcement learning methods. The agents’ strategies are modeled by neural networks that learn to bid optimally through repeated self-play. The classes of gradient-based and particle-swarm-based approaches are examined. We provide strong numerical results in markets ranging from small single-item auctions to larger combinatorial auctions and double auctions.
Translated abstract:
In dieser Dissertation wird ein allgemeiner und skalierbarer Ansatz zur Gleichgewichtsberechnung vorgestellt, der auf Methoden des Reinforcement Learning basiert. Die Strategien der Agenten werden mittels neuronaler Netze modelliert, die durch wiederholtes Ausprobieren und Adaptieren optimales Bieten erlernen. Die Klassen von gradientenbasierten Algorithmen und Partikelschwarmoptimierung werden untersucht. Die Verfahren erweisen sich als erfolgreich bei dem Finden von Gleichgewichten, sowohl in...     »
WWW:
https://mediatum.ub.tum.de/?id=1712728
Date of submission:
28.06.2023
Oral examination:
09.07.2024
File size:
13286548 bytes
Pages:
155
Urn (citeable URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20240709-1712728-1-2
Last change:
07.10.2024
 BibTeX