This thesis proposes a general and scalable approach for equilibrium computation in markets based on reinforcement learning methods. The agents’ strategies are modeled by neural networks that learn to bid optimally through repeated self-play. The classes of gradient-based and particle-swarm-based approaches are examined. We provide strong numerical results in markets ranging from small single-item auctions to larger combinatorial auctions and double auctions.
Translated abstract:
In dieser Dissertation wird ein allgemeiner und skalierbarer Ansatz zur Gleichgewichtsberechnung vorgestellt, der auf Methoden des Reinforcement Learning basiert. Die Strategien der Agenten werden mittels neuronaler Netze modelliert, die durch wiederholtes Ausprobieren und Adaptieren optimales Bieten erlernen. Die Klassen von gradientenbasierten Algorithmen und Partikelschwarmoptimierung werden untersucht. Die Verfahren erweisen sich als erfolgreich bei dem Finden von Gleichgewichten, sowohl in kleinen als auch in größeren kombinatorischen Auktionen und auf Double-Auction-Märkten.
«
In dieser Dissertation wird ein allgemeiner und skalierbarer Ansatz zur Gleichgewichtsberechnung vorgestellt, der auf Methoden des Reinforcement Learning basiert. Die Strategien der Agenten werden mittels neuronaler Netze modelliert, die durch wiederholtes Ausprobieren und Adaptieren optimales Bieten erlernen. Die Klassen von gradientenbasierten Algorithmen und Partikelschwarmoptimierung werden untersucht. Die Verfahren erweisen sich als erfolgreich bei dem Finden von Gleichgewichten, sowohl in...
»