Diese Dissertation stellt neue Algorithmen und experimentelle Ergebnisse vor, um Deep Reinforcement Learning für das Dispatching in autonomen Mobility-on-Demand-Systemen skalierbar und robust gegen Verteilungsschocks zu machen. Erstens wird eine skalierbare Kombination von Multi-Agent Soft Actor-Critic und gewichtetem bipartitem Matching eingeführt, die zwei State-of-the-Art Benchmarks übertrifft. Zweitens wird eine risikosensitive Version von Soft Actor-Critic entwickelt, die robust gegen Verteilungsschocks ist.
«
Diese Dissertation stellt neue Algorithmen und experimentelle Ergebnisse vor, um Deep Reinforcement Learning für das Dispatching in autonomen Mobility-on-Demand-Systemen skalierbar und robust gegen Verteilungsschocks zu machen. Erstens wird eine skalierbare Kombination von Multi-Agent Soft Actor-Critic und gewichtetem bipartitem Matching eingeführt, die zwei State-of-the-Art Benchmarks übertrifft. Zweitens wird eine risikosensitive Version von Soft Actor-Critic entwickelt, die robust gegen Verte...
»