Finite sample identification of artificial neural networks
Translated title:
Identifizierung künstlicher neuronaler Netzwerke anhand einer finiten Anzahl von Stichproben
Author:
Rauchensteiner, Michael
Year:
2024
Document type:
Dissertation
Faculty/School:
TUM School of Computation, Information and Technology
Advisor:
Fornasier, Massimo (Prof. Dr.)
Referee:
Fornasier, Massimo (Prof. Dr.); Vybiral, Jan (Prof. Dr.); Balan, Radu Victor (Prof. Dr.)
Language:
en
Subject group:
MAT Mathematik
TUM classification:
MAT 650; MAT 490
Abstract:
This dissertation considers neural network identifiability, i.e., the retrieval of network parameters, by constructive methods using only network probes. We present an end-to-end recovery pipeline that provably retrieves the parameters of wide shallow networks with smooth and non-polynomial activations. Furthermore, relying on entangled weights, which generalize ordinary weights, enables us to encode weight information in network derivatives making our pipeline applicable to deep networks.
Translated abstract:
Wir befassen uns mit der effizienten und konstruktiven Parameteridentifizierung von künstlichen neuronalen Netzwerken anhand von wenigen Netzwerkauswertungen. Die präsentierten Algorithmen rekonstruieren die Parameter von weiten zweischichtigen Netzwerken mit nicht-polynomischen Aktivierungsfunktionen. Außerdem behandeln wir die Rekonstruktion von tiefen neuronalen Netzwerken basierend auf generalisierten Gewichten, welche sich in Hesse-Matrizen des Netzwerks einbetten lassen.