Score Matching with Missing Data for Graphical Models

Wei Peng

Benutzer: Gast

Wenn Sie Schwierigkeiten haben, das Dokument zu öffnen, versuchen Sie auch bitte diesen Link

Dokumenttyp:: Masterarbeit
Autor(en):: Wei Peng
Titel:: Score Matching with Missing Data for Graphical Models
Titelzusatz:: Based on Regime Switching Models and Copulas
Abstract:: Score matching is an important method for estimating probabilistic models, as it circumvents the direct computation of normalization constants. In this work, a central modeling decision is the parametrization of densities via a square root representation (SQR), that is, through the square root of an unnormalized density. This representation guarantees non-negativity by construction and can be combined with score-based objective functions without requiring explicit evaluation of normalization constants. We then consider learning from partially observed data and restrict attention to random missingness mechanisms, in particular the MCAR case. Instead of attempting to learn the full-data score function directly from partial observations, we adopt a marginal score matching objective that matches the scores of the observed components with respect to the corresponding log-marginal densities obtained after integrating out the missing variables. This yields an objective function that depends only on observed entries while remaining compatible with generally parametrized, SQR-based score models. Within this framework, we implement and empirically compare two complementary estimation procedures: an importance-weighted estimator (marginal importance-weighted score matching) and a variational estimator (marginal variational score matching). For the importance-weighted approach, we derive finite-sample bounds under assumptions on bounded domains and suitable regularity conditions and observe particularly strong performance in low-dimensional and small-sample regimes. The variational approach is computationally more demanding but often demonstrates advantages in high-dimensional and more complex scenarios, as reflected in experiments on graphical model estimation using both simulated and real-world datasets. «
Score matching is an important method for estimating probabilistic models, as it circumvents the direct computation of normalization constants. In this work, a central modeling decision is the parametrization of densities via a square root representation (SQR), that is, through the square root of an unnormalized density. This representation guarantees non-negativity by construction and can be combined with score-based objective functions without requiring explicit evaluation of normalization con... »
übersetzter Abstract:: Score Matching ist ein wichtiges Verfahren zur Schätzung von Wahrscheinlichkeitsmodellen, da es die direkte Berechnung von Normalisierungskonstanten umgeht. In dieser Arbeit steht dabei eine zentrale Modellierungsentscheidung im Vordergrund: Wir parametrisieren Dichten über eine Square-Root-Darstellung (SQR), das heißt über die Quadratwurzel einer nicht normalisierten Dichte. Diese Darstellung garantiert die Nichtnegativität per Konstruktion und lässt sich mit score-basierten Zielfunktionen kombinieren, ohne Normalisierungskonstanten explizit auswerten zu müssen. Wir betrachten anschließend das Lernen aus unvollständig beobachteten Daten und beschränken uns auf zufällige Missingness-Mechanismen, insbesondere den MCAR Fall. Anstatt die vollständige Score Funktion der vollständigen Daten direkt aus partiellen Beobachtungen zu lernen, wenden wir eine marginale Score-Matching-Zielfunktion an, welche die Scores der beobachteten Komponenten über die entsprechenden log-marginalen Dichten nach Ausintegration der fehlenden Variablen anpasst. Dadurch entsteht eine Zielfunktion, die nur von beobachteten Einträgen abhängt und dennoch mit allgemein parametrisierten, SQR-basierten Modellen kompatibel bleibt. Auf Basis dieses Rahmens setzen wir zwei komplementäre Schätzverfahren um und vergleichen sie empirisch: einen importance weighted Schätzer (marginal IW score-matching) und einen variationalen Schätzer (marginal variational score matching). Für den IW-Ansatz beschreiben wir endliche Stichprobenabschätzungen unter Annahmen in beschränkten Domänen und unter Regularitätsbedingungen und beobachten eine besonders gute Leistung in niedrigdimensionalen und kleinen Stichprobenregimen. Der variationale Ansatz ist rechnerisch aufwendiger, zeigt jedoch in hochdimensionalen und komplexeren Szenarien häufig Vorteile, was sich in Experimenten zur graphischen Modellschätzung sowohl auf simulierten als auch auf realen Datensätzen widerspiegelt. «
Score Matching ist ein wichtiges Verfahren zur Schätzung von Wahrscheinlichkeitsmodellen, da es die direkte Berechnung von Normalisierungskonstanten umgeht. In dieser Arbeit steht dabei eine zentrale Modellierungsentscheidung im Vordergrund: Wir parametrisieren Dichten über eine Square-Root-Darstellung (SQR), das heißt über die Quadratwurzel einer nicht normalisierten Dichte. Diese Darstellung garantiert die Nichtnegativität per Konstruktion und lässt sich mit score-basierten Zielfunktionen komb... »
Stichworte:: Financial time series, ARMA-GARCH, Hidden Markov model, Copula
Fachgebiet:: MAT Mathematik
DDC:: 510 Mathematik
Aufgabensteller:: Mathias Drton
Betreuer:: Richard Schwank
Jahr:: 2026
Quartal:: 1. Quartal
Jahr / Monat:: 2026-02
Monat:: Feb
Seiten/Umfang:: 68
Sprache:: en
Hochschule / Universität:: Technische Universität München
Fakultät:: TUM School of Computation, Information and Technology
TUM Einrichtung:: Statistics Research Group
Format:: Text
Annahmedatum:: 15.02.2026
BibTeX