Score Matching ist ein wichtiges Verfahren zur Schätzung von Wahrscheinlichkeitsmodellen, da es die direkte Berechnung von Normalisierungskonstanten umgeht. In dieser Arbeit steht dabei eine zentrale Modellierungsentscheidung im Vordergrund: Wir parametrisieren Dichten über eine Square-Root-Darstellung (SQR), das heißt über die Quadratwurzel einer nicht normalisierten Dichte. Diese Darstellung garantiert die Nichtnegativität per Konstruktion und lässt sich mit score-basierten Zielfunktionen kombinieren, ohne Normalisierungskonstanten explizit auswerten zu müssen. Wir betrachten anschließend das Lernen aus unvollständig beobachteten Daten und beschränken uns auf zufällige Missingness-Mechanismen, insbesondere den MCAR Fall. Anstatt die vollständige Score Funktion der vollständigen Daten direkt aus partiellen Beobachtungen zu lernen, wenden wir eine marginale Score-Matching-Zielfunktion an, welche die Scores der beobachteten Komponenten über die entsprechenden log-marginalen Dichten nach Ausintegration der fehlenden Variablen anpasst. Dadurch entsteht eine Zielfunktion, die nur von beobachteten Einträgen abhängt und dennoch mit allgemein parametrisierten, SQR-basierten Modellen kompatibel bleibt. Auf Basis dieses Rahmens setzen wir zwei komplementäre Schätzverfahren um und vergleichen sie empirisch: einen importance weighted Schätzer (marginal IW score-matching) und einen variationalen Schätzer (marginal variational score matching). Für den IW-Ansatz beschreiben wir endliche Stichprobenabschätzungen unter Annahmen in beschränkten Domänen und unter Regularitätsbedingungen und beobachten eine besonders gute Leistung in niedrigdimensionalen und kleinen Stichprobenregimen. Der variationale Ansatz ist rechnerisch aufwendiger, zeigt jedoch in hochdimensionalen und komplexeren Szenarien häufig Vorteile, was sich in Experimenten zur graphischen Modellschätzung sowohl auf simulierten als auch auf realen Datensätzen widerspiegelt.
«
Score Matching ist ein wichtiges Verfahren zur Schätzung von Wahrscheinlichkeitsmodellen, da es die direkte Berechnung von Normalisierungskonstanten umgeht. In dieser Arbeit steht dabei eine zentrale Modellierungsentscheidung im Vordergrund: Wir parametrisieren Dichten über eine Square-Root-Darstellung (SQR), das heißt über die Quadratwurzel einer nicht normalisierten Dichte. Diese Darstellung garantiert die Nichtnegativität per Konstruktion und lässt sich mit score-basierten Zielfunktionen komb...
»