Robuste Varianzanalyse mit M-Schätzern und multiple Vertrauensintervalle für alle paarweisen Differenzen der Effekte

Bachmaier, Martin

1994_Bachmaier,_Martin_Dissertation.pdf

Wenn Sie Schwierigkeiten haben, das Dokument zu öffnen, versuchen Sie auch bitte diesen Link

Format:: Text
Fachgebiet:: LAN Landbauwissenschaft; MAT Mathematik
Letzte Änderung:: 06.07.2018
Betreuer:: Prof. Dr. M. Precht
Eingereicht am:: 23.11.1993
Homepage des Autors:: Lehrstuhl für Agrarsystemtechnik
WWW:: https://mediatum.ub.tum.de/?id=1448520
Herkunft (Landtechnik):: Lehrstuhl für Landtechnik / Archiv
Schlagworte (Landtechnik):: Statistik; Datenerfassung; Datenverarbeitung; Datenauswertung; Biomasse; Dissertation
Kurzfassung:: Die klassische Varianzanalyse, die im wesentlichen auf der Berechnung von Mittelwerten beruht, kann gewaltig an Macht verlieren, wenn die Verteilung der Residuen längere Schwänze hat als die der Normalverteilung. Ein Schätzer ϑ für den Lokationsparameter, der die Gleichung Ei=1 .,P(xi- J) = 0 löst, wird M-Schätzer genannt. Dieser Name kommt von Maximum-Likelihood-Schätzer, da es in der Regel eine Verteilung gibt, für die der M-Schätzer auch Maximum-Likelihood-Schätzer ist. Mit P(x) = x gehört auch der Mittelwert zur Klasse der M-Schätzer. Wählt man nun im Gegensatz zur P-Funktion des Mittelwerts die Funktion P beschränkt, haben Ausreißer nur noch begrenzten Einfluß auf den Schätzer und somit auch auf den Wert der Testgröße zur Varianzanalyse, weswegen man auch von B-robusten (B = bias = Verzerrung) Schätzern und allgemein von robuster Varianzanalyse spricht. In der vorliegenden Arbeit sowie im Programm M wird eine beschränkte Funktion gemäß 2.2.30 verwendet, die bis auf die Glättung beim Übergang auf die Horizontale einem sog. HUBER-Schätzer gleicht. Dieser Schätzer wird nach HUBER TH genannt. Nach Diskussion einiger Robustheitsmaße (Gross-Error-Sensitivity, Local-Shift-Sensitivity, RejectionPoint, Breakdown-Point) und asymptotischer Verteilung dieses und anderer M-Schätzer wird die absolute asymptotische RAO-CRAMER-Effizienz von TH mit der des Mittelwerts und des Medians bei t-Verteilungen verglichen. Hier stellt sich heraus, daß TH dem Mittelwert schon bei t-Verteilungen ab 16 Freiheitsgraden abwärts überlegen ist und dem Median nur bei der praktisch irrelevanten CAUCHY-Verteilung unterliegt, ansonsten weit überlegen ist. Vor allem aber überrascht die extrem hohe asymptotische RAO-CRAMER-Effizienz dieses Schätzers, die bei allen t-Verteilungen mit ca. 4t - 10 Freiheitsgraden über 99% liegt! Und gerade diese Verteilungen umfassen die Verteilungen, mit denen nach JEFFREYS (1961) empirische Daten unter homogenen Bedingungen angepaßt werden können. Ähnliche Robustheits- und Effizienzbetrachtungen bezüglich des Skalenschätzers führen ebenfalls zur Wahl eines M-Schätzers für den Dispersionsparameter. Mit Hilfe dieser M-Schätzer werden dann Testgrößen zur robusten Varianzanalyse konstruiert, die asymptotisch x2-verteilt sind. Zum einen wird eine Maximum-Likelihood-Quotienten- Testsgröße FM verwendet, deren x2-Verteilung praktisch ohne wesentliche Voraussetzungen von SCHRADER und HETTMANSPERGER bewiesen wurde, und zum anderen eine Testgröße QM- in der Gestalt einer quadratischen Form, deren x2- Verteilung aus HUBERs Theorie über die asymptotische Normalverteilung von M-Schätzern folgt. Beide Testgrößen sind asymptotisch äquivalent und werden wie Fv1 ,~~2 -verteilte Zufallsvariablen behandelt, obwohl dies nur asymptotisch gesichert ist. Die Überprüfung des Niveaus und der Macht für "endliche" Stichprobenumfänge geschieht mittels Monte-Carlo-Analysen auf dem nominalen 0.1-, 1-, 5- und 10-Prozent-Niveau vor allem bei t-Verteilungen. Beide Testgrößen halten das Niveau in der Regel recht gut und sind bei t-Verteilungen mit weniger Freiheitsgraden (ca. ab 10 abwärts) wesentlich mächtiger als die klassische Analyse. Auch die verteilungsfreie Varianzanalyse hat bis auf gewisse Ausnahmefälle (z.B. Standard-Lognormalverteilung) geringere Macht als FM und Q:M. Asymptotisch kann die hohe Überlegenheit der Varianzanalyse mittels FM und Q:M gegenüber der klassischen bei Fehlerverteilungen mit etwas längeren Schwänzen aus dem Verhältnis der RAOCRAMER- Effizienzen dieser Schätzer zueinander gefolgert werden, welches sich auf die relative PITMAN-Effizienz der beiden Testgrößen zueinander überträgt. Für die Praxis sehr wichtig sind Konfidenzintervalle für Kontraste (Differenz von Effekten). Es werden mit Hilfe der Testgrößen FM und Q:M individuelle und auch multiple Konfidenzintervalle nach TUKEY berechnet, und zwar bei der zweifaktoriellen Varianzanalyse nicht nur im Modell ohne Wechselwirkung, sondern auch im Modell mit Interaktion durch paarweisen Vergleich entweder aller Zellen oder der Zellen innerhalb einer bestimmten Stufe des anderen Faktors, der auch auf alle Stufen des anderen Faktors multipel erweitert wird. Niveau und durchschnittliche Länge der Konfidenzintervalle werden ebenfalls mittels Monte-Carlo-Verfahren untersucht und mit der klassischen Analyse verglichen. Die resultierenden Graphiken zeigen auch deutlich, um wie viel die klassischen Vertrauensintervalle bei Verteilungen mit längeren Schwänzen als denen der Normalverteilung im Mittellänger werden können als die mittels der Testgrößen FM und Q:M gemäß dem Dualitätszprinzip zwischen Testen und Schätzen gewonnenen. An einem Beispiel über die rechtsschief verteilte stomatäre Leitfähigkeit junger Fichten wird die kürzere Länge von Vertrauensintervallen mittels der robusten Testgrößen gegenüber den klassischen Vertrauensintervallen demonstriert. Dann folgt ein Beispiel über die Staubemission bei der Verbrennung von Biomasse, wo keine Ausreißer erkennbar sind und die Daten auch nicht den Eindruck erwecken, als entstammten sie keiner Normalverteilung. Es stellen sich dann auch keine großen Unterschiede zwischen klassischer und robuster Varianzanalyse heraus. Am Beispiel über die stark unterschiedlich streuende CO-Emissionsdaten bei der Verbrennung von Biomasse wird dann die hohe Liberalität der robusten Testgrößen bei heterogenen Skalenparametern aufgedeckt, die Anlaß zur Entwicklung einer Varianzanalyse gibt, die auch gegenüber heterogenen Skalenparametern robust und möglichst effizient ist, ohne das geforderte Signifikanzniveau zu überschreiten. «
Die klassische Varianzanalyse, die im wesentlichen auf der Berechnung von Mittelwerten beruht, kann gewaltig an Macht verlieren, wenn die Verteilung der Residuen längere Schwänze hat als die der Normalverteilung. Ein Schätzer ϑ für den Lokationsparameter, der die Gleichung Ei=1 .,P(xi- J) = 0 löst, wird M-Schätzer genannt. Dieser Name kommt von Maximum-Likelihood-Schätzer, da es in der Regel eine Verteilung gibt, für die der M-Schätzer auch Maximum-Likelihood-Schätzer ist. Mit P(x) = x gehört a... »
Dateigröße:: 30622361 bytes
Universität:: Technische Universität München
Sprache:: de
Institution:: Fakultät Wissenschaftszentrum Weihenstephan
Autor:: Bachmaier, Martin
Originaltitel:: Robuste Varianzanalyse mit M-Schätzern und multiple Vertrauensintervalle für alle paarweisen Differenzen der Effekte
Dokumenttyp:: Dissertation
Seiten:: 98
Gutachter:: Prof. Dr. M. Precht; Prof. Dr. K.-W. Gaede
Informationen zum Autor:: Bei Interesse an dieser Arbeit zur ausschließlich wissenschaftlichen Nutzung wenden Sie sich bitte an den Lehrstuhl
Jahr:: 1994
Publikationsort:: Freising-Weihenstephan

BibTeX

Vorkommen:

mediaTUM Gesamtbestand Sammlungen Agrartechnik digital AgTecCollection - Bilder und Schriften Landtechnik Schriften Forschung & Lehre Dissertationen