In der vorliegenden Arbeit wird die Problematik der Filtrationsvorhersage aus informationstechnologischer Sicht, also unter Anwendung von Data Mining Verfahren, behandelt. Diese Arbeit folgt dem CRISP-DM (Cross-Industry Standard Process for Data Mining) Ansatz und basiert auf der Auswertung der historischen Daten einer Münchener Brauerei (Betriebs- und Labordaten der vergangenen 5 Jahre). Im Laufe des DM-Prozesses werden 3 Teilaufgaben bearbeitet. Als erstes ist dies die Klassifizierung und Bewertung der Filtration. Mit zwei Ansätzen, die sich in der Art der Datenreduktion der Filtrationskurven unterschieden, werden die Filtrationen der verschiedenen Biersorten der Brauerei unter-sucht, klassifiziert und bewertet, z.B. als „gut“ oder „schlecht“. Die so ge-funden Klassen werden mittels Expertenwissen validiert und es zeigt sich, dass die automatisch gefundenen und bewerteten Klassen korrekt sind. Dies verdeutlicht bereits die Eignung der angewendeten Verfahren. Die zweite Teilaufgabe stellt die Analyse der Eingangsdaten des Models dar, also der Labordaten der Filtrationsbiere. Hier geht es darum, Muster in den Daten aufzudecken, die für die dritte Teilaufgabe, die Vorhersage von Filtrationen basierend auf den Ergebnissen der ersten beiden Teilaufgaben, verwendet werden. Im Rahmen der Arbeit finden die folgenden Methoden Verwendung: Cluster Analyse, Entscheidungsbäume, künstliche Neuronale Netze, Fuzzy Logik, Erwartungs-Maximierung und Hauptkomponenten Analyse. Zur Va-lidierung der Ergebnisse und Erkenntnisse wird zum Einen die Datenmen-ge immer in Trainings- und Validierungsdaten aufgeteilt, zum Anderen werden die Ergebnisse Expertenwissen gegenübergestellt und so überprüft. Letztlich zeigt diese Arbeit die Eignung von DM-Methoden für die Analyse und Wissensgewinnung auch im Bereich der Brauereitechnologie. Die Vor-hersage von Filtrationen gelingt dabei mit einer Erfolgsrate von bis zu 80%, abhängig vom gewählten Model und der Datenaufbereitung und –reduktion. Die Variation von verschiedenen Verfahren und Datenaufberei-tungsarten zeigt, dass die Vorhersagequalität durch den Informationsge-halt der verwendeten Daten beschränkt ist. Eine weitere Steigerung der Vorhersagequalität ist nur durch eine Erweiterung der Datenbasis möglich.
«
In der vorliegenden Arbeit wird die Problematik der Filtrationsvorhersage aus informationstechnologischer Sicht, also unter Anwendung von Data Mining Verfahren, behandelt. Diese Arbeit folgt dem CRISP-DM (Cross-Industry Standard Process for Data Mining) Ansatz und basiert auf der Auswertung der historischen Daten einer Münchener Brauerei (Betriebs- und Labordaten der vergangenen 5 Jahre). Im Laufe des DM-Prozesses werden 3 Teilaufgaben bearbeitet. Als erstes ist dies die Klassifizierung und Bewe...
»