Groh, Georg (Prof. Dr.); Hegelich, Simon (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik
Stichworte:
Hate speech, Abusive language, Social media, Text classification, Machine learning, Explainable AI, Natural language processing
Übersetzte Stichworte:
Hassrede, Hasskommentar, Hate Speech, Social Media, Textklassifizierung, Machine Learning, Explainable AI, Natural Language Processing
TU-Systematik:
DAT 600
Kurzfassung:
A key component in the fight against hate speech and other forms of abusive language on social media is their automatic detection. However, abusive language detection has weak points. The models have a limited classification performance and generalizability and behave like black boxes, meaning their predictions are not transparent. Twelve studies were conducted to address these problems. The findings help to build more accurate, more generalizable, and explainable models.
Übersetzte Kurzfassung:
Eine Komponente im Kampf gegen Hassrede und andere Formen von beleidigender Sprache in sozialen Medien ist deren automatische Erkennung. Aber diese hat noch Schwachstellen. Die Modelle haben eine begrenzte Klassifizierungsleistung und Verallgemeinerbarkeit und verhalten sich wie Black-Boxes, d. h. Vorhersagen sind nicht nachvollziehbar. Um diese Probleme zu adressieren, wurden 12 Studien durchgeführt. Die Resultate helfen dabei, bessere, verallgemeinerbare und erklärbare Modelle zu entwickeln.