Benutzer: Gast  Login
Originaltitel:
Neural Network Architectures and Activation Functions: A Gaussian Process Approach
Übersetzter Titel:
Architekturen und Aktivierungsfunktionen für Neuronale Netzwerke: Ein Gauß-Prozess Ansatz
Autor:
Urban, Sebastian
Jahr:
2018
Dokumenttyp:
Dissertation
Fakultät/School:
Fakultät für Informatik
Betreuer:
van der Smagt, Patrick (Prof. Dr.)
Gutachter:
van der Smagt, Patrick (Prof. Dr.); Cremers, Daniel (Prof. Dr.); Bischl, Bernd (Prof. Dr.)
Sprache:
en
Fachgebiet:
DAT Datenverarbeitung, Informatik; INF Informationswesen, Bibliotheks-, Dokumentations-, Archiv-, Museumswesen; MAT Mathematik
Stichworte:
artificial neural network, ann, activation function, transfer function, gaussian process, gp, gpn, multiplicative interaction, addiplication, bayesian inference, variational inference, tensor algebra differentiation, tensor derivative, gaussian process neuron
Übersetzte Stichworte:
künstliches neuronales Netzwerk, Aktivierungsfunktion, Transferfunktion, Gauß-Prozess, Gauß-Prozess Neuron, GP, GPN, multiplikative Interaktion, Addiplication, Bayessche Inferenz, Variationsrechnung, Tensoralgebra Ableitung
TU-Systematik:
DAT 708d; DAT 815d
Kurzfassung:
For neural networks we propose stochastic, non-parametric activation functions that are fully learnable and individual to each neuron. Overfitting is prevented by placing a Gaussian process prior over these functions. The model can handle uncertainties in its inputs and self-estimate the confidence of its predictions. Using variational inference and the central limit theorem, a deterministic objective is derived, allowing it to be trained as efficiently as a conventional neural network using...     »
Übersetzte Kurzfassung:
Für neuronale Netze führen wir stochastische, parameterfreie Aktivierungsfunktionen ein, die lernbar und jedem Neuron individuell sind. Überanpassung wird durch Verwendung einer Gauß-Prozess a-priori-Wahrscheinlichkeitsverteilung verhindert. Das Model kann mit Unsicherheiten in seinen Eingaben umgehen und schätzt die Zuverlässigkeit seiner Vorhersagen. Durch Verwendung von Variationsrechnung und dem zentralen Grenzwertsatz wird eine deterministische Zielfunktion hergeleitet, die es erlaubt da...     »
WWW:
https://mediatum.ub.tum.de/?id=1402689
Eingereicht am:
22.11.2017
Mündliche Prüfung:
20.06.2018
Dateigröße:
5368513 bytes
Seiten:
228
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20180620-1402689-1-6
Letzte Änderung:
28.06.2018
 BibTeX