Benutzer: Gast  Login
Originaltitel:
Hardware Aware Robust Compression of Neural Networks
Übersetzter Titel:
Hardware-bewusste robuste Komprimierung neuronaler Netze
Autor:
Vemparala, Manoj Rohit
Jahr:
2023
Dokumenttyp:
Dissertation
Fakultät/School:
TUM School of Computation, Information and Technology
Betreuer:
Stechele, Walter (Prof. Dr.)
Gutachter:
Stechele, Walter (Prof. Dr.); Martina, Maurizio (Prof., Ph.D.)
Sprache:
en
Fachgebiet:
ELT Elektrotechnik
Stichworte:
pruning,quantization,neural networks,compression,compute complexity
TU-Systematik:
DAT 200
Kurzfassung:
Neural Networks achieve improved performance on various applications. The compute complexity of these algorithms is reduced using pruning and quantization. We use execution estimates to obtain efficient compression configurations. We simplify the compression phase by proposing in-train optimization method. We further improve the adversarial robustness of compressed networks. This work proposes compression techniques, which improve the trade-off between accuracy, robustness and hardware metrics.
Übersetzte Kurzfassung:
Neuronale Netze erzielen bei verschiedenen Anwendungen eine bessere Leistung. Die Komplexität dieser Algorithmen wird durch Pruning und Quantisierung reduziert. Wir verwenden Schätzungen zur Ausführung, um effiziente Kompressionskonfigurationen zu erhalten. Wir vereinfachen die Kompressionsphase, indem wir eine In-Train-Methode entwickeln. Wir verbessern die Robustheit der komprimierten Netze. Diese Arbeit verbessert den Kompromiss zwischen Genauigkeit, Robustheit und Hardwaremetriken.
WWW:
https://mediatum.ub.tum.de/?id=1662981
Eingereicht am:
12.07.2022
Mündliche Prüfung:
18.01.2023
Dateigröße:
19355209 bytes
Seiten:
162
Urn (Zitierfähige URL):
https://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bvb:91-diss-20230118-1662981-1-6
Letzte Änderung:
30.03.2023
 BibTeX