Zusammenfassung
Die n-dimensionale Eingangsstruktur eines konnektionistischen Systems zur Klassifizierung von Objekten setzt sich aus verschiedenen Quellen, wie z. B. Signalen von Temperaturmessgeräten, Weggebern, Mikrofonen, Kameras, Spektrometern oder Daten aus anderen Messgeräten zusammen. Die von diesen Sensoren gelieferten Rohdaten sind unterschiedlich strukturiert, weisen eine verschiedene Anzahl von Dimensionen auf und können parametrisiert als verbundene Werte in Paketform oder diskret vorliegen. Die Verteilung dieser Messwerte wird in der Datenvorverarbeitung analysiert. Dabei werden statistische Kennwerte ermittelt, unbrauchbare Werte entfernt und die Kennwerte im Modell M des Trainingsdatensatzes (TDS) gespeichert. Zur Anpassung der Werte an die Eingangsstruktur des Netzes kommen verschiedene Methoden zum Einsatz. Zur Bildung des Eingangsvektors sind einzelne Messwerte, spektrale Komponenten und andere Informationsquellen auch kombinierbar, um robuste charakteristische Objekteigenschaften zu bilden.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
,,Ein mit fg bandbegrenztes Signal wird vollständig durch einzelne Signalwerte beschrieben, die im Abstand \(T = \frac {1}{2 f_{g}}\) entnommen werden“, Nyquist-Shannon-Abtasttheorem [10, S. 82].
- 2.
Als Distanzfunktion lassen sich verschiedene Metriken verwenden, beispielsweise die L1-Norm (Manhattan-Distanz) oder die L2-Norm (euklidische Distanz) [4, S. 602].
- 3.
Haar-Wavelet, siehe Anhang E.
- 4.
Die Modellkomplexität wird in Verbindung mit der Wavelet-Transformation optimiert und so eingestellt, dass die in Abschn. 11.1 erörterte Generalisierungsfähigkeit gewährleistet ist. Weiterhin kann ein Objekt durch die Verwendung verschiedener Messkanäle identifiziert werden.
- 5.
- 6.
Der Nächste-Nachbarn-Bereich der Anzahl K nächster Nachbarn (K-NN) des Trainingsdatensatzes (TDS).
- 7.
Einen Überblick zu den fatalen Auswirkungen von Ausreißern auf die Rechenergebnisse statistischer Art und die Belastung der Schätzer durch Ausreißer bietet [5]. Es wird dort mit einem sogenannten Bruchpunkt erörtert, wie viele Ausreißer ein Datensatz verkraften kann und welche Maßnahmen getroffen werden müssen, um fehlerfreie Datensätze sicherzustellen.
- 8.
Bei der Berechnung der Stichprobenvarianz gilt statt σ das Formelzeichen s.
- 9.
Die in Abschn. 7.5 zur Glättung einer MF eingesetzten kubischen Splines eignen sich weit besser zur Topologieerhaltung als Polynome.
- 10.
Der Hodges-Lehmann-Schätzer ist ein robuster nichtparametrischer Schätzer für symmetrische Verteilungen, z. B. zur Schätzung des Medians von m × n Differenzen der Datenpunkte einer Verteilung [13].
- 11.
Bei der Berechnung der Stichprobenvarianz oder Berechnungen aus Teilen der Grundgesamtheit gilt statt σ das Formelzeichen s.
- 12.
Siehe dazu: Der Bruchpunkt von Schätzern, Universität der Bundeswehr [5].
- 13.
In Abschn. 12.3.4 ist die Füllwertmethode zur Glättung der MF beschrieben.
- 14.
- 15.
In der Literatur wird die Anzahl der erforderlichen Dimensionen anhand der Größe der Eigenwerte entschieden. Dieser Sachverhalt wird in Abschn. 10.7.6 erörtert.
Literatur
Andrews DF (1972) Plots of High-Dimensional Data. Biometrics 28(1):125, https://doi.org/10.2307/2528964
Backhaus K, Erichson B, Plinke W, Weiber R (2005) Multivariate Analysemethoden. 11. Auflage Springer, Berlin, Heidelberg, New York
Breuer D (2014) Abstandsmaße für die multivariate adaptive Einbettung. Masterarbeit, FernUni Hagen
Bronstein IN, Semendjajew KA, Musiol G, Mühlig H (1999) Taschenbuch der Mathematik, 4th edn. Verlag Harri Deutsch, Frankfurt am Main and Thun
Caspary W (2017) Der Bruchpunkt von Schätzern-Universität der Bundeswehr. Schriftenreihe des Instituts für Geodäsie der Universität der Bundeswehr 2012(Heft 87):39–46, URL http://www.in-dubio-pro-geo.de/index.php?file=library/entry&ID=Caspary12
Diehl JM, Kohr H (2004) Deskriptive Statistik.13. Auflage, ISBN 3-88074-110-. Verlag Dietmar Klotz, Eschborn
Faloutsos C (1996) Searching Multimedia Databases by Content. Kluwer Academic Publishers, Dordrecht
Gottwald S, Köstner H, Hullwich M (1986) Handbuch der Mathematik. VEB Bibligraphisches Institut, Leipzig
Kriegel HP, Kroger P, Schubert E, Zimek A (2011) Interpreting and Unifying Outlier Scores. In: Liu B, Liu H, Clifton CW, Washio T, Kamath C (eds) Proceedings of the 2011 SIAM International Conference on Data Mining, [Society for Industrial and Applied Mathematics], [Philadelphia, Pennsylvania], pp 13–24, https://doi.org/10.1137/1.9781611972818.2
Mildenberger O (1995) System- und Signaltheorie, 3rd edn. Friedr. Vieweg & Sohn Verlagsgesellschaft GmbH, Braunschweig, Wiesbaden
Patzelt R (1996) Elektrische Meßtechnik. Springer-Verlag, Wien, New York
Pfeifer T, Profos P (2008) Handbuch der industriellen Messtechnik. Oldenbourg Industrieverlag
Rosenkranz GK (2010) A note on the Hodges-Lehmann estimator. Pharmaceutical statistics 9(2):162–167, https://doi.org/10.1002/pst.387
Sartorius G (2009) Multivariate Adaption mit modularisierten künstlichen neuronalen Netzen: Zugl.: Hagen, Fernuniv., Fachbereich Elektrotechnik, Diss., 2009, Fortschritt-Berichte VDI Reihe 10, Informatik/Kommunikation, vol 799, als ms. gedr edn. VDI-Verl., Düsseldorf
Schäfer T, Kloke B, Hastedt T (2010) Multivariate Verfahren: Strukturgleichungsmodelle. URL https://www.tu-chemnitz.de/hsw/psychologie/professuren/method/homepages/ts/methodenlehre/SEM.pdf
Weiber R, Mühlhaus D (2014) Strukturgleichungsmodellierung. Springer Berlin Heidelberg, Berlin, Heidelberg, https://doi.org/10.1007/978-3-642-35012-2
Author information
Authors and Affiliations
Rights and permissions
Copyright information
© 2019 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature
About this chapter
Cite this chapter
Sartorius, G. (2019). Datenvorverarbeitung. In: Erfassen, Verarbeiten und Zuordnen multivariater Messgrößen. Springer Vieweg, Wiesbaden. https://doi.org/10.1007/978-3-658-23576-5_12
Download citation
DOI: https://doi.org/10.1007/978-3-658-23576-5_12
Published:
Publisher Name: Springer Vieweg, Wiesbaden
Print ISBN: 978-3-658-23575-8
Online ISBN: 978-3-658-23576-5
eBook Packages: Computer Science and Engineering (German Language)