Multivariate Statistik (Lehr- und Handbücher der Statistik) - Hardcover

Schlittgen, Rainer

 
9783486585957: Multivariate Statistik (Lehr- und Handbücher der Statistik)

Inhaltsangabe

Neben dem Standardkanon der wichtigen multivariaten Verfahren (Diskriminanzanalyse, Hauptkomponentenanalyse, Clusteranalyse, MDS, Faktorenanalyse, LISREL) werden in diesem Buch auch die vor allem im Marketing relevante Conjointanalyse und die PLS-Methode dargestellt. Weiterhin werden robuste Verfahren, aber auch explorative Ansätze wie das Porjection Persuit sowie Ansätze zur Behandlung von fehlenden Werten berücksichtigt. Als drittes werden auch Methoden für kategoriale Daten behandelt, die in den meisten Texten zur multivariaten Statistik noch immer eine zu geringe Beachtung erfahren. Das Augenmerk wurde im Buch durchgängig auf die Verständlichkeit der Inhalte gerichtet. Hierzu dienen die Ausführung geometrischer Konzepte und zahlreiche Beispiele.

Die Inhaltsangabe kann sich auf eine andere Ausgabe dieses Titels beziehen.

Über die Autorin bzw. den Autor

Nach seiner Habilitation im Fach Statistik an der FU Berlin war er drei Jahre in verschiedenen Firmen und Einrichtungen tätig; dazu gehörten die GfK in Nürnberg und die BfA. Seit 1983 ist er Professor für Statistik, zunächst an der Universität Essen, seit 1990 an der Universität Hamburg. Schwerpunkte seiner Forschungs- und Lehrtätigkeit bilden die Zeitreihenanalyse und multivariate statistische Verfahren. Er war an zahlreichen Anwendungsprojekten beteiligt. Zu angewandten statistischen Methoden hat Professor Schlittgen etwa 50 Artikel in wissenschatlichen Zeitschriften veröffentlicht. Aus seinen Lehrveranstaltungen und Kursen für Praktiker sind etliche Lehrbücher entstanden.

Auszug. © Genehmigter Nachdruck. Alle Rechte vorbehalten.

Teil I Daten und ihre Beschreibung (S. 1)

1 Einführung

1.1 Fragestellungen

In den Beobachtungswissenschaften wie Psychologie, Sozial- und Wirtschaftswissenschaften ist es eher die Regel, dass Daten in multivariater Form anfallen. Nur ausnahmsweise werden Untersuchungen mit lediglich einer Variablen durchgeführt. Der bei Benninghaus (1991) auszugsweise angegebene Fragebogen zu Merkmale und Auswirkung beruflicher Tätigkeit 1993 hat zum Beispiel 175 einzelne Fragen, die zuentsprechend vielen Variablen führen. Auch in den Naturwissenschaften werden bei großen Untersuchungen meist die Werte von mehr als einer Variablen gemessen bzw. erfasst.

Die statistischen Methoden zur Analyse solcher Daten werden unter dem Sammelbegriff multivariate statistische Methoden geführt. Es ist einsichtig, dass die Fragestellungen bei so vielen Variablen sehr verschieden sein können. Dementsprechend ist die multivariate Statistik kein einheitliches, gut zu strukturierendes Gebiet. Um dies zu verdeutlichen, seien einige charakteristische Fragestellungen betrachtet.

Beispiel 1.1.1 Seekrankheit

In einer Untersuchung zur Seekrankheit wurdeauf 22 Überfahrten einer Fähre die durchschnittliche Schiffsbewegung sowie die Befindlichkeit der Passagiere ermittelt, vgl. Lawther &,Grif.n (1986). Die Bewegungsvariablen sind in der Abbildung 1.1.1 illustriert.

Die Befindlichkeitsvariablen wurden einmal mittels einer so genannten Rating-Skala erhoben und dann wurde der Anteil der Passagiere festgehalten, die sich erbrechenmussten. Zudemwurde die Fahrtdauer notiert. Genauer wurden folgende Variablen erhoben:

X1 = Beschleunigung in Längsrichtung

X6 = Gieren (Schwanken)

X2 = Beschleunigung in Querrichtung

X7 = Anzahl der Passagiere

X3 = Beschleunigung in Höhenrichtung

X8 = Dauer

X4 = Rollen

X9 = Krankheitsrating

X5 = Stampfen

X10 = Erbrechen ( % )

Hier interessiert natürlich, wie stark die beiden Befindlichkeitsvariablen von den einzelnen Bewegungsvariablen und von der Fahrtdauer abhängen. Dies ist eine Frage der multivariatenmultiplen Regression.

Weiter wird man wissen wollen, wie die verschiedenen Bewegungsrichtungen zusammenhängen. Das legt zunächst einmal eine Exploration der gemeinsamen Verteilungen der Bewegungskomponenten nahe. Weitergehend kann man untersuchen, ob es Gruppen von Bewegungsvariablen gibt, die weitgehend das Gleiche messen. Dazu bietet sich eine Faktorenanalyse an.

Beispiel 1.1.2 Cheddar-Käse

Während ein Käse reift, finden verschiedene chemische Prozesse statt, die den Geschmack des abschließenden Produktes bestimmen. Dieser Datensatz enthält Konzentrationen der verschiedenen Chemikalien in 30 Proben gereiften Cheddar-Käse sowie Geschmack, ein subjektives Maß des Geschmacks für jede Probe. Letzteres wurde über eine Kombination der Scores einiger Verkoster bestimmt.

Die Variablen Essig und H2S sind logarithmisch transformierte Werte der Konzentration der Essigsäure beziehungsweise des Wasserstoffsulfads. Die Variable Lactat ist nicht transformiert worden. Die Daten stamen aus Moore &, McCabe (1993).

Beispiel 1.1.7 Verkauf von Rosen

Eine Reisegewerblerin für das Feilbieten von Blumen und kunstgewerblichen Gegenständen will anhand ihrer bisherigen Erfahrungen ihreweitere Tätigkeit planen. Verkauft hatte sie bisher ausschließlich Baccara-Rosen in vier Speiserestaurants an drei Wochentagen. Sie besuchte die Lokale jeweils zweimal.

Festgehalten wurde außerdem, wie die Wetterbedingungen gewesen waren und ob der Verkauf in den einzelnen Restaurants zufriedenstellend verlaufen war, d.h. ob mehr als zwei Rosen pro Besuch verkauft worden waren. Die Datenmatrix umfasst 192 Abende, siehe Recke (1979). Von Interesse ist hier erstens, die Daten in übersichtlicher Form darzust

„Über diesen Titel“ kann sich auf eine andere Ausgabe dieses Titels beziehen.