Auszug
Das theoretische und konzeptionelle Fundament der Arbeit wurde in Kapitel 3 gelegt. Dieses Kapitel widmet sich nunmehr den empirischen Grundlagen. Zunächst wird dazu eine Bestandsaufnahme einschlägiger empirischer Untersuchungen vorgenommen. Es wird dabei geprüft, welche Erkenntnisse die vorliegenden empirischen Untersuchungen für das Forschungsprojekt zum einen hinsichtlich der Operationalisierung des Involvement-Konstruktes und zum anderen hinsichtlich der Wirkung von Involvement (bzw. seiner unterschiedlichen Facetten) auf die Kundenbindung liefern können. Dabei werden Beiträge berücksichtigt, die den Einfluss von Involvement auf die Kundenbindung empirisch-quantitativ überprüfen. Zudem werden auch Beiträge betrachtet, die sich mit inhaltlich verwandten Konstrukten auseinander setzen.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Es existieren bereits zahlreiche Veröffentlichungen, die einen umfassenden Überblick über empirische Studien im Bereich der Kundenbindungsforschung bieten. Vgl. Bakay (2003), S. 23–32; Braunstein (2001), S. 91–93; Giering (2000), S. 20–29; Krafft (1999a), S. 528; Krafft (2007), S. 54-61; Peter (1999), S. 364–373; Verhoef (2003), S. 32.
Vgl. dazu auch Abschnitt 2.3.3 der vorliegenden Arbeit.
Es sei an dieser Stelle kurz die hier vorgenommene Unterscheidung zwischen einer Variablen mit einem indirekten Einfluss (IE) und einem Moderator (M) erklärt: Wird die Wirkung einer exogenen Variablen auf die endogene Zielvariable durch eine oder mehrere Variablen vermittelt, so spricht man von einem indirekten Einfluss der exogenen Variablen. Bestimmt dagegen eine Variable die Starke des Wirkzusammenhangs zwischen einer exogenen und einer endogenen Variablen, so spricht man von einem moderierenden Effekt. Die Variable wird entsprechend als Moderator bezeichnet. Vgl. dazu auch die ausführlichen Erläuterungen in Eggert/Fassott/Helm (2005), S. 102.
Vgl. exemplarisch Homburg/Giering (2001), S. 52. Involvement, genauer lediglich die Wichtigkeit bzw. Bedeutung eines Produktes fur die Person, wird dort als Moderator berücksichtigt. Als Quelle der zwei verwendeten (und nicht offen gelegten) Indikatoren werden Expertengespräche und ein Literaturstudium angegeben.
Vgl. exemplarisch Berens/van Riel/van Bruggen (2005), S. 41. Involvement weist in dieser Untersuchung einen moderierenden Charakter auf. Die Operationalisierung fußt auf der Skala von Jain/Srinivasan. Genauer gesagt beschrankt sich die Operationalisierung auf eine der fünf Facetten. Von den drei Originalindikatoren verwenden die Autoren lediglich zwei. Es findet somit eine „doppelte “ Reduktion statt.
Vgl. exemplarisch Seiders et al. (2005), S. 41. Die Autoren berichten, dass sie bei der Operationalisierung ihres Involvement-Konstruktes (Moderator) auf die Skala von Beatty/Talpade zurückgreifen. Diese Skala besteht aus vier Indikatoren (alle bezogen auf die Wichtigkeit), wohingegen Seiders et al. lediglich drei Indikatoren verwenden. Laut Beatty/Talpade basiert ihre Skala wiederum auf den Arbeiten von Bloch (1981) und Mittal/Lee (1988). Vgl. dazu Beatty/Talpade (1994), S. 336; Bloch (1981); Mittal/Lee (1988).
Zu dieser Gruppe zählen alle drei Beiträge, die Involvement lediglich als eine moderierende Variable in das Modell integrieren.
Vgl. dazu die Arbeiten von Laurent/Kapferer (1985) und Jain/Srinivasan (1990). Es sei hier auch auf Abschnitt 4.2.2.3 der vorliegenden Arbeit verwiesen, in welchem der Operationalisierungsansatz entwickelt wird.
Vgl. Bakay (2003).
Vgl. Bauer/Huber/Bräutigam (1997); Jeker (2002).
Vgl. exemplarisch die Beiträge von Bloemer/Ruyter (1999) und Quester/Lim (2003).
Bohrnstedt (1970), S. 80.
Ähnlich Fassott/Eggert (2005), S. 33; Heeler/Ray (1972), S. 361; Jarvis/MacKenzie/Podsakoff (2003), S. 199; Steenkamp/Van Trijp (1991), S. 283.
Vgl. die Abschnitte 3.2, 3.3 und 3.4 der vorliegenden Arbeit.
So fordert Diller eine Erhärtung vorliegender Modelle und Modellvariablen, anstatt immer neue Konstrukte mit neuen Messansätzen zu verwenden. Vgl. Diller (2004a), S. 177.
Vgl. Wold (1989), S. VIII.
Vgl. u. a. Anderson/Gerbing (1982), S. 453; Churchill (1979), S. 64; Diller (2004a), S. 177; Fassott/Eggert(2005), S. 32. Defizite bei der Operationalisierung sind die logische Konsequenz der fehlenden sorgfältigen Auseinandersetzung mit Messmodellen. Vgl. zu den Defiziten stellvertretend die Metaanalysen von Homburg/Baumgartner (1995) und Jarvis/MacKenzie/Podsakoff (2003).
Vgl. Eggert/Fassott (2003), S. 2; Fassott (2005), S. 24.
Vgl. Homburg/Giering (1996), S. 6.
Vgl. Churchill (1979), S. 66 f.; Jacoby (1978), S. 93.
Vgl. Homburg/Giering (1996), S. 6.
Vgl. Backhaus et al. (2003), S. 265.
Anderson/Gerbing/Hunter (1987), S. 432.
Vgl. Homburg/Giering (1996), S. 22, Anmerkung 5.
Vgl. Backhaus et al. (2003), S. 4.
Vgl. u. a. Berekoven/Eckert/Ellenrieder (2001), S. 86-89.
Vgl. Berekoven/Eckert/Ellenrieder (2001), S. 86; Nieschlag/Dichtl/Hörschgen (1994), S. 724.
Vgl. Berekoven/Eckert/Ellenrieder (2001), S. 87.
Vgl. Nunnally (1967), S. 217. So ist bspw. eine Uhr, für die der Tag mal 24 Stunden und mal 25 Stunden hat, kein reliables Messinstrument.
Vgl. Hildebrandt (1998), S. 88; Peter (1979), S. 6.
Vgl. Hildebrandt (1998), S. 89; Peter (1979), S. 6.
Vgl. Heeler/Ray (1972), S. 361. So ist bspw. eine Uhr, die nicht die Uhrzeit, sondern die Temperatur anzeigt, kein valides Messinstrument.
Vgl. dazu auch die Ausführungen in Berekoven/Eckert/Ellenrieder (2001), S. 89; Nunnally (1967), S. 217; Peter (1979), S. 6.
Vgl. Hammann/Erichson (2000), S. 96.
Vgl. Blalock (1972), S. 163 f.
Nach welchen Regeln diese Beziehung festzulegen ist, wurde in der Vergangenheit wenig beachtet. Vgl. Bagozzi (1998), S. 52 f; Jarvis/MacKenzie/Podsakoff (2003).
Vgl. Hulland (1999), S. 201.
Vgl. Götz/Liehr-Gobbers (2004a), S. 718. In der Literatur sind unterschiedliche Fragenkataloge zur Beurteilung von Messmodellen entwickelt worden. Vgl. dazu Eberl (2004), S. 16; Fassott/Eggert (2005), S. 43; Jarvis/MacKenzie/Podsakoff (2003), S. 203. Die Entscheidung konzentriert sich jedoch insbesondere auf die Frage nach der kausalen Richtung zwischen Indikator und latenter Variablen. Vgl. Gotz/Liehr-Gobbers (2004a), S. 718 und Herrmann/Huber/Kressmann (2004), S. 13 f.
Vgl. Fornell (1989), S. 163.
Vgl. stellvertretend Eggert/Fassott (2003), S. 9-12; Jarvis/MacKenzie/Podsakoff (2003), S. 206 f.
Vgl. Eberl (2004), S. 21-24; Eggert/Fassott (2003); Jarvis/MacKenzie/Podsakoff (2003).
Vgl. Albers/Hildebrandt(2006), S. 11.
Albers/Hildebrandt(2006), S. 25.
Vgl. dazu Diamantopoulos (1999), S. 445–448.
Vgl. dazu Backhaus et al. (2003), S. 354–359.
Statt von reflektiven Messmodellen sprechen insbesondere Wissenschaftler mit statistischem Hintergrund von Modus A (Mode A). Vgl. Betzin/Henseler (2005), S. 65; Chin (1998), S. 305; Guinot/Latreille/Tenenhaus (2001), S. 248 f.; Tenenhaus et al. (2004), S. 168 f.
Vgl. Chin (1998), S. 305. Das Beispiel der Trunkheit soll auch hier den beschriebenen Zusammenhang verdeutlichen: Verstarkt sich die Trunkenheit, so hat dies direkten Einfluss sowohl auf die Sprachprobleme als auch auf die Aufnahmefahigkeit etc.
Vgl. Bollen/Lennox (1991), S. 308.
Es sei drauf hingewiesen, dass in der Literatur die Begriffe Folgeindikatoren oder Effektindikatoren (Effect Indicators) synonym zu reflektiven Indikatoren verwendet werden, weil sie eine Konsequenz des Konstruktes darstellen. Vgl. Bollen/Lennox (1991), S. 305 f; Diamantopoulos (1999), S. 445; Diamantopoulos/Winklhofer (2001), S. 269; Krafft (1999b), S. 124.
Vgl. Chatelin/Vinzi/Tenenhaus (2002), S. 5.
Vgl. Chatelin/Vinzi/Tenenhaus (2002), S. 6.
Vgl. Götz/Liehr-Gobbers (2004a), S. 718.
Vgl. Götz/Liehr-Gobbers (2004b), S. 12 f.
Vgl. Götz/Liehr-Gobbers (2004b), S. 12 f.; Krafft/Götz/Liehr-Gobbers (2005), S. 73.
Vgl. Eggert/Fassott (2003), S. 4.
Vgl. Krafft/Haase/Siegel (2003), S. 102.
Vgl. Chin (1998), S. 306.
Der Analogie zu den reflektiven Messmodellen entsprechend sei auch hier erwähnt, dass Wissenschaftler statt von einem formativen Messmodell auch von Modus B (Mode B) sprechen. Vgl. Betzin/Henseler (2005), S. 65; Chin (1998), S. 305.
Formative Indikatoren werden aus diesem Grund auch häufig verursachende Indikatoren (Cause Indicators) oder konstituierende Indikatoren genannt. Vgl. Bollen/Lennox (1991), S. 305 f.; Diamantopoulos (1999), S. 445; Diamantopoulos/Winklhofer (2001), S. 269; Götz (2004); Krafft (1999b), S. 124.
Vgl. Fassott/Eggert (2005), S. 4. Dieser Zusammenhang sei auch hier wieder am Beispiel der Trunkenheit verdeutlicht: Wenn sich der Bierkonsum erhöht, wirkt sich dies auf die Trunkenheit, nicht jedoch zwingend auf den Weinkonsum oder auf den Konsum anderer Alkoholika aus.
Vgl. Chin (1998), S. 306; Fornell/Larcker (1981), S. 46; Krafft (1999b), S. 124. Valide formative Indikatoren können alle möglichen Korrelationsformen (positiv oder negativ korreliert oder nichtkorreliert) aufweisen. Vgl. Bollen/Lennox (1991), S. 307; Diamantopoulos/Winklhofer (2001), S. 271; Götz/Liehr-Gobbers (2004b), S. 19; Helm (2005), S. 244.
Vgl. dazu ausführlich Backhaus et al. (2003), S. 88–91.
Vgl. Tenenhaus et al. (2004), S. 168.
Vgl. Backhaus et al. (2003), S. 88; Diamantopoulos/Winklhofer (2001), S. 271.
Vgl. Müller (2004), S. 189.
Vgl. Bollen/Lennox (1991), S. 308; Diamantopoulos (1999), S. 447.
Vgl. Rossiter (2002), S. 308.
Vgl. Rossiter (2002), S. 308.
Vgl. Diamantopoulos (1999), S. 445; Diamantopoulos/Winklhofer (2001), insbesondere S. 271.
Vgl. Götz/Liehr-Gobbers (2004b), S. 15 f.
Vgl. Bollen/Lennox (1991), S. 306; Chatelin/Vinzi/Tenenhaus (2002), S. 5.
Vgl. Götz/Liehr-Gobbers (2004b), S. 16.
Formative Indikatoren selbst haben keinen Fehlerterm; sie werden also implizit als fehlerfreie Messungen angesehen. Vgl. Diamantopoulos (1999), S. 447.
Vgl. dazu stellvertretend Albers/Hildebrandt (2006), S. 2–33; Diamantopoulos (1999), S. 444–457; Eberl (2004), S. 1–24; Eggert/Fassott (2003), S. 1–18; Fassott/Eggert (2005), S. 31–47; Fornell (1989), S. 162–172; Götz/Liehr-Gobbers (2004a), S. 714–738; Jarvis/MacKenzie/Podsakoff (2003), S. 200–216.
Diamantopoulos (1999), S. 445.
Vgl. Götz/Liehr-Gobbers (2004a), S. 717 f. und ausführlich Dijkstra (1983), S. 79 f.
Vgl. Fassott/Eggert (2005), S. 32.
Vgl. Fassott/Eggert (2005), S. 47; Fassott (2006), S. 84 f.
Vgl. Diamantopoulos/Winklhofer (2001), S. 271.
Vgl. dazu im Überblick Bamberg/Coenenberg (1996), S. 6 f.
Die valide Messung eines Konstruktes durch einen einzigen Indikator zweifeln viele Forscher, wie bspw. Jacoby, an. Er illustriert diesen „Aberwitz “ mit folgender Frage: „How comfortable would we feel having our intelligence assessed on the basis of our response to a single question? ” Jacoby (1978), S. 93. Auf der anderen Seite bemerken Drolet/Morrison, dass der Informationsgehalt ab dem dritten Indikator bereits so gering ist, dass keine Verbesserung der Messqualität zu erwarten ist. Vgl. Drolet/Morrison (2001), S. 200.
Vgl. Berekoven/Eckert/Ellenrieder (2001), S. 74. Nach Kroeber-Riel/Weinberg macht man keinen großen Fehler, wenn man bei ordinalskalierten Werten parametrische Tests anwendet. Vgl. Kroeber-Riel/Weinberg (2003), S. 194.
Für die statistischen Analysen ist entscheidend, welche Skala vorliegt. So setzt bspw. eine Mittelwertbetrachtung eine Intervallskala voraus. Aus ordinalskalierten Daten lässt sich auf Grund der nicht gegebenen gleich großen Skalenabstände kein Mittelwert berechnen. Hier wäre der Median heranzuziehen. Vgl. Backhaus et al. (2003), S. 6.
Vgl. Cox (1980), S. 418. Siehe auch die Ausführungen zur optimalen Anzahl von Antwortkategorien in Stier (1999), S. 66-68.
Der Forscher empfindet drei Alternativen als zu gering, um alle Facetten eines Konstruktes abbilden zu können. Ferner sieht er den Nutzen von mehr als neun Alternativen für zu gering an. Wenn den Probanden eine neutrale Position gestattet ist und davon auszugehen ist, dass davon kein übermaßiger Gebrauch gemacht wird, dann sollte eine ungerade Alternativenanzahl verwendet werden. Vgl. Cox (1980), S. 420.
Eine bekannte Ausnahme stellt Fornell dar. Er verwendet für den schwedischen „National Customer Satisfaction Barometer “ eine 10-Punkt-Skala, um den Probanden eine feinere Diskrimierung zu ermöglichen und um so die häufig linksschiefe bzw. rechtssteile Verteilung der Kundenzufriedenheit (über 80,0 Prozent der Konsumenten sind zufrieden) abzuschwächen. Vgl. Fornell (1992), S. 13.
Vgl. u. a. Miller (1956), S. 90 f.; Ramsay (1973), S. 529 f. Für die Anwendung einer Kausalanalyse empfiehlt Bagozzi mindestens sieben Stufen. Vgl. dazu Bagozzi (1981a), S. 200.
Es sei hier explizit darauf hingewiesen, dass es sich bei der Rating-Skala, wie sie in unserer Arbeit verwendet wird, nicht um eine Likert-Skala handelt. Es findet weder eine Itemanalyse im Sinne von Likert noch eine Addition der Werte statt. Vgl. zum Begriff der Likert-Skala die kritischen Ausfuhrungen in Schnell/Hill/Esser (1999), S. 185.
Es sei an dieser Stelle auf Abschnitt 4.3.1 verwiesen, in dem die Erhebungsmethode ausführlich diskutiert wird.
Diese fehlende Antwortmöglichkeit mag Ursache für vereinzelt fehlende Werte sein, wird aber in Kauf genommen. Es wird erwartet, dass sich die Befragten mehr Gedanken über ihre Antwort machen, da sie nicht die vermeintlich „bequeme “ Antwortoption „weiß nicht “ bzw. Jceine Angaben “ wählen können.
Vgl. dazu exemplarisch Bauer/Huber/Bräutigam (1997), S. 41. Die Autoren operationalisieren die PKW-Nutzung über die jährlich zurückgelegte Fahrstrecke.
Vgl. Hammann/Erichson (2000), S. 106 f.
Vgl. dazu auch die Empfehlung in Hanssens/Parsons/Schultz (1990), S. 70.
Die Probanden können angeben, ob sie das Produkt seltener als 1-mal wöchentlich, an 1, 2, 3,4, 5, 6 oder an 7 Tagen in der Woche nutzen.
Der Hintergrund soll kurz erläutert werden: Die latente Variable wird bei dem verwendeten Analyseverfahren, auf das in Abschnitt 4.4 noch detailliert eingegangen wird, als Linearkombination der Indikatoren ausgedrückt. Da der einzige Indikator mit 1 gewichtet wird, ist die Pfeilrichtung (reflektiv oder formativ) irrelevant. Vgl. zum Algorithmus auch Betzin/Henseler (2005), S. 52 und Götz/Liehr-Gobbers (2004a), S. 722.
Vgl. dazu auch die Ausführungen in Berry/Lefkowith/Clark (1998), S. 104.
Das ist dann der Fall, wenn ein Produkt tatsächlich Funktionen besitzt, die andere Produkte nicht aufweisen.
Die Probanden mussten bei jedem Kaufgrund auf einer 7-Punkt-Skala angeben, in welchem Ausmaß dieser Grund zutreffend war.
Die 14 Gründe sind im Anhang 7.1 aufgeführt.
Jeder Grund wurde daraufhin untersucht, inwiefern er die psychologische Produktdifferenzierung abbildet. So bilden bspw. die Gründe „wurde von Freunden/Verwandten empfohlen ” und „wurde im Geschäft empfohlen ” eher eine Empfehlung ab als eine psychologische Produktdifferenzierung.
Vgl. Anhang 7.1. Es wurde eine dreifaktorielle Lösung ermittelt. Der erste Faktor kann als psychologische Produktdifferenzierung gedeutet werden und erklärt 39,21 % der Varianz. Es verdichten sich insgesamt sechs Indikatoren auf den ersten Faktor. Die vier Indikatoren mit den höchsten Faktorladungen entsprechen den Indikatoren, die aus inhaltlichen Überlegungen bereits ausgewählt wurden. Der weitere Indikator „gute Erfahrung mit der Marke “ bildet eher die Zufriedenheit denn die psychologische Produktdifferenzierung ab. Der Indikator „hat Produkte mit besonderer Ausstattung “ als sechster Indikator des ersten Faktors weist eine zu geringe Faktorladung auf (< 0,7) und bildet eher eine psychische denn eine psychologische Produktdifferenzierung ab.
Vgl. Fornell (1989), S. 163.
Vgl. Bearden/Netemeyer (1999).
Bedenkt man, dass die Involvement-Skalen über sieben Prozent der Seiten des Handbuches einnehmen, so kann dies einerseits als Beleg für die Bedeutung von konsumentenseitigem Involvement im Marketing angesehen werden, andererseits aber auch als Indiz für den fehlenden Konsens bei der Operationalisierung dieses Konstruktes.
Vgl. Zaichkowsky (1985).
Vgl. Laurent/Kapferer (1985).
Vgl. dazu u. a. die Ausführungen in Jain/Srinivasan (1990), S. 594; Matzler (1997), S. 200-207; Mittal (1995), S. 663.
Von den neun weiteren Skalen im „Handbook of Marketing Scales “ bauen allein vier primär auf der Arbeit von Zaichkowsky auf. Vgl. dazu im Überblick Bearden/Netemeyer (1999), S. 196-203. Bzgl. der Skalenentwicklung und Validierung sei auf die Originalwerke von Higie/Feick (1989); Zaichkowsky (1994); McQuarrie/Munson (1987) und McQuarrie/Munson (1992) verwiesen.
Vgl. Jain/Srinivasan (1990).
Vgl. Zaichkowsky (1985), S. 342.
Vgl. exemplarisch Flynn/Goldsmith (1993); Jain/Srinivasan (1990), S. 594; Martin (1998), S. 10 f.; Spangenberg/Voss/Crowley (1997), S. 237 f.
Vgl. dazu stellvertretend Jain/Srinivasan (1990), S. 594; McQuarrie/Munson (1987), S. 36-40 und Zaichkowsky (1987), S. 32-35.
Vgl. Laurent/Kapferer (1985).
Vgl. Rothschild (1984), S. 217.
Vgl. zur überarbeiteten Skala Kapferer/Laurent (1993), S. 349.
Vgl. Jain/Srinivasan (1990).
Vgl. Jain/Srinivasan (1990), S. 594. Alle verwendeten Skalen sind im oben erwähnten „Handbook of Marketing Scales “ publiziert. Vgl. dazu Bearden/Netemeyer (1999), S. 187-203.
Vgl. Jain/Srinivasan (1990), S. 599 f. Derselben Meinung sind auch Teichert/Rost (2003), S. 625 f. und Quester/Lim (2003), S. 25.
Vgl. dazu Antil (1984), S. 204; Celsi/Olson (1988), S. 211; Deimel (1989), S. 153; Zaichkowsky (1985), S. 342.
Dies empfiehlt auch Trommsdorff (2003), S. 59.
Vgl. die Ausführungen in Abschnitt 4.1 der vorliegenden Arbeit.
Vgl. Teichert/Rost (2003), S. 623.
Vgl. Berens/van Riel/van Bruggen (2005), S. 41; Teichert/Rost (2003), S. 623.
Vgl. zur Validierung des CIP: Jain/Srinivasan (1990); Kapferer/Laurent (1993); Kebbel (2000); Quester/Lim (2003); Rodgers/Schneider (1993). Vgl. zur Validierung des NIP: Teichert/Rost (2003).
CIP-Faktoren: (1) Hedonic Value, (2) Sign Value, (3) Interest (in der Ursprungsversion als „Importance “ bezeichnet), (4) Risk Importance, (5) Risk Probability. NIP-Faktoren: (1) Pleasure, (2) Sign, (3) Relevance, (4) Risk Importance, (5) Risk Probability. Vgl. dazu die Ausführungen im selben Abschnitt weiter vorne.
„Hedonic Value “ wird in den Studien von Quester/Lim und Rodgers/Schneider auch als „Pleasure “. Vgl. Jain/Srinivasan (1990), S. 597; Quester/Lim (2003), S. 25 und Rodgers/Schneider (1993), S. 336.
Vgl. dazu die Studien von Jain/Srinivasan (1990); Quester/Lim (2003); Rodgers/Schneider (1993).
Vgl. Kapferer/Laurent (1993), S. 354. Ähnlicher Auffassung ist auch Trommsdorff, der fordert, dass alle Faktoren bei einer Operationalisierung berücksichtigt werden müssen, damit keine wesentlichen
Die Autoren testeten das CIP sowohl mit dem Produkt „Sportschuh “ (als hoch involvierend identifiziert) als auch mit dem Produkt „Kugelschreiber “ (als gering involvierend identifiziert) an amerikanischen Studenten. Während beim „Sportschuh-Involvement “ die oben genannten Faktoren „Interest “ und „Hedonic Value “ keine diskriminierende Validität aufwiesen, konnten beim „Kugelschreiber-Involvement “ die Faktoren „Hedonic Value “ und „Sign Value “ nicht getrennt werden. Die Ursache der unterschiedlichen Faktorenstruktur kann, so die Autoren, in der gewählten Stichprobe und/oder der Art des betrachteten Gegenstandes liegen. Vgl. Quester/Lim (2003), S. 29–31.
Das Personal Involvement Inventory von Zaichkowsky wurde nicht in die Übersicht integriert, da es gänzlich anders konzeptionalisiert ist, für die vorliegende Arbeit als nicht geeignet eingeschätzt wird und somit die detaillierten Ergebnisse nicht von Relevanz fur das Forschungsprojekt sind.
Vgl. Teichert/Rost (2003), S. 638.
Vgl. Bearden/Teel (1983), S. 22; Churchill/Surprenant (1982), S. 492 f.; Oliver (1981), S. 27.
Bei der expliziten Methode werden die Zufriedenheitsurteile unmittelbar (explizit) erhoben. Es besteht alternativ die Möglichkeit, separat nach Erwartungen und wahrgenommenen Leistungen zu fragen oder direkt nach der Zufriedenheit. Die erste Variante hat den Nachteil, dass die wechselseitigen Einflüsse zwischen Erwartungen und Wahrnehmungen unzureichend berücksichtigt werden und ferner eine zweifache Erhebung derselben Merkmale durchgeführt wird. Vgl. dazu ausführlich Homburg/Rudolph (1998), S. 47-50; Schütze (1992), S. 183-188. Vgl. ferner Ash (1978), S. 255.
Die explizite Messung wird den subjektiven Verfahren zugeordnet und findet sich in zahlreichen Untersuchungen wieder. Vgl. dazu u. a. Krafft (2007), S. 22 f.
Vgl. Oliver (1997), S. 13.
Vgl. dazu bspw. Kroeber-Riel/Weinberg (2003), S. 386.
Vgl. Schütze (1992), S. 131.
Vgl. Fornell et al. (1996), S. 10. Vgl. ferner Bruhn (1999), S. 394; Bruhn (2001a), S. 342 f.
Vgl. dazu auch Abschnitt 3.4.1.1 der vorliegenden Arbeit.
Vgl. Aaker/Kumar/Day (2004), S. 320-322.
542 Vgl. dazuFornell (1992), S. 13.
Vgl. Fornell et al. (1996), S. 11; Gustafsson/Johnson/Roos (2005), S. 875.
Krafft weist in seiner Arbeit darauf hin, dass englischsprachige Beiträge in der Operationalisierung der Kundenbindung oft auf direkt messbare Größen wie Dauer der Geschäftsbeziehung, Kaufreihenfolge etc. abstellen. Vgl. dazu Krafft (2007), S. 35 und die dort zitierte Literatur.
Der Ansatz ist u. a. in den folgenden Veröffentlichungen zu finden: Homburg/Fassnacht/Werner (2002); Homburg/Giering/Hentschel (1999).
Vgl. Homburg/Fassnacht/Werner (2002), S. 513.
Vgl. Homburg/Giering/Hentschel (1999), S. 178.
Vgl. stellvertretend Homburg/Becker/Hentschel (2005), S. 100 f.; Homburg/Bruhn (2005), S. 8 f.; Homburg/Fassnacht/Werner (2002), S. 513.
Vgl. Homburg/Giering/Hentschel (1999), S. 178.
Vgl. Homburg/Giering/Hentschel (1999), S. 179. Diese Facetten können direkt über die Einstellungen und Absicht der Befragten gemessen werden. Vgl. Gerpott (2000), S. 29 f.
Vgl. Homburg/Fassnacht/Werner (2002), S. 513.
Vgl. Albers/Hildebrandt(2006), S. 11.
Vgl. dazu ausführlich Fassott (2006), S. 74.
Zur Überprüfung auf Plausibilität wird auch eine Frage, die sich auf die Weiterempfehlung des Herstellers in der Vergangenheit bezieht, in das Erhebungsinstrument integriert werden.
Vgl. dazu ausführlich Chandon/Morwitz/Reinartz (2005).
Vgl. Oliver (1999), S. 35.
Vgl. Oliver (1999), S. 35.
Vgl. Bakay (2003), S. 94; Eggert (1999), S. 174; Lohmann (1997), S. 138; Peter (1999), S. 185.
Vgl. dazu Schnell/Hill/Esser (1999), S. 203–246.
Die Kooperation hat die zentralen Fragestellungen dieser Arbeit und die verwendete Methodik nicht beeinflusst, jedoch hat sie den Produktfokus der Erhebung auf das Portfolio des Haushaltsgeräteherstellers gelenkt.
Vgl. dazu auch Bamberg/Coenenberg (1996), S. 9.
Speziell bei Abfrage der Nutzung von Informationsquellen fordern Kroeber-Riel/Weinberg, dass die Abfrage auf Grund des „Vergessensprozesses “ zeitnah nach dem Kauf stattzufinden hat. Vgl. Kroeber-Riel/Weinberg (2003), S. 252 f.
Vgl. Pepels (1996), S. 390. Vgl. ferner Abschnitt 3.4.2.3 der vorliegenden Arbeit.
Vgl. stellvertretend Berekoven/Eckert/Ellenrieder (2001), S. 123 f.; Günther/Vossebein/Wildner (1998), S. 1–5; Meffert (2000), S. 162; Pepels (1997), S. 223 f.. Je nachdem, ob Personen oder Haushalte befragt werden, wird von einem Individual-(d. h. Einzelpersonen-) oder Haushaltspanel gesprochen. In der Regel werden Warengruppen, die für den gesamten Haushalt gekauft werden, über das Haushaltspanel abgefragt, und Waren, die von einer Person für sich allein gekauft werden, im Individualpanel. Vgl. dazu Günther/Vossebein/Wildner (1998), S. 68.
Vgl. Aaker/Kumar/Day (2004), S. 38. Der hohe Aufwand bezieht sich sowohl auf die Rekrutierung als auch auf den Unterhalt eines Panels.
Vgl. zum Begriff der Quoten Bamberg/Coenenberg (1996), S. 9.
Vgl. Pepels (1997), S. 223. Zu den häufig verwendeten Quoten zählen Haushaltsgröße, Alter des Haushaltsvorstandes, Netto-Haushaltseinkommen und Anzahl der Kinder 15 Jahren.
Vgl. zum Begriff der „Repräsentativität “ ausführlich Schnell/Hill/Esser (1999), S. 284-286.
Leider muss konstatiert werden, dass zahlreiche Wissenschaftler von einer Zufallsauswahl und somit einer repräsentativen Stichprobe sprechen, es aber innerhalb der Arbeit erkenntlich wird, dass es sich um keine Zufallsstichprobe, sondern bspw. um ein so genanntes Convenience-Sample handelt. Vgl. dazu die Metaanalyse in Krafft/Haase/Siegel (2003), S. 93 f.
Vgl. dazu Bamberg/Coenenberg (1996), S. 5.
Vgl. Bausch (1990), S. 31-36; Günther/Vossebein/Wildner (1998), S. 16 f.
Vgl. dazu auch die kritische Auseinandersetzung in Buttler/Fickel (2002), S. 30-35.
Vgl. van Kenhove/Wijnen/De Wulf (2000), S. 26.
Krafft/Haase/Siegel haben im Rahmen einer Metaanalyse von begutachteten Veröffentlichungen deutschsprachiger Zeitschriften (von 1990 bis 2001) eine ungewichtete mittlere Rücklaufquote von 41 Prozent ermittelt. Diese ist jedoch über die letzten beobachteten Jahre deutlich gesunken. Vgl. dazu Krafft/Haase/Siegel (2003), S. 94.
Vgl. dazu ausführlich Aaker/Kumar/Day (2004), S. 260 f.; Dillman (1991), S. 226. Vgl. ferner Allen (1982).
Diese Transparenz wäre bei einer ausschließlich auf Unternehmensdaten zurückgreifenden Untersuchung nicht gegeben. Vgl. dazu auch die Einschätzung von Reichheld (1997), S. 84.
Vgl. dazu auch Hanssens/Parsons/Schultz (1990), S. 63 f.
Vgl. dazu u. a. Meffert (2000), S. 162 f. und Schnell/Hill/Esser (1999), S. 230.
Ursachen der Panelmortalität können Verweigerung, Desinteresse, Todesfall, Umzug etc. sein. Vgl. Günther/Vossebein/Wildner (1998), S. 3.
Vgl. Günther/Vossebein/Wildner (1998), S. 27.
Der Kooperationspartner hat die Auswahl der Wissenschaftlerin überlassen.
Im Vergleich zu den bei Vorstudien häufig herangezogenen Studenten haben die befragten Mitarbeiter i. d. R. einen eigenen Hausstand. Ferner wird die Nutzungsquote der abgefragten Produkte bei Berufetätigen höher eingestuft als bei Studenten. Ein weiterer Vorteil der Befragungsgruppe war forschungsökonomischer Natur, denn es konnte kostengünstig und schnell eine hohe Stichprobe gezogen werden.
Vgl. Jain/Srinivasan (1990) und Teichert/Rost (2003), S. 638. In Anlehnung an Teichert/Rost wurde je Faktor der Indikator ausgewählt, der die hochste Faktorladung in der dort durchgeführten Untersuchung aufweist.
Vgl. für hohes Involvement bei Autos stellvertretend Martin (1998), S. 11; Lastovicka/Gardner (1979), S. 65. Vgl. für hohes Involvement bei Mobiltelefonen stellvertretend Helfenstein (2005), S. 82 f.
Wenn hier und im Folgenden von Befragten gesprochen wird, so sind korrekterweise die Befragten gemeint, deren Antworten für unsere Untersuchung verwertbar waren und die in die Netto-Stichprobe eingegangen sind.
In Anlehnung an das Vorgehen von Martin (1998), S. 13 f.
Vgl. dazu ähnliche Ergebnisse in Martin (1998), S. 13.
Studien von Laurent/Kapferer und Hunt/Keaveney/Lee geben Indikationen, dass die Produkte „Staubsauger ”, „Bügeleisen “ und „Haarfön “ einen geringen Involvement Charakter aufweisen: So haben Laurent/Kapferer in einer Untersuchung den Involvement-Charakter verschiedener Produkte, zu denen auch der Staubsauger und das Bügeleisen gehören, analysiert. Im Vergleich zu anderen betrachteten Gebrauchsgütern weisen der Staubsauger und das Bügeleisen ein geringeres Gesamtinvolvement auf. Insbesondere der Spaß am Produkt und die mit dem Produkt verbundene persönliche Ausdrucksmöglichkeit sind deutlich geringer als bei den
Vgl. Berekoven/Eckert/Ellenrieder (2001), S. 50.
Das vom Marktforschungsinstitut angegebene Kriterium (USE = 1) muss erfüllt sein.
Die Panelteilnehmer füllen den ersten Panelfragebogen zu einem Produkt aus, kurz nachdem sie ein entsprechendes Produkt gekauft haben. Das vom Marktforschungsinstitut angegebene Kriterium (IMP1 = 1) muss demnach erfüllt sein.
Die Produkte wurden frühestens im Mai 2004 erworben.
Vgl. Pepels (1996), S. 390. Vgl. ferner Park/Hastak (1994), S. 534.
Wenn in unserer Arbeit von Nacherhebung gesprochen wird, dann ist die Primärerhebung im Rahmen unseres Forschungsprojektes gemeint.
Vgl. Schnell/Hill/Esser (1999), S. 312–317 und S. 319–324.
Konkret wurden bei den multiattributiven Messungen monopolare Skalen mit Zahlenvergabe von 1 bis 7 und verbaler Extrempunktbeschreibung verwendet. Vgl. zu den unterschiedlichen Darstellungsmöglichkeiten auch Berekoven/Eckert/Ellenrieder (2001), S. 75.
Vgl. Prüfer/Rexroth (2000), S. 2.
Vgl. Prüfer/Rexroth (1996), S. 107.
Krafft/Haase/Siegel (2003), S. 100.
Ein kurzer und benutzerfreundlicher Fragebogen hat signifikanten Einfluss auf das Antwortverhalten und somit auf die Rücklaufquote. Vgl. Dillman/Sinclair/Clark (1993), S. 301 f.
Siehe Anhang 7.2.
Innerhalb der Blöcke wurde der Empfehlung gefolgt, die Fragen maximal zu mischen, um nicht ähnliche Fragen nacheinander zu fragen und den Probanden damit zu verunsichern. Das ist insbesondere dann wichtig, wenn das gleiche Antwortformat vorliegt. Vgl. Rossiter (2002), S. 324.
Weitere soziodemographische Fragen sind nicht notwendig, da diese Informationen aus den Paneldaten entnommen werden können.
SieheAnhang7.3.
Diese Rücklaufquote kann auch als Response-Rate bezeichnet werden, die in der Standarddefinition beschrieben wird als das Verhältnis der Anzahl der abgeschlossenen Interviews zur Anzahl der zur Grundgesamtheit gehörenden Fälle in der Stichprobe. Vgl. dazu Schnell (1997), S. 19.
Vgl. Lutz/Broeske/Haja (2004), S. 7.
Beim Versendetermin wurde berücksichtigt, dass die Befragung nicht in eine Ferienzeit fällt.
Unter „Produktion “ versteht man in der Panelforschung die Gesamtheit aller Arbeitsprozesse von der Datenerhebung bis zur Erstellung der Datenmatrix für die weiteren Auswertungen. Vgl. Günther/Vossebein/Wildner (1998), S. 53.
Davon waren alleine sieben Fragebogen nicht ausgefüllt zurückgeschickt worden.
Eliminierungen von gesamten Fällen sind nicht unproblematisch. Sie mussten jedoch durchgeführt werden, da sonst keine saubere Datenbasis gewahrleistet war. Auf die Behandlung fehlender Datenpunkte wird noch in diesem Abschnitt eingegangen.
Es fällt auf, dass sowohl die Rücklaufquote als auch der effektive Ist-Stichprobenumfang bei den Produktgruppen „Staubsauger “ und „Herrenrasierer “ höher ist als bei den Produktgruppen „ügeleisen “ und „Haarfön “. Eine Ursache könnte das unterschiedliche Gesamtinvolvement der Konsumenten sein. Dies ist bei den beiden letztgenannten Produktgruppen geringer als bei den beiden erstgenannten Produktgruppen. Vgl. dazu auchTabelle l7 auf S. 136
Vgl. dazu die Ausführungen in Bühl/Zöfel (2002), S. 215-226. Vgl. ferner zu den der eigentlichen Datenauswertung vorgelagerten Schritten Böhler (1985), S. 153-157.
Baumgartner/Homburg (1996), S. 147.
Vgl. Schnell/Hill/Esser (1999), S. 430-432. Schnell kritisiert in seiner Dissertationsschrift zu den „Missing-Data-Problemen “, dass diese Thematik in wissenschaftlichen Arbeiten häufig verschleiert wird. So wird bspw. oft nicht auf die Wertung der „Weiß-nicht “-Antworten eingegangen. Vgl. dazu Schnell (1986), S. 1.
Gründe für das Fehlen von Daten können mangelhaftes Untersuchungsdesign, Antwortverweigerung bei den Befragten, mangelndes Wissen der Befragten, Übersehen von Fragen, Motivationsprobleme, Unaufmerksamkeit, „Weiß-nicht “-Antworten oder auch Fehler bei der Kodierung und Übertragung der Daten sein. Vgl. dazu ausführlich die Ausführungen in Bankhofer/Praxmarer (1998), S. 109 f. und Schnell (1986), S. 24-58.
Vgl. Bankhofer/Praxmarer (1998), S. 110–112.
Dafür wurde eine aus Binärvariablen bestehende Indikatormatrix, welche die Existenz (Wert = 1) bzw. das Fehlen von Daten (Wert = 0) anzeigt, erzeugt und auf Systematik untersucht. Es konnten keine Auffülligkeiten festgestellt werden. Vgl. dazu ausführlich Runte (1999), S. 4–8.
Vgl. Bankhofer/Praxmarer (1998), S. 110.
Vgl. Bankhofer/Praxmarer (1998), S. 113–117; Runte (1999), S. 8–15.
Die in der Vergangenheit relativ häufig verwendete komplette Eliminierung von Fragebogen (CCA = Complete Case Analysis) wird in der neueren Literatur auf Grund des damit einhergehenden hohen Informationsverlustes nicht mehr empfohlen. Vgl. Noh/Kwak/Han (2004), S. 564.
Vgl. Toutenburg/Heumann/Nittner (2004), S. 16.
Vgl. Bühl/Zöfel (2002), S. 105–110.
Vgl. Bühl/Zöfel (2002), S. 105–109, insbesondere S. 9.
Lei/Lomax (2005), S. 2.
Vgl. Zinnbauer/Eberl (2004), S. 3.
Vgl. Bagozzi (1981a), S. 200; Hofacker (1984), S. 93.
Optische Verfahren, wie bspw. das Histogramm oder ein Normalverteilungsplot, können in einem ersten Schritt zur Prüfung der Normalverteilung herangezogen werden. Sie sollten aber immer durch den Kolmogorow-Smirnov-Test abgesichert werden. Vgl. Bühl/Zöfel (2002), S. 108 f. und S. 307 f.
Siehe auch Anhang 7.4.
Vgl. Bausch (1990), S. 31-36; Günther/Vossebein/Wildner (1998), S. 16 f.
Die Grundgesamtheit kann als die Summe aller Einheiten definiert werden, auf die die definierten Untersuchungskriterien zutreffen. Vgl. zur Definition stellvertretend Nieschlag/Dichtl/Hörschgen (1994), S. 724 und Pepels (1997), S. 110.
Vgl. Schnell/Hill/Esser (1999), S. 284–286. Zusätzlich wird in der Literatur vorgeschlagen, die Ist-Stichprobe mit der Soll-Stichprobe zu vergleichen, urn festzustellen, ob eine Verzerrung der Stichprobe auf Grund der Nicht-Antwortenden vorliegt. Die Ist-Stichprobe muss zu diesem Zweck auf systematische Unterschiede zwischen Früh-und Spätantwortenden untersucht werden. Da das für diese Untersuchung notwendige jeweilige Eingangsdatum der Fragebogen nicht festgehalten wurde, kann eine Überprüfung hier nicht stattfinden. Bedingt durch die gegebenen Rahmenbedingungen (Panelteilnehmer, hohe Rücklaufquote) ist jedoch von keinem nennenswerten Non-Response-Bias auszugehen. Vgl. dazu Betz (2003), S. 66.
Dies ist wissenschaftlich zulässig und forschungsbedingt notwendig. Solche Informationen dürfen jedoch nicht verschleiert werden. Vgl. dazu auch die Kritik in Krafft/Haase/Siegel (2003), S. 93.
Vgl. Berekoven/Eckert/Ellenrieder (2001), S. 50.
Vgl. Nieschlag/Dichtl/Hörschgen (1994), S. 725.
Vgl. Backhaus et al. (2003), S. 271; Betzin/Henseler (2005), S. 52 f.; Eggert/Fassott/Helm (2005), S. 108.
Vgl. Bühl/Zöfel (2002), S. 309–312.
Wie bereits weiter oben erwähnt, besteht die Grundgesamtheit aus den von dem Marktforschungsinstitut zur Verfügung gestellten Daten für das gesamte Jahr 2004.
Die für den t-Test vorausgesetzte Normalverteilung wurde mittels Kolmogorov-Smirnov-Test geprüft. Vgl. dazu Bühl/Zöfel (2002), S. 273. Bei den Produktgruppen Bögeleisen, Haarfön und Staubsauger liegt eine Normalverteilung der Variablen „Alter “ vor. Bei den Rasierern liegt diese nur näherungsweise vor, was jedoch für die Anwendung des als robust geltenden t-Tests noch ausreicht.
Wie bereits weiter oben erwähnt, besteht die Grundgesamtheit aus den von dem Marktforschungsinstitut zur Verfügung gestellten Daten für das gesamte Jahr 2004.
Wie bereits weiter oben erwähnt, besteht die Grundgesamtheit aus den von dem Marktforschungsinstitut zur Verfügung gestellten Daten für das gesamte Jahr 2004.
Bliemel etal. (2005), S. 10.
Vgl. Bagozzi/Yi (1989), S. 271; Baumgartner/Homburg (1996), S. 139-142; Bliemel et al. (2005), S. 10 f.; Fassott (2006), S. 68; Fomell/Bookstein (1982), S. 440; Herrmann/Huber/Kressmann (2004), S. 1; Hildebrandt (2004), S. 542; Homburg/Giering (1996), S. 9.
Vgl. Sheth (1971), S. 14.
Vgl. Backhaus et al. (2003), S. 2; Homburg (1989), S. 6; Sheth (1971). Die Verfügbarkeit entsprechender Softwareprogramme, die in der Lage sind, die Komplexität der Phänomene zu beherrschen, hat nach heutigen Erkenntnissen wesentlich zur Bedeutung multivariater Verfahren beigetragen. Vgl. Sheth (1971), S. 17–19.
Vgl. ausführlich Backhaus et al. (2003), S. 7–14.
Vgl. die Ausführungen in Fornell/Zinkhan (1982); Gefen/Straub/Boudreau (2000), S. 4-6; Homburg (1989), S. 10–13. Zu den Verfahren der ersten Generation zahlen u. a. die Faktorenanalyse, die Varianzanalyse, die Diskriminanzanalyse und die Regressionsanalyse. Ein Klassifikationsschema der Verfahren der ersten Generation ist in Sheth (1971), S. 15 zu finden.
Vgl. Fornell/Zinkhan (1982), S. 295.
Vgl. Homburg (1989), S. 11.
Vgl. Hildebrandt (2004), S. 542. Hildebrandt weist darauf hin, dass es in den führenden Journalen im Marketing und der Konsumentenverhaltensforschung heute kaum noch möglich ist, einen empirischen Beitrag zu platzieren, der keine Messfehlerkontrolle der beobachtbaren Variablen beinhaltet.
Vgl. Fornell/Zinkhan (1982), S. 295.
Vgl. Backhausetal. (2003), S. 11;Gefen/Straub/Boudreau(2000), S.5.
Vgl. stellvertretend Bliemel et al. (2005), S. 10 f.; Gefen/Straub/Boudreau (2000); Götz/Liehr-Gobbers (2004b), S. 1 f.; Scholderer/Balderjahn (2005), S. 88–93.
Es dienen bereits veröffentlichte Vergleiche als Grundlage. Vgl. Chin (1995); Chin (1998); Fomell/Bookstein (1982); Gefen/Straub/Boudreau (2000); Scholderer/Balderjahn (2005).
Auf einen umfangreichen historischen Abriss wird verzichtet und auf die entsprechende Literatur verwiesen. Vgl. Betzin/Henseler (2005), S. 50 f.; Scholderer/Balderjahn (2005), S. 88 f.
Vgl. Herrmann/Huber/Kressmann (2004), Abbildung 1. In Anbetracht der heute verwendeten relativ komfortablen Softwarepakete, die eine fundierte Methodenkenntnis nicht notwendig erscheinen lassen und zu einem „gedankenlosen “ Einsatz verleiten, ist der aufgestellte Anspruch leider nicht mehr selbstverstandlich. Vgl. dazu auch die Warnungen in Bruhn/Bunge (1994), S. 46 und Diller (2004a), S. 177.
Vgl. Anderson/Gerbing (1982), S. 453; Babakus/Ferguson/Jöreskog (1987), S. 222; Bliemel et al. (2005), S. 10; Fassott (2005), S. 20; Götz/Liehr-Gobbers (2004b), S. 1; Temme/Kreis (2005), S. 194.
Vgl. Baumgartner/Homburg (1996), S. 139; Homburg (1989), S. 11. Ohne diese schon früh weit entwickelte und leistungsfähige Software hätte sich dieser Ansatz wohl nicht in dem stattgefundenen Ausmaß verbreitet. Vgl. Fassott (2005), S. 20 f.
Vgl. dazu stellvertretend Götz/Liehr-Gobbers (2004b), S. 1. Ursache für die im Vergleich zu LISREL geringe Verbreitung, mag-so wird spekuliert-der frühe Tod von Lohmöller sein, auf den die erste umfangreiche Softwareversion zurückgeht. Vgl. dazu Fassott (2005), S. 20 f. und die dort zitierte Literatur.
Der Zuspruch lässt sich u. a. auch an der Anzahl der Veröffentlichungen ablesen, die in der EBSCO-Daten-bank bei der Suche nach „Partial-Least-Squares “ identifiziert werden können: Waren es 1995 noch 15 Treffer, waren es funf Jahre später bereits 39 Treffer (in 2000). Im Jahre 2005, also wieder fünf Jahre später, beträgt die Trefferanzahl 57. Die Verfügbarkeit entsprechender anwendungsfreundlicher Software (insbesondere PLS-Graph) ist für diesen Trend nicht unerheblich.
Vgl. Scholderer/Balderjahn (2005), S. 88.
Vgl. Fassott (2005), S. 23 f. und die dort zitierte Literatur.
Chin (1995), S. 316.
Vgl. Chin (1995), S. 316; Fassott (2005), S. 26; Tobias (1997), S. 1.
Chin (1995), S. 319. Vgl. dazu auch Helland (2001), S. 99; Höskuldsson (2001), S. 294.
Vgl. Herrmann/Huber/Kressmann (2006), S. 45. Im Vergleich zu anderen Regressionsmethoden sieht Martens PLS als überlegen an bezogen auf seine Prognosefähigkeit. Vgl. Martens (2001), S. 85.
Vgl. Albers/Hildebrandt (2006), S. 26.
Vgl. Albers/Hildebrandt (2006), S. 26.
Jede latente Variable wird als nichttriviale Linearkombination der jeweiligen manifesten Variablen ausgedrückt. Vgl. Götz/Liehr-Gobbers (2004b), S. 5 f.
Bei der inneren Approximation der kausalen Beziehungen geht es darum, wie die Indikatoren von exogenen Variablen andere Indikatoren (von endogenen Variablen) im System beeinflussen. Bei der äußeren Approximation geht es darum, wie sich die beobachtbaren Variablen zu den latenten Variablen verhalten. Hierfür werden bei reflektiven Konstrukten die Ladungen und bei formativen Konstrukten die Gewichte herangezogen. Vgl. Fornell/Bookstein (1982), S. 442.
Vgl. Cassel/Hackl/Westlund (1999), S. 438.
Vgl. ausführlich zum PLS-Algorithmus Betzin/Henseler (2005), S. 60-69.
Vgl. Betzin/Henseler (2005), S. 60.
Eine globale Güteüberprüfung ist bei varianzerklärenden Kausalanalyseverfahren allgemein nicht möglich. Vgl. dazu auch Homburg/Klarmann (2006), S. 735 f.
Vgl. Bliemel et al. (2005), S. 11; Jöreskog/Sörbom (1982), S. 408.
Vgl. Fassott (2005), S. 26.
Vgl. Bliemel et al. (2005), S. 11.
Vgl. dazu Backhaus et al. (2003), S. 362#x2013;365.
Vgl. Fassott (2005), S. 26. Jöreskog/Sörbom sehen den Hypothesentest nicht als das eigentliche statistische Problem an. Vielmehr sehen die Forscher das Problem darin, die empirische Datenstruktur durch das Modell angemessen zu erklären. Vgl. Jöreskog/Sörbom (1982), S. 408.
Vgl. Backhaus et al. (2003), S. 337.
Vgl. Backhaus et al. (2003), S. 372#x2013;377; Jöreskog/Sörbom (1982), S. 407#x2013;409.
Vgl. Jöreskog/Wold (1982), S. 270; Lohmöller (1988), S. 125.
Es ist hier kritisch anzumerken, dass diese genannten Voraussetzungen zwar häufig zitiert, jedoch nur selten überprüft werden.
Vgl. Fassott (2005), S. 26; Fornell/Bookstein (1982), S. 450; Gefen/Straub/Boudreau (2000), S. 9.
Vgl. Chin (1998), S. 295; Gefen/Straub/Boudreau (2000), S. 9.
Vgl. Wold (1989), S. XXV.
Vgl. exemplarisch Bliemel et al. (2005), S. 11; Gefen/Straub/Boudreau (2000), S. 10.
Vgl. Fornell/Bookstein (1982), S. 444#x2013;447; Herrmann/Huber/Kressmann (2004), S. 19-23; Scholderer/Balderjahn (2005), S. 93.
In bestimmten Fällen können formative Messmodelle auch direkt in LISREL abgebildet werden. Vgl. dazu Bollen/Lennox (1991), S. 312.
Vgl. Fassott (2005), S. 24 f.
Vgl. Scholderer/Balderjahn (2005), S. 97. Diese relativ hohe Anforderung an die Stichprobengröße ist für eine genaue Schätzung notwendig. Vgl. Fornell/Bookstein (1982), S. 450.
Vgl. Homburg (1989), S. 134.
Vgl. Chin (1998), S. 311.
Der Stichprobenumfang bei Kovarianzstrukturanalysen sollte mindestens 100, besser 150 oder 200, betragen. Vgl. Gefen/Straub/Boudreau (2000), S. 9; Götz/Liehr-Gobbers (2004b), S. 3.
Vgl. Herrmann/Huber/Kressmann (2006), S. 55.
Zur Überprüfung der Indikatorvariablen auf multivariate Normalverteilung sei auf Backhaus/Blechschmidt/ Eisenbeiß (2006), S. 715 verwiesen.
Vgl. Chin (1998), S. 295; Fornell/Bookstein (1982), S. 449; Gefen/Straub/Boudreau (2000), S. 9; Scholderer/Balderjahn (2005), S. 91.
Vgl. Abschnitt 4.3.4.2 dieser Arbeit und ferner Scholderer/Balderjahn (2005), S. 91.
Vgl. Fornell/Bookstein (1982), S. 442.
Vgl. Chin (1995); Dijkstra (1983), S. 86; Herrmann/Huber/Kressmann (2004), S. 8. Die Begründung liegt darin, dass die latenten Variablen jeweils eine mit Messfehlern behaftete Linearkombination der Indikatoren darstellen und somit eine messfehlerbedingte Inkonsistenz aufweisen, die sich auch auf die Parameterschätzungen auswirkt. Die Werte der latenten Variablen sind daher „näher “ an den Indikatoren, weil sie deren Messfehler teilweise beinhalten.
Vgl. Herrmann/Huber/Kressmann (2004), S. 8.
Vgl. Chin (1995), S. 316.
Vgl. Götz/Liehr-Gobbers (2004b), S. 4 f.; Herrmann/Huber/Kressmann (2004), S. 9; Jöreskog/Wold (1982), S. 266; Wold (1989), S. XXVI.
Es ist dabei zu beachten, dass im Rahmen der explorativen Faktorenanalyse einzelne Indikatoren auf Grund ihrer geringen Item-to-Total-Korrelation zu eliminieren sind.
Vgl. Chin (1995); Dijkstra (1983), S. 86; Herrmann/Huber/Kressmann (2004), S. 8.
Vgl. u. a. Homburg/Giering (1998), S. 122#x2013;124.
Vgl. Sarkar et al. (2001), S. 366.
Vgl. Hulland (1999), S. 202.
Vgl. Amato/Vinzi/Tenenhaus (2004).
Chin (1995), S. 315.
Auf univariater Basis wurde festgestellt, dass insbesondere bei den Phänomenen Kundenzufriedenheit und Involvement zahlreiche Indikatorvariablen nicht normalverteilt sind. Während die Indikatoren zur Messung von Kundenzufriedenheit mitunter signifikant linksschief verteilt sind, sind die Indikatoren zur Messung von Involvement meist rechtsschief verteilt. Die Reduktion der Schiefe durch geeignete Transformationen brachte keinen Erfolg. Nach Backhaus/Blechschmidt/Eisenbeiß liegt daher keine multivariate Normalverteilung vor. Vgl. Backhaus/Blechschmidt/Eisenbeiß (2006), S. 715.
Vgl. Temme/Kreis (2005), S. 195#x2013;203. Im Beitrag dieser Autoren wird ein umfassender Softwareüberblick gegeben.
Vgl. zu dieser Vorgehensweise Fornell/Larcker (1981), S. 45; Hulland (1999), S. 198#x2013;202; Krafft/Götz/Liehr-Gobbers (2005), S. 72#x2013;86.
Bagozzi (1981b), S. 376.
Einen detaillierten Überblick über Kriterien zur Beurteilung formativer Messmodelle bieten Götz/Liehr-Gobbers (2004a); Gotz/Liehr-Gobbers (2004b); Krafft/Gotz/Liehr-Gobbers (2005). Exemplarische Anwendungsbeispiele für die Bildung und Beurteilung formativer Messmodelle liefern Fritz/Möllenberg/Dees (2005); Helm (2005); Hennig-Thurau/Henning (2005); Krieger (2005); Möller (2004); Ringle (2005).
Vgl. dazu auch Homburg/Baumgartner (1998), S. 362 f. und Fritz (1992), S. 140#x2013;145. Beide Artikel beziehen sich auf die Beurteilung der Anpassungsgüte von LISREL-Modellen. Die Gedanken dieser zitierten Beiträge können jedoch auch auf jedes andere Strukturgleichungsverfahren angewendet werden.
Vgl. Bagozzi/Yi (1988), S. 92 f.; Homburg/Baumgartner (1995), S. 172.
Vgl. dazu u. a. Herrmann/Huber/Kressmann (2004), S. 17. Die dort aufgeführte Tabelle bezieht sich auf die Kriterien des LISREL-Modells. Es wird gefordert, dass mindestens 50 Prozent der Kriterien zur Messmodellbeurteilung und 100 Prozent der Kriterien zur Strukturbeurteilung erfüllt sein müssen. Dieser Aufforderung folgen u. a. Betz (2003), S. 84; Peter (1999), S. 149.
Vgl. Churchill (1979), S. 70#x2013;72; Götz/Liehr-Gobbers (2004b), S. 13-15; Herrmann/Huber/Kressmann (2004), S. 25 und S. 29; Peter (1981), S. 136#x2013;138.
Vgl. Bohrnstedt (1970), S. 91.
Vgl. dazu ausführlich Backhaus et al. (2003), S. 295.
Der Eigenwert eines Faktors entspricht dabei der Summe der quadrierten Faktorladungen eines Faktors über alle Variablen hinweg. Folgerichtig entspricht die Addition aller Eigenwerte der Variablenanzahl.
Werden, nach Stewart, zu wenige oder zu viele Faktoren extrahiert, so hat dies einen großen Einfluss auf das Ergebnis der Analyse. Das verwendete faktorenanalytische Verfahren und die Rotationsmethode haben dagegen weniger einen Einfluss auf das Ergebnis der Analyse. Vgl. Stewart (1981), S. 61.
Vgl. Stewart (1981), S. 57. Der Barlett-Test (Test of Sphericity) bietet sich ebenfalls zur Prüfung der faktorenanalytischen Eignung der Indikatoren an. Mit dem Test kann öberpröft werden, ob die Stichprobe aus einer Grundgesamtheit stammt, in der die Variablen untereinander keine Korrelation aufweisen. Da der Test jedoch eine Normalverteilung der Ausgangsdaten voraussetzt, soll in der vorliegenden Arbeit auf eine Anwendung verzichtet werden. Vgl. Backhaus et al. (2003), S. 274 f; Brosius/Brosius (1998), S. 645.
Backhaus et al. (2003), S. 276. Ausgangsbasis der Beurteilung stellt die so genannte Anti-Image-Korrelations-Matrix dar. Das Anti-Image ist dabei der Teil der Varianz, der unabhängig von den anderen Variablen ist. Vgl. Backhaus et al. (2003), S. 275.
Vgl. Kaiser/Rice (1974), S. 113.
Vgl. Backhaus et al. (2003), S. 266.
Vgl. Homburg/Baumgartner (1998), S. 360.
Die Gesamtvarianz setzt sich aus der erklärten Varianz und der Fehlervarianz zusammen, die bei standardisierten Variablen in Summe 1 (bzw. 100,0 Prozent) ergibt. Vgl. dazu auch Bohrnstedt (1970), S. 82.
Vgl. Hulland (1999), S. 198.
Vgl. stellvertretend Homburg/Giering (1998), S. 128 f.; Hulland (1999), S. 198; Krafft/Götz/Liehr-Gobbers (2005), S. 73#x2013;75. Bei etablierten Skalen sollten die Ladungen jedoch keine zu geringen Werte aufweisen. Vgl. Hulland (1999), S. 198.
Vgl. stellvertretend Homburg (1998), S. 88.
Vgl. Bagozzi (1980), S. 113. Bei dieser Definition handelt es sich um die Definition Nummer drei von Bagozzi, die auf Campbell und Fiske 1959 zurückgeht. Vgl. femer auch Hildebrandt (1998), S. 91.
Bagozzi (1981b), S. 375. Bagozzi gehtdabeijedochnur auf das reflektive Messmodell ein.
Cronbachs Alpha verkörpert den Mittelwert aller Korrelationen, die sich ergeben, wenn die dem Faktor zugeordneten Indikatoren auf alle möglichen Arten in zwei Hälften geteilt und die Summe der Messwerte der jeweils resultierenden Hälften miteinander korreliert werden. Er ist ebenfalls normiert und nimmt Werte zwischen 0 und 1 an. Obwohl es keine Mindeststandards gibt, werden-wenn mindestens vier Indikatoren vorliegen-Werte ab 0,70 allgemein als brauchbar eingestuft. Vgl. dazu stellvertretend die Ausführungen in Hair et al. (1992), S. 448 und Hulland (1999), S. 198). Eine intensive Auseinandersetzung mit diesem Maß ist in einem aktuellen Beitrag von Cronbach zu finden. Der Forscher geht von seinem 1951 veröffentlichten wegweisenden Artikel „Coefficient Alpha and the Internal Structure of Tests “ aus und erortert die seitdem stattgefundene Entwicklung. Vgl. Cronbach/Shavelson (2004). Peterson fasst in einer Metaanalyse die Empfehlungen verschiedener Autoren für den Mindestwert von Cronbachs Alpha zusammen. Vgl. dazu Peterson (1994), S. 382.
Vgl. Böing (2001), S. 105.
Vgl. Fornell/Larcker (1981), S. 45.
Vgl. stellvertretend Krafft/Götz/Liehr-Gobbers (2005), S. 74. Andere Autoren sehen einen Mindestwert von 0,60 als ausreichend an. Vgl. stellvertretend Bagozzi/Yi (1988), S. 80; Homburg (1998), S. 89.
Vgl. Eggert/Fassott(2003), S. 5.
Vgl. Götz/Liehr-Gobbers (2004b), S. 14.
Vgl. Fornell/Larcker (1981), S. 45 f.
Vgl. Bagozzi/Yi (1988), S. 82; Chin (1998), S. 321; Homburg (1998), S. 89; Homburg/Baumgartner (1998), S. 361; Homburg/Giering (1996), S. 12.
In Anlehnung an Homburg (1998), S. 89 und S. 92.
Cronbachs Alpha ist insbesondere beim Vergleich der Güte der verschiedenen Anwendungen der Involvement-Skala von Jain/Srinivasan sehr hilfreich. Nunnally empfiehlt, Cronbachs Alpha für jede Messung zu berechnen. Vgl. Nunnally (1967), S. 197 und S. 210.
Weist ein bestimmter Faktor einen zu niedrigen Wert von Cronbachs Alpha auf, so lässt sich die Reliabilität in der Regel dadurch steigern, dass die zugehörige Indikatorvariable mit der niedrigsten Item-to-Total-Korrelation eliminiert wird. Vgl. zu diesem Vorgehen Churchill (1979), S. 68.
Bagozzi/Phillips (1982), S. 469.
Vgl. Hulland (1999), S. 199.
Das Fornell-Larcker-Kriterium stellt gegenüber dem ?2-Differenztest, der ebenfalls zur Überprüfung der Diskriminanzvalidität herangezogen werden kann, ein deutlich strengeres Kriterium dar und wird daher in der Literatur auch häufig zitiert. Vgl. dazu auch Unterreitmeier/Schwinghammer (2004), S. 18.
Vgl. Fornell/Larcker (1981), S. 46.
Vgl. Giering (2000), S. 86.
Vgl. Fornell/Larcker (1981), S. 48.
Krafft weist darauf hin, dass davon auszugehen ist, dass die Konstrukte Kundennähe, Kundenzufriedenheit und Kundenbindung inhaltlich nicht überschneidungsfrei sind und fordert seine Kollegen auf, die Diskriminanzvalidität zwischen den verschiedenen Konstrukten zu überprüfen. Vgl. Krafft (2007), S. 19 f. In vielen wissenschaftlichen Arbeiten wird die Diskriminanzvalidität auf modellübergreifender Ebene jedoch nicht überprüft.
Vgl. Herrmann/Huber/Kressmann (2004), S. 25.
Vgl. zu den verschiedenen Blindfolding-Möglichkeiten Chatelin/Vinzi/Tenenhaus (2002), S. 11.
Diese Vorgehensweise wenden auch Homburg/Giering an. Vgl. Homburg/Giering (1996), S. 12 f.
Vgl. Homburg/Giering (1996), S. 12.
Vgl. dazu das Vorgehen in Betz (2003), S. 131.
Vgl. Homburg/Giering (1996), S. 13.
Vgl. Krafft/Götz/Liehr-Gobbers (2005), S. 83.
Vgl. insbesondere Krafft/Götz/Liehr-Gobbers (2005), S. 83#x2013;85. Vgl. ferner Eggert/Fassott/Helm (2005), S. 104; Herrmann/Huber/Kressmann (2004), S. 26 f.; Ringle (2004), S. 14#x2013;18.
Vgl. Backhaus et al. (2003), S. 96.
Vgl. Homburg/Baumgartner (1995), S. 172.
Vgl. Chin (1998), S. 323 und S. 325. In der Literatur wird die Bewertung meist verallgemeinert (bspw. in der Form „Chin fordert… “) und es wird nicht erwähnt, dass sich die Aussagen von Chin nur auf zwei konkrete Beispiele beziehen.
Vgl. Homburg/Baumgartner (1998), S. 363.
Vgl. Herrmann/Huber/Kressmann (2004), S. 29.
Vgl. dazu auch Backhaus et al. (2003), S. 58.
Vgl. Chatelin/Vinzi/Tenenhaus (2002), S. 19.
Der einseitige t-Test kann verwendet werden, da a priori gerichtete Hypothesen formuliert wurden. Vgl. zur Angemessenheit der Verwendung des einseitigen t-Tests Reinartz/Krafft/Hoyer (2004), S. 299.
Aussagen, die mit einer Irrtumswahrscheinlichkeit von p≤0,05 behaftet sind, werden als signifikant bezeichnet und durch ein Sternchen (*) symbolisiert. Weiter werden Aussagen, die mit einer Irrtumswahrscheinlichkeit von p ≤ 0,01 behaftet sind, als sehr signifikant bezeichnet und durch zwei Sternchen (**) symbolisiert. Schließlich werden Aussagen, die mit einer Irrtumswahrscheinlichkeit von p ≤ 0,001 behaftet sind, als höchst signifikant bezeichnet und durch drei Sternchen (***) symbolisiert. Vgl. dazu stellvertretend BühJ/Zöfel (2002), S. 111; Sachs (1992), S. 188.
Vgl. Eggert/Fassott/Helm(2005), S. 102 f.
Vgl. Eggert/Fassott/Helm (2005), S. 104. Vgl. ferner Iacobucci/Duhachek (2004), S. 395.
Vgl. Eggert/Fassott/Helm (2005), S. 105.
Vgl. Eggert/Fassott/Helm (2005), S. 106.
Vgl. Backhaus et al. (2003), S. 399.
Vgl. Chin (1998), S. 316 f.
Vgl. Chin (1998), S. 316.
Vgl. Chin (1998), S. 316 f. In der Literatur (vgl. dazu u. a. Eggert/Fassott/Helm (2005), S. 109 f.; Krafft/Götz/Liehr-Gobbers (2005), S. 84) bezieht man sich in Ermangelung objektiver Grüßen auf diese Aussagen, die Chin-genau genommen-nur auf zwei konkrete Beispiele bezieht.
„Even a small interaction effect can be meaningful under extreme moderating conditions, if the resulting beta changes are meaningful, then it is important to take these conditions into account “ Chin/Marcolin/Newsted (2003), S. 211.
Tritt der Effekt der Interaktionsvariable auf Kosten der Haupteffekte ein, bleiben die Veränderungen des Bestimmtheitsmaßes gering und der f2-Wert somit ebenso. Vgl. dazu auch die Ausführungen in Eggert/Fassott/Helm (2005), S. 210.
Vgl. Nunnally (1967), S. 76.
Bei der Kreuzvalidierung wird allgemein überprüft, wie gut beobachtete Werte durch das Modell und seine Parameter rekonstruiert werden können. Vgl. Lohmöller (1989), S. 11. Vgl. ferner die Ausführungen zur Anwendung der Kreuzvalidierung auf Kovarianzstrukturmodelle in Homburg (1989), S. 55-57.
Vgl. Cooil/Winer/Rados (1987), S. 271 f.
Vgl. zu den verschiedenen Blindfolding-Möglichkeiten Chatelin/Vinzi/Tenenhaus (2002), S. 11.
Vgl. zur Vorgehensweise bei der Blindfolding-Technik ausführlich Chatelin/Vinzi/Tenenhaus (2002), S. 10#x2013;12.
Vgl. Chin (1998), S. 317 f. Das Kriterium greift auf den von Ball entwickelten Q-Koeffizienten zurück: „Hence it is the Q-coefficients that provide an indication weather a model will be satisfactory or poor when used to predict outside the same period, although within the range of sample experience. ” Ball (1963), S. 19.
Vgl. Götz/Liehr-Gobbers (2004b), S. 25.
Vgl. Wold (1989), S. XIV-XV.
„The average redundancy measures the overall capacity of the model to predict the manifest variables related to an endogenous latent variable. “ Chatelin/Vinzi/Tenenhaus (2002), S. 31. Vgl. dazu ferner Bouncken/Koch (2005), S. 302.
Vgl. Stan/Saporta (2005), S. 3.
Vgl. Amato/Vinzi/Tenenhaus (2004).
Tenenhaus/Amato/Vinzi (2004), S.1.
Da PLS-Graph im Output das durchschnittliche Bestimmtheitsmaß auf alle Konstrukte bezieht (auch auf die exogenen), muss dieser Wert entsprechend so korrigiert werden, dass nur endogene Variablen berücksichtigt werden. Bei der durchschnittlichen Faktorreliabilität dürfen nur Konstrukte berücksichtigt werden, die durch mehrere Indikatoren gemessen werden.
Vgl. Stan/Saporta (2005), S. 3.
Vgl. Tenenhaus/Amato/Vinzi (2004), S. 4.
Vgl. zu den unterschiedlichen Gewichtungsschemata Chatelin/Vinzi/Tenenhaus (2002), S. 8 f. und Tenenhaus (2004), S. 492.
Vgl. zu den möglichen unterschiedlichen Standardisierungsparametern Chatelin/Vinzi/Tenenhaus (2002), S.7.
Vgl. Götz/Liehr-Gobbers (2004b), S. 6.
Vgl. Cooil/Winer/Rados (1987), S. 271 f.
Als Beispiel eines „Sample Re Use “-Ansatzes dient der Jackknife-Ansatz. Die Stichprobe wird in k Unterstichproben aufgeteilt, die jeweils aus N-l Elementen bestehen. Vgl. dazu auch Backhaus et al. (2003), S. 445.
Vgl. zur Bootstrap-Methode ausführlich Hesterberg et al. (2005), S. 14/1#x2013;14/70.
Woodroof (2000), S. 509.
Eine Erhöhung der Ziehungen führt zu vergleichbaren Standardfehlern bei den Schätzern.
Vgl. Hesterberg et al. (2005), S. 14/5; Woodroof (2000), S. 512. Vgl. im Zusammenhang mit Strukturgleichungsmodellen ferner Bone/Sharma/Shimp (1989), S. 106; Chatelin/Vinzi/Tenenhaus (2002), S. 12.
Chin (1998), S. 320.
Vgl. Chatelin/Vinzi/Tenenhaus (2002), S. 10 und S. 16.
Rights and permissions
Copyright information
© 2008 Betriebswirtschaftlicher Verlag Dr. Th. Gabler | GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
(2008). Empirische Grundlagen. In: Kundenbindung und Involvement. Gabler. https://doi.org/10.1007/978-3-8349-9732-6_4
Download citation
DOI: https://doi.org/10.1007/978-3-8349-9732-6_4
Publisher Name: Gabler
Print ISBN: 978-3-8349-1036-3
Online ISBN: 978-3-8349-9732-6
eBook Packages: Business and Economics (German Language)