Skip to main content

Mitarbeiterbeurteilung in traditioneller Perspektive

  • Chapter
  • 91 Accesses

Part of the book series: Betriebliche Personalpolitik ((BPERSO))

Zusammenfassung

Aus einer Studie des Bundesarbeitsministeriums von 1975 geht hervor, daß 38 Prozent der befragten deutschen Unternehmen109 für mindestens eine ihrer Mitarbeitergruppen eine systematische Beurteilung durchführen (vgl. bei Kador 1983, S.25). Heute, rund zwanzig Jahre später, werden Mitarbeiterbeurteilungen bereits in über neunzig Prozent aller deutschen Unternehmen eingesetzt (vgl. Stehle 1993, S.174). Mitarbeiterbeurteilung gilt deshalb nicht allein als ein verbreitetes, sondern mit Blick auf seine Verbreitungsgeschichte als relativ junges organisationales Instrument.110 Die im Rahmen der immanenten Analyse zuerst dokumentierte „traditionelle“ Perspektive ist als historisch ältere der beiden zu verstehen. Sie wurde durch die modernere „politische“ Perspektive aber nicht ersetzt und vollständig abgelöst, sondern besitzt in ihrem Anwendungsspektrum nach wie vor eine hohe Bedeutung. Die als zweites dargestellte „politische Perspektive“ ist deshalb als Ergänzung und nicht als Substitution der „traditionellen Perspektive“ zu verstehen.

Wir können sagen: alle unbestimmte und unbestimmbare Komplexität muß im mechanistisch vorgestellten System als Abfall registriert werden, weil er tendenziell die interne, triviale Ordnung sabotiert.

(Bardmann 1994, S.289)

This is a preview of subscription content, log in via an institution.

Buying options

Chapter
USD   29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD   49.99
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD   49.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Unable to display preview. Download preview PDF.

Referenzen

  1. Stichprobenelemente der Studie waren Industrieunternehmen sowie Banken und Versicherungen.

    Google Scholar 

  2. Auch wenn außerhalb des unternehmerischen Kontextes die Beurteilung von Fähigkeiten und Tätigkeiten von Menschen eine zweitausendjährige Tradition besitzt (zum Beispiel Wei Dynastie in China von 221–265, der Kirche).Vgl. einen historischen Überblick bei Lattmann (1975b, S.17ff.).

    Google Scholar 

  3. Vgl. Kapitel III. l.

    Google Scholar 

  4. Greve/Wentura (1991) gehen allerdings davon aus, daß eine strenge Abgrenzung der Begriffe unangemessen wäre, weil Beurteilung auch Teil des Messens sein kann (vgl. S. l0ff.)

    Google Scholar 

  5. Andere als formalisierte Beurteilungen zum Beispiel “beim Einkaufen, im Alltagsgespräch” sind per definiti-onem ausgeschlossen (vgl. Crisand/Stephan 1994, S.11).

    Google Scholar 

  6. Vgl. zur Potentialbeurteilung -Bestandteil der politischen Perspektive- Kapitel V. l.3.

    Google Scholar 

  7. Vgl. einen Überblick zu (angewandten) Methoden der Arbeitsbewertung bei Zander (1970, S. 115ff.) und Wöhe (1986, S.195ff.). Vgl. zur Kritik dieser Methoden und deren Anwendung unter dem Gesichtspunkt von Entgeltdiskriminierung gegen Frauen Krell (1994a).

    Google Scholar 

  8. Vgl. zur Kritik zum Beispiel Krell/Winter (1997)

    Google Scholar 

  9. In zahlreichen Personallehrbüchern wird diese Funktion häufig verkürzend beschrieben mit “der richtige Mann sollte für den richtigen Platz ausgewählt werden”. Eine derartige Umschreibung dieser Funktion der traditionellen Mitarbeiterbeurteilung mag bereits als “Vorgeschmack” der Diskriminierungsanalyse in Kapitel IV.3 verstanden werden. Vgl. vorerst die Erörterung dieser “Funktionsbeschreibung” aus der Perspektive weiblicher Mitarbeiter bei Gerhard/Osterloh/Schmid (1993, S.34).

    Google Scholar 

  10. Beginnend bei Einstellung über die Personal Versetzung bis hin zur Freisetzung.

    Google Scholar 

  11. Hinsichtlich der Informationsfunktion ist zu betonen, daß Mitarbeiterbeurteilung zumindest indirekt vom Betriebsverfassungsgesetz geboten ist (vgl. §82, Abs.2, BetrVG). Dem Anspruch des Gesetzes kann ein Unternehmen am leichtesten durch eine allgemein verbindliche und einheitliche betriebliche Beurteilung nachkommen (vgl. Berkel/Herzog/Schmid 1987, S.11).

    Google Scholar 

  12. Im englischsprachigen Raum wird in der Regel der Ausdruck “performance appraisal” verwendet. Dieser Begriff kann nicht überall als -identische Sachverhalte bezeichnende- geeignete Übersetzung von “Mitarbeiterbeurteilung” verstanden werden. “Performance appraisal” tituliert eine sehr viel stärker empirisch geleitete Forschung als der deutsche Begriff (vgl. Lattmann 1975b, S.20). Unterschiede zwischen deutschsprachigen und angelsächsischen Ansätzen werden deshalb, sofern bedeutsam, explizit dargestellt.

    Google Scholar 

  13. Denkbar wären zur Gehaltsfestsetzung ebenso andere (leistungsunabhängige) Organisationale Instrumente wie zum Beispiel Gehalt nach Alter (vgl. Zander 1970, S.14), per Vorgesetztenentscheidung oder nach Formalqualifikation.

    Google Scholar 

  14. Vgl. Kapitel IV. 1.2.

    Google Scholar 

  15. Zum Beispiel als Terminus “Kraft x Weg”. In der Physik ist Leistung eindeutig bestimm- und meßbar, d. h. in eindeutigen Einheiten angebbar: 1PS=735.49874W (vgl. Jung 1979, S.396).

    Google Scholar 

  16. Leistungsverhalten wird wiederum konstituiert aus den Komponenten Leistungsfähigkeit und Leistungsbereitschaft (vgl. Crisand/Stephan 1994, S.15).

    Google Scholar 

  17. Vgl. das “gemeinsame Anliegen” in diesem Kapitel und in Kapitel IV. 1.2.

    Google Scholar 

  18. Vgl. die detaillierte und kritische Auseinandersetzung mit dem Leistungsprinzip in Kapitel VII.3.1.

    Google Scholar 

  19. vgl. weitere Funktionen des Leistungsprinzips bei Becker (1994b, S.102L).

    Google Scholar 

  20. Vgl die organisationale Abbildung des Leistungsprinzips durch Mitarbeiterbeurteilung in einer anderen Interpretation in Kapitel VII.3.2.

    Google Scholar 

  21. Die Messung der Zuverlässigkeit setzt im übrigen ein Mindestmaß an Objektivität voraus. Können bei Vorliegen einer mangelnden Objektivität (zum Beispiel hohe Interkorrelationen der Urteilsvarianzen), die in der klassischen Testtheorie (vgl. Schlittgen 1996, S.327ff.) vorausgesetzten wiederholten Messungen zur Bestimmung der Zuverlässigkeit nicht durchgeführt werden, empfiehlt es sich, das Zuverlässigkeitskriteriums durch das Konzept der Generalisierbarkeit zu ersetzen (vgl. Brandstätter 1970, S.706). Beim Konzept der Generalisierbarkeit wird für den Fall der Beurteilungen nach Cronbach (1955) geschätzt, wie weit die unter den spezifischen Bedingungen einer Beurteilungssituation gewonnenen Aussagen auf eine bestimmte Gesamtheit von Urteilsbedingungen verallgemeinert werden können.

    Google Scholar 

  22. Zu den unterschiedlichen Arten der Validität (zum Beispiel Inhalts Validität, Konstruktvalidität) vgl. Schuler (1989b, S.12ff.) und Kompa (1990, S.590ff.).

    Google Scholar 

  23. Das heißt Annahmen darüber, in welchen kognitiven Schritten Urteile im allgemeinen und Mitarbeiterbeurteilungen im besonderen durch einen Beurteiler gebildet werden. Kapitel IV.2.2.2 gibt einen Überblick über die verschiedenen, diskutierten Beurteilungsprozesse.

    Google Scholar 

  24. Aus diesem Unterschied zwischen anglo-amerikanischen und deutschsprachigen Veröffentlichungen allerdings die Kritik zu begründen, neueste deutschsprachige Untersuchungen ständen neueren US-amerikanischen empirischen Erkennmissen in Qualität nach (vgl. Lueger 1993, S.7 und Becker 1994b, S.231) ist meines Erachtens nicht zulässig. Kapitel IV.5.1.2 und Kapitel IV.5.3.1 setzen sich dezidierter mit den Schwächen der amerikanisch-empirischen Forschung und deren Gütemerkmalen auseinander.

    Google Scholar 

  25. Vgl. zur Kritik an “idealen” Beurteilungsabläufen Kapitel IV.5.

    Google Scholar 

  26. Vgl. eine Sammlung situationsübergreifend als wichtig erachtete Beurteilungsmerkmale bei Fischer (1973, S.138f.).

    Google Scholar 

  27. Der Vorgesetzte ist deshalb am geeignetesten, weil er die Anforderungen einer Aufgabe zum Beispiel durch eine Arbeitsplatzbeschreibung kennt, Verständnis für die Arbeitssituation mitbringt, in der Regel in Kontakt zu dem Mitarbeiter steht und damit -aus der Situation begründet- die Möglichkeit einer umfassenden Beobachtbarkeit des Verhaltens gegeben ist. Sollten die für einen Urteiler beschriebenen Anforderungskriterien nicht erfüllt sein, kann anstelle des direkten Vorgesetzten auch ein anderer, dem zu Beurteilenden rangmäßig überlegener Mitarbeiter die Beurteilung vornehmen (vgl. Knebel 1992, S.63). Eine solche Indikation wäre zum Beispiel gegeben bei der Beurteilung eines Innendienstverkäufers, dessen unmittelbarer Vorgesetzter ein Gebietsleiter im Außendienst ist und dem es wegen der räumlichen Distanz an Beobachtungsmöglichkeiten fehlt (vgl. Curth/Lang 1991, S.25).

    Google Scholar 

  28. Im Hinblick auf die beurteilten Dimensionen eines Mitarbeiters besitzt die freie Beurteilung häufig den Charakter einer Persönlichkeitsbeurteilung (vgl. Curth/Lang 1991, S.242). Vgl. hierzu die Ausführungen in Kapitel IV.2.2.1.2.

    Google Scholar 

  29. Hierzu gehören zum Beispiel summarische Rangordnungsverfahren, Paarvergleiche und Verfahren der erzwungenen Verteilung (vgl. Becker 1994b, S.253ff.).

    Google Scholar 

  30. Bei größeren Gruppen geht man dazu über, statt einer summarischen Rangreihe für alle Mitarbeiter in einem Schritt, über multiple Paarvergleiche in vielen Zwischenschritten letzlich eine Gesamtrangordnung herzuleiten. Gegen diesen “Mann-zu-Mann”-Vergleich (Bartölke 1972b, S.653) spricht allerdings der hohe kombinatorische und zeitliche Aufwand.

    Google Scholar 

  31. Es Skann keine Gleichheit von zwei Personen geben. Die Neuplazierung einer Person in der Rangreihe bedeutet automatisch auch die Neuplazierung zumindest einer weiteren Person. Wird eine Person besser beurteilt, muß automatisch mindestens eine andere Person in der Rangreihe sinken.

    Google Scholar 

  32. Zu der Methode der “kritischen Ereignisse” im weiteren Sinne gehören im speziellen das Check-List-Verfahren, das Zwangswahlverfahren und das Verfahren der kritischen Ereignisse im engeren Sinn. Das Verfahren der kritischen Ereignisse i.e.S. ist als eigenständiges Verfahren wie auch als Basis der beiden ersten Verfahren zu verstehen (vgl. Becker 1994b, S.256ff.).

    Google Scholar 

  33. In einer verhaltensorientierten oder aufgabenorientierten Variante (vgl. Capol 1965). Vgl. zu neuesten verhaltensorientierten Skalierungen Kapitel IV.2.3.1.4.

    Google Scholar 

  34. Häufig liegt eine fünf- bis siebenstufige Likert-Skala vor (vgl. Likert 1967/1975).

    Google Scholar 

  35. Vgl. hierzu Kapitel IV.2.2.1.4

    Google Scholar 

  36. Validitäten (vgl. Kapitel IV. 1.4) werden in Form von Validitätskoeffizienten ausgedrückt. Validitätskoeffizienten sind als bestimmte Form von Korrelationskoeffizienten zu verstehen. Im spezifischen Fall der Validitätsbe-trachtung wird zum Beispiel bei der Konstruktvalidität die Korrelation zwischen dem, was ein Kriterium mißt und dem, was es tatsächlich messen soll, berechnet. Vgl. zur Kritik an der Berechnung von Validitätskoeffizienten Ulrich (1989, S.312ff.).

    Google Scholar 

  37. Unter einer ergebnisbezogenen Beurteilung wird in diesem Zusammenhang die Beurteilung auf Basis quantitativer Zielvorgaben verstanden. Kramer (1996) ist der Auffassung, daß jede Funktion meßbare und insbesondere quantitative Ziele besitzt, die als Grundlage ergebnisorientierter Kriterien gelten können (vgl. S.102).

    Google Scholar 

  38. Vgl. Kapitel IV.3.2.1 zur detaillierteren Unterscheidung nach Kriteriendimensionen.

    Google Scholar 

  39. Für das diesbezüglich entstehende Entscheidungsproblem gibt es lösbare lineare Optimierungsmodelle (vgl. Bainter 1994).

    Google Scholar 

  40. Zum Beispiel Messung der Arbeitsleistung als Produktionsmenge pro Zeit.

    Google Scholar 

  41. Vgl. Zur detaillierten Analyse bzw. Kritik der eigenschaftsorientierten Skalierungen Kapitel IV.2.2.1.2.

    Google Scholar 

  42. Vgi zur “Politischen Perspektive” Teil V.

    Google Scholar 

  43. Im Laufe der Analyse wird sich der Titel allerdings auch unter inhaltlichen Gesichtspunkten als adäquat herausstellen. Vgl. Kapitel IV.6.

    Google Scholar 

  44. Vgl. Kapitel IV.1.4 und Kapitel IV.1.5.

    Google Scholar 

  45. l53 Vgl. zum Beispiel Brandstätter (1969) und DeNisi/Cafferty/Meglino (1984).

    Google Scholar 

  46. Geringe Einflüsse amerikanischer Prägung finden sich in deutschen Veröffentlichungen nur vereinzelt (zum Beispiel bei Hampp/Hilgenfeld 1985; Schuler 1989a).

    Google Scholar 

  47. Trägt eher der deutschsprachigen Herangehensweise Rechnung, enthält aber in der empirischen Aufarbeitung deutlich angelsächsische Einflüsse.

    Google Scholar 

  48. Zum Beispiel Entgeltpolitik, Beförderung.

    Google Scholar 

  49. Zum Beispiel “neutraler Richter” versus “kooperative Führungskraft”?

    Google Scholar 

  50. Zum Beispiel Agitation des Urteilers als Mitarbeiter desselben Unternehmens, d. h. als Kollege oder als hierarchisch übergeordneter Urteiler?

    Google Scholar 

  51. Eine explizite Definition von Beurteilungsfehlern und übergreifende Ursachen ihrer Entstehung finden sich allerdings nicht. Diese Definitionslücke gilt auch für die amerikanischen, wahrnehmungstheoretischen Arbeiten, die eigentlich für sich postulieren, gerade jene Black-Box (vgl. Becker 1994b, S.199) im Urteiler näher zu erläutern, die in anderen Ansätzen nicht thematisiert wird.

    Google Scholar 

  52. Im der Druckertechnik wird unter einem Stereotypen ein häufig wiederholbarer Druckvorgang mit einer Stereotypendruckplatte verstanden (vgl. Dorsdowski 1992, S.709).

    Google Scholar 

  53. Unter impliziten Persönlichkeitstheorien werden individuelle Vorstellung darüber verstanden, wie eine Person (zum Beispiel eine Führungskraft) ist bzw. zu sein hat (vgl. Neubauer 1989, S.191).

    Google Scholar 

  54. De Beurteilertypologie soll den Charakter eines Beurteilers vermitteln: “Jeder Mensch ist ein Produkt aus Erbanlagen und Umwelteinflüssen. Sie prägen ihn zum ‘Typen’. Dementsprechend wird seine Beurteilung immer eine für ihn ‘typische’ Form ausmachen. Er kann sozusagen ‘vaus seiner Haut’ nicht heraus (vgl. Knebel 1992, S.55).

    Google Scholar 

  55. Grundlagen dieser Wahmehmungsverzerrungen finden sich bei Helson (1948; 1964). In zwei Studien konnte er nachweisen, daß sich abhängig von Stärke und Reihenfolge physikalischer Reize und der Nachwirkung sowohl der früheren als auch der gegenwärtigen Serie von Reizen ein Reiz-Adaptionsniveau herausbildet. Dieses Adaptionsniveau dient als Bezugpunkt der Beurteilung. Wenn das Adaptionsniveau genau erreicht wird, führt dieses zu einer mittleren Bewertung.

    Google Scholar 

  56. Vgl. Kapitel IV. 1.4.

    Google Scholar 

  57. Überwiegend amerikanisch-empirische Arbeiten.

    Google Scholar 

  58. Vgl. Kapitel IV.1.4.

    Google Scholar 

  59. Vgl. Kapitel IV. 1.1.

    Google Scholar 

  60. Vgl. Kapitel II.2.2.1.

    Google Scholar 

  61. Was ist zum Beispiel “Persönlichkeitsreife”? (vgl. Müller 1975, S.476).

    Google Scholar 

  62. Vgl. Kapitel IV.1.1.

    Google Scholar 

  63. In der englischsprachigen Literatur werden diese Verfahren eingeführt unter dem Namen BARS (Behavior Anchored Rating Scales). Später wird aber auch der Name BES verwendet (Behavior Expectation Scales). Hier soll mit VES eine deutschsprachige Abkürzung verwendet werden. Weitere Abkürzungen finden sich bei Weinert (vgl. 1981, S.307ff.).

    Google Scholar 

  64. Das Problem des Letztkriteriums (vgl. Kapitel IV.2.2.1.1) scheint hierdurch reduzierbar.

    Google Scholar 

  65. Skalierungen können auch zwischen den Ankern liegen. Die Anker dienen lediglich dazu, ein konzeptionelles Beispiel für die Skalierung von tatsächlich beobachtetem Verhalten zu geben (vgl. Domsch/Gerpott 1985, S.672).

    Google Scholar 

  66. Ausgehend von diesem durch Smith/Kendall entwickelten BARS wurden in der nachfolgenden wissenschaftlichen Diskussion dieser Verfahren eine Reihe von Modifikationen vorgeschlagen. So ist zum Beispiel denkbar, am Prozeß der Skalenentwicklung nicht nur die Beurteiler, sondern auch die Beurteilten oder sonstige untere Hierarchieebenen einer Organisation einzubeziehen (vgl. Zedeck et al. 1974, S. 250f.; Zedeck/Jacobs/Kafry 1976, S.112ff.; Ivancevich 1980, S.159ff.). Auch hinsichtlich der Abfolge des Skalenentwicklungsprozesses werden abweichende Vorgehensweisen vorgeschlagen (vgl. zum Beispiel Campbell et al. 1973, S. 16ff.; Schwab/Heneman/De Cotiis 1975, S.550; Latham/Fay/Saari 1979, S.300f). Vgl. hierzu Kapitel V. l.5.

    Google Scholar 

  67. Vgl. eine kritische Auseinandersetzung mit der gewählten empirischen Methodik in Kapitel IV.5.1.2 und Kapitel IV.5.3.1.

    Google Scholar 

  68. Vgl. zur “Abspeicherung” von Verhaltensbeobachtungen auch Kapitel IV.2.3.2.

    Google Scholar 

  69. In englischsprachigen Raum werden VBS als BOS (Behavior Observation Scales) bezeichnet.

    Google Scholar 

  70. Siehe auch Kapitel IV. 1.5.

    Google Scholar 

  71. Siehe auch Kapitel IV.1.5.

    Google Scholar 

  72. übereinstimmungsgrad in zeitbezogener Betrachtung, d. h. so wie der Urteiler vor einem Monat urteilte, fällt auch das heutige Urteil aus.

    Google Scholar 

  73. Innerhalb der Sozialpsychologie werden die gestalttheoretische, die kognitive, die lemtheoretische, die soziologische und die psychoanalytische Orientierung unterschieden. Der kognitive Ansatz der Sozialpsychologie ist experimentell ausgerichtet. Es wird von der Alltagserfahrung -zum Beispiel im Sinne der ganzheitlichen Wahrnehmung sozialer Ereignisse- ausgegangen (vgl. Heinz 1992, S.709).

    Google Scholar 

  74. Durch den Anspruch der empirischen Überprüfung unterscheiden sie sich von den zuvor beschriebenen, stärker psychometrisch orientierten Publikationen. Dieser Sachverhalt ist erstaunlich. Gerade psychometrische Verfahren böten aufgrund ihrer Nähe zur statistische Testtheorie und der damit relativ leichten Operationalisierbarkeit eigentlich eine gute Basis für empirische Forschungsdesigns. Möglicherweise liegt dieser Sachverhalt in der grundsätzlich unterschiedlichen Forschungstradition deutschsprachiger “Kaufleute” und amerikanischer “Managementforscher” begründet (vgl. Staehle 1989, S.88ff.).

    Google Scholar 

  75. Vgl zum Vorwurf eines rein praxisorientierten Verwertungsinteresses von Publikationen zur Mitarbeiterbeurteilung Kapitel I.3. Vgl. zur Kritik der vermeitlich wissenschaftlichen Methodik der kognitiven “Prozeßschule” die Kapitel IV.5.1.2 und IV.5.3.1.

    Google Scholar 

  76. Vgl. Kapitel IV.2.2.1.4.

    Google Scholar 

  77. Vgl. Kapitel IV.1.5.

    Google Scholar 

  78. Allerdings werden in den betreffenden Studie lediglich zwölf Prozent der Bewertungsvarianz durch Rasse und Geschlecht dagegen aber siebzig Prozent durch Variation der erbrachten Leistung bei den Probanden erklärt (vgl. Schmitt/Lappin 1980). Das Argument einer höheren Güte (vgl. Kapitel IV. 1.4) von Bewertungen bei rassen- und geschlechterbezogener emotionalen Nähe ist nach dieser Studie mithin nur als Trend zu verstehen (vgl. Pulakos/White/Oppler/Borman 1989).

    Google Scholar 

  79. Diese Sicht Bormans führt neben einer Abkehr psychometrischer Argumente auch zu einer Abkehr der psychometrischen Gütekriterien. Borman arbeitet verstärkt mit dem Accuracy-Merkmal. Vgl. Kapitel IV. 1.4.

    Google Scholar 

  80. Zum Beispiel hinsichtlich des Aufgabeninhalts einer über die Beurteilung zu besetzenden Stelle.

    Google Scholar 

  81. Aufgrund der Borman’sehen Argumentation eines über Persönlichkeitstheorien gesteuerten bzw. geordneten Wahrnehmungsprozesses ist die Beurteilungsgenauigkeit negativ korreliert mit der Auffassung des Urteilers über die Variabilität der menschlichen Natur (vgl. Schmitt/Lappin 1980; Wexley/Youtz 1985). Ein Zusammenhang zwischen der kognitiven Komplexität eines Urteils und die Art der Denkstrukturen eines Urteilers im Hinblick auf die Genauigkeit des Urteils wird dagegen empirisch negiert (vgl. Bernardin/Cardy/Carlyle 1982).

    Google Scholar 

  82. Es muß eine kategoriale Einordnung der Information vorgenommen werden.

    Google Scholar 

  83. An dieser Stelle ist die Verbindung zu Bormans Modell der dimensionalen Schemata zu sehen.

    Google Scholar 

  84. “The search for performance information is sensitive to the demands of the situation. Raters may for example actually require different information to reach appraisal decisions for different purposes” (Williams/DeNisi/Blencoe/Cafferty 1985, S.335).

    Google Scholar 

  85. Landy/Farr (1980) entwickelten ein Prozeßmodell, welches versucht, Erkenntnisse zu Wahrnehmungsprozessen mit jenen aus der psychometrischen Forschungsrichtung zu kombinieren. Dieses Modell enthält die nach Auffassung der Forscher relevanten Variablen in ausdifferenzierter Form (vgl. S.321). Entstanden ist allerdings ein Gebilde, welches sich im höchsten Maße komplex darstellt, so daß dieses Modell weder empirisch zu testen, geschweige denn praktisch anwendbar ist.

    Google Scholar 

  86. Es werden Studenten Videofilme gezeigt, bei denen ein Hochschullehrer zu bewerten ist. “Three of five dimensions of performance were manipulated to be opposite to that of the lecturers overall performance” (Nathan/Lord 1983, S. 102).

    Google Scholar 

  87. Auf der anderen Seite sind diese beiden Studien aufgrund der nicht explizit zugrunde gelegten Verwendung der Genauigkeitsmessung mit Vorsicht zu genießen. Murphy/Reynolds (1988) untersuchten die Konsistenz der Leistung von Beurteilten über verschiedene Leistungskriterien hinweg. Sie maßen Genauigkeit mit Hilfe der True-Score-Methode und fanden heraus,”[...] that the level of true halo in ratees’performance only affected the intercorrelation among performance dimension ratings when true level of intercorrelation was extremely high or extremely low” (S. 238; vgl. auch Murphy/Jako 1989). Diese Ergebnisse sprechen dafür, einen Halo-Effekt nicht unbedingt im Widerspruch zu dem Borman’sehen Modell zu betrachten. Möglicherweise liegt die mangelnde Fähigkeit der Beurteiler, sich an beobachtetes Verhalten zu erinnern und deshalb der Rückgriff auf die Feldman’sehe globale Kategorisierung nur in Extremsituation (sehr hohe oder sehr niedrige von True-Score-Experten geschätzte Interkorrelation der Beurteilungskriterien) vor.

    Google Scholar 

  88. Vgl. Kapitel IV.2.1.

    Google Scholar 

  89. Vgl. Kapitel IV.1.1.

    Google Scholar 

  90. Vgl. Kapitel IV.2.4.

    Google Scholar 

  91. Besonders in der angelsächsischen Forschung

    Google Scholar 

  92. “Human resource managers have approached the elimination of wage differences [...] by developing sophisticated and unbiased performance appraisal techniques designed to base evaluation of women on actual performance rather than on stereotypes” (vgl. Drazin/Auster 1987, S.158f.).

    Google Scholar 

  93. Insofern übernehmen Stereotype eine kognitive Funktion zur Reduktion von Komplexität. Eine weitere ebenfalls diskutierte Funktion einer Stereotypisierung emotionaler Art, zum Beispiel zur Verteilung von Macht, Herrschaft (vgl. Alfermann 1993, S. 303) findet an dieser Stelle keine Anwendung.

    Google Scholar 

  94. Bei Alfermann (1993, S. 309f.) findet sich am Beispiel einer häufig reproduzierten Studie von Goldberg (1968) eine relativ detaillierte Beschreibung des empirisch-experimentellen Untersuchungsdesigns, an dem sich die überwiegende Zahl der Forscher orientiert. Sofern nicht anders gekennzeichnet, handelt es sich bei den nachfolgend zitierten Studien (zumeist männlicher Urheberschaft) um Laborexperimente, bei denen Studenten unterschiedlicher Seniorität als Probanden (Urteiler) dienen, sich die Vermittlung der zu beurteilenden Tätigkeit an die studentischen Beurteiler über Video-Clips oder materialisierte Leistung (zum Beispiel ein Aufsatz, ein gemaltes Bild) vollzieht und ein Einstufungsverfahren mit unterschiedlichen bzw. variierten Skalierungen verwendet wird.

    Google Scholar 

  95. Geschlechtsrollen selbst sind allerdings nicht Gegenstand der jeweiligen Untersuchungen. Der Begriff sowie theoretische Überlegungen hinter diesem Begriff werden im Rahmen der empirischen Studien in der Regel nicht problematisiert.

    Google Scholar 

  96. Ein ähnliches Phänomen wurde im übrigen auch für zu beurteilende Männer identifiziert, wenn diese sich nicht konform mit der männlichen Geschlechtsrolle verhielten (im Fall einer hohen Familienorientierung) (vgl. Rosen/Jerdee 1973).

    Google Scholar 

  97. Die Geschlechtsrollenidentität wurde im Vorfeld der Studie mit Hilfe der von Bern (1974; 1975) entwickelten BSRI-Skala (Behavior Sex Role Identification) ermittelt. Nach dieser Skala kann ein Beurteiler entweder eine “sex typed identity” (weiblich oder männlich) oder eine “non sex-typed identity” (neutral: weder weiblich noch männlich oder androgyn: sowohl männlich als auch weiblich) annehmen.

    Google Scholar 

  98. In dieser Studie mit 59 Collegestudenten wurden zwei Gruppen gebildet. Der einen Gruppe wurde vermittelt, daß die zu beurteilende Aufgabe normalerweise von Männern besser ausgeführt wird, der anderen Gruppe entsprechend vermittelt, daß Frauen sich in der Regel bei dieser Aufgabe besser bewähren (vgl. Lee 1987, S.153).

    Google Scholar 

  99. Diese beiden Forscher testeten die Fragen, “[whether] the perceived masculinity/feminity of the raters and the congruence of those characteristics with the job type may have an influence in the bias process independent of social category (man/woman)” (Maurer/Taylor 1994, S.232).

    Google Scholar 

  100. Die vier Führungsstile wurden bezeichnet als: initiating structure [hier: strukturiert], consideration [hier: beziehungsorientiert], production emphasis [hier: aufgabenorientiert], tolerance for freedom [hier: partizipativ].

    Google Scholar 

  101. Eine 1985 in Israel durchgeführte Replikationsstudie mit dem von Bartol/Butterfield angewendeten Untersuchungsdesign konnte deren Ergebnisse nicht bestätigen (vgl. Izraeli/Izraeli 1985). Die Autoren der Replikationsstudie stellen die Ergebnisse von Bartol/Butterfield dennoch nicht in Frage, sondern begründen die Abweichungen mit kulturellen Unterschieden zwischen Israel und den USA sowie durch leicht modifizierte Auswahlkriterien der studentischen Beurteiler.

    Google Scholar 

  102. Die daraus abgeleitete implizite Schlußfolgerung, daß Frauen nicht führen könnten, kann unter anderem dazu verleiten, daß Frauen unabhängig vom Instrument der Mitarbeiterbeurteilung weniger gefördert und beobachtet werden (vgl. Parkin/Hearn 1987, Sp.330; Friedel-Howe 1995, S.456). Krell (1997b) unabhängig davon daraufhin, daß die Schlußfolgerung, daß Frauen im Vergleich zu Männern schlechter, besser oder gleich gut führen könnten, häufig von der Perspektive des Betrachters abhängt (vgl. S.8).

    Google Scholar 

  103. Selbst Karriereratgeber für Frauen führen die Unterrepräsentanz von Frauen auf einen Widerspruch zwischen geschlechtstypischen, weiblichen Eigenschaften und vermeintlichen Anforderungen an eine Führungkraft zurück (vgl. Abele/Schaper 1995, S.237).

    Google Scholar 

  104. Zur Erklärung dieser Skala vgl. Fußnote 205.

    Google Scholar 

  105. Die Differenz in der Selbsteinschätzung nimmt jedoch mit zunehmender Erfahrung der weiblichen Probanden ab (vgl. zum Beispiel deutliche Unterschiede zwischen Studentinnen im Grund- und Hauptstudium). Neben der Verwendung dieser Ergebnisse für die Dokumentation eines männlichen Führungsstereotypen, sind diese Ergebnisse ein Indiz für eine Selbstselektion von Frauen (vgl. Powell/Butterfield 1979, S.401). Bei Frauen wird im Zuge der Berufssozialisation das Konzept von “Frau” männlicher, jenes von “Führungskraft” weiblicher (vgl. Steins/Wickenheiser 1995, S.79). Als Begründung für dieses empirisch nachweisbare Phänomen dienen tägliche Erfahrungen der beruftätigen Frauen: Durch positives Feedback, Erfolg, Beförderung und sonstige verbale Aktivität (vgl. Stimpson/Robinson/Gregory 1986) werden die ehemals starken Hypothesen der “schwachen” Frau und der “männlichen” Führungskraft” von weiblichen Führungskräften immer wieder in Frage gestellt und abgeschwächt.

    Google Scholar 

  106. Vgl. eine ähnlich geführte empirische Diskussion bezogen auf Altersstereotype bei Cleveland/Landy (1983).

    Google Scholar 

  107. Ausgehend von den Civil-Right-Acts des Jahres 1964, in denen unter anderem eine geschlechts-, rassen-, altersbezogene Diskriminierung verboten wurde, ist in diesem Zusammenhang vor allem auf das Affirmative Action Program (AAP) zu verweisen. Im Vergleich zum alleinigen Versuch, Diskriminierung abzubauen, ist das AAP zusätzlich durch das Bestreben gekennzeichnet, den Anteil unterrepräsentierter Mitarbeitergruppen zu erhöhen (vgl. Benett-Alexander 1990).

    Google Scholar 

  108. Im Vergleich zu den sonst zitierten (experimentellen) Labor-Studien wird in dieser Studie von Thompson/Thompson (1985) eine andere Erhebungsmethodik verwendet. Es liegt eine Feldstudie vor. Im Rahmen von Felduntersuchungen inkludiert das Forschungsdesign eine Beurteilungssituation mit realen Akteuren von ausgewählten Unternehmen. Feldstudien sind nicht durch die für Laborexperimente typischen vollständig kontrollierbaren Versuchsbedingungen gekennzeichnet.

    Google Scholar 

  109. Vgl. Kapitel IV.2.2.

    Google Scholar 

  110. Vgl. zu Kritik der Methodik Kapitel IV.5.1.2 und Kapitel IV.5.3.1.

    Google Scholar 

  111. Trotz der umstrittenen Ergebnisse, werden die zitierten und weitere Studien mit ähnlicher Methodik und Fragestellung in den USA herangezogen, um Diskriminierungsfragen und -klagen abzuweisen. Insofern ist um Fragen zu Beurteilungsverfahren und deren potentieller Zusammenhang mit Diskriminierung eine wissenschaftliche Diskussion um Forschungdesigns und Meßinstrumente entbrannt. Obwohl die überwiegende Zahl der Veröffentlichungen zu diesem Thema (vgl. einen Überblick bei Bennett-Alexander 1990) psychometrische Argumentationslinien um Themen der Genauigkeit, Validität und ähnliches vertreten, sind ihre Ergebnisse teilweise zu einem Politikum geworden: “We must conclude that the (scientific) burden is certainly on those experts who maintain that there is some causal connection between a particular deleterious outcome for some protected class members” (Bernardin/Hennessey/Peyrefitte 1995, S.73).

    Google Scholar 

  112. Vgl. Kapitel IV.5.3.1.

    Google Scholar 

  113. Vgl. Kapitel IV.2.2.2.

    Google Scholar 

  114. Der Begriff “Infonnationskategorisierung” stammt von Feldman. Er entspricht bei Borman den Prozeßkomponenten “Evaluieren” und “Gewichten”.

    Google Scholar 

  115. “Although sex of subject had an effect in terms of the subject’s expectations for his own performance, there was no evidence that the subject’s own sex related to his or her evaluation of either male or female stimulus persons” (Deaux/Emswiller 1974, S.84).

    Google Scholar 

  116. Vgl. zum Beispiel “Frauen, die es geschafft haben” bei Metzler (1985).

    Google Scholar 

  117. Vgl. Kapitel IV.2.2.2.

    Google Scholar 

  118. Im Sinne Bonnans wäre Geschlecht hier als eine Dimension der Persönlichkeit des Urteilers zu verstehen.

    Google Scholar 

  119. Vgl. Fußnote 205.

    Google Scholar 

  120. Ausmaß an Vorabinformationen, auf die ein Urteiler zurückgreifen kann und Ausmaß der verlangten Zukunftsorientierung.

    Google Scholar 

  121. Vgl. Kapitel IV. 1.1.

    Google Scholar 

  122. So wird zum Beispiel davon ausgegangen, daß die Kenntnis gängiger Attributionsmodelle von weiblichen im Vergleich zu männlichen Arbeitsergebnissen ausreicht, diskriminierende, durch stereotype Attribution verursachte Effekte zu reduzieren (vgl. Heilmann/Guzzo 1978, S.355).

    Google Scholar 

  123. Dazu gehören: “Konzentiert beobachten, Beobachtungen nicht deuten, regelmäßig und fortlaufend beobachten”.

    Google Scholar 

  124. Meta-Analysen ergaben, daß Wahrnehmungsverzerrungen eher durch interaktive Trainings reduzierbar seien (vgl. Smith 1986). Andere bezweifeln dies (vgl. Pulakos 1984).

    Google Scholar 

  125. Vor allem bei bestehender großer Unsicherheit (vgl. Mc Farlan Shore/Thornton III 1986)

    Google Scholar 

  126. In attributionstheoretischer Überlegung könnten diese Ergebnisse von Ilgen aber auch mit Lerneffekten des Urteilers bzw. seiner Urteilsvalidierung an der Realität begründet werden. Eine Urteilsvalidierung läßt sich annehmen, weil es durch häufiges Beurteilen oder durch Wahrnehmung neuer Sachverhalte zu einer Vergrößerung der Stichprobe der Beobachtungen und einer damit einhergehenden verbesserten Ursachenschließung sowie ein Zurücktreten von stereotypen Attributionen kommen mag.

    Google Scholar 

  127. Vorausgesetzt die mit der Beurteilung verbundenen Ziele sind kompatibel (Vgl. Bartölke 1972b, S.664; Zedeck/Cascio 1982; Mc Intyre/Smith/Hassett 1984). Vgl. Kapitel IV.2.1.

    Google Scholar 

  128. Unabhängig davon, ob die Urteilsqualität in Genauigkeit, Objektivität oder Validität gemessen wird.

    Google Scholar 

  129. Vgl. IV.3.3.

    Google Scholar 

  130. Vgl. zur Vorgehensweise ebenso Kapitel I.4 und Teil III.

    Google Scholar 

  131. Vgl. Kapitel IV. 1.3

    Google Scholar 

  132. Vgl. Kapitel IV. 1.3.

    Google Scholar 

  133. Vgl die Ausführungen zu Messen und Bewerten im Rahmen des traditionellen Begriffsverständnis von Mitarbeiterbeurteilung in Kapitel IV. 1.1.

    Google Scholar 

  134. Wie in Kapitel II. 1.1 und speziell in Fußnote 43 verdeutlicht, ist ein Forscher in der Wahl seiner Definitionen und seines Untersuchungsgegenstandes grundsätzlich frei. Die Auswahl kann deshalb ebensowenig richtig oder falsch, sondern lediglich adäquat oder nicht adäquat sein.

    Google Scholar 

  135. Zu zielen und Funktionen der Mitarbeiterbeurteilung vgl. Kapitel IV. 1.2.

    Google Scholar 

  136. Vgl. Kapitel IV. 1.4.

    Google Scholar 

  137. Im rein mathematisch-statistischen Sinn können die Gütekriterien als eine spezielle Form der Korrelation bezeichnet werden, da sie Zusammenhänge zwischen zwei Größen (zum Beispiel zwischen dem, was ein Kriterium mißt und dem, was es messen soll) abbilden. In der Inferenzstatistik können Korrelationskoeffizienten auf Basis einer bekannten Stichprobe berechnet oder geschätzt werden. Validitäten und ebenso die anderen Gütekriterien werden innerhalb der hier verwendeten Studien aufgrund der fehlenden eindeutig abgrenzbaren und meßbaren Größen in der Regel durch Surrogate geschätzt denn exakt berechnet. Wie bei jeder Schätzung entstehen hierdurch systematische Fehler (vgl. Bol 1995, S.100f.).

    Google Scholar 

  138. Uneindeutigkeit ist bereits durch die Tatsache der mangelnden Konstanz der Testbedingungen gegeben. Lediglich in Laborexperimenten gelingt es, die Umfeldbedingungen annähernd konstant zu halten. Unter Realbedingungen oder in Feldstudien ist allein diese testtheoretische Grundforderung für die Ermittlung von Gütekennzahlen über Zufallsexperimente nicht gegeben (vgl. Grieger/Bartölke 1992, S.85f).

    Google Scholar 

  139. Capol (1974) stellt fest, daß Zuverlässigkeit als Ergänzung von nachgewiesener hoher Validität und Objektivität keinerlei zusätzlichen Informationsgewinn liefert, da Validität und Objektivität im Rahmen von Mitarbeiterbeurteilung Zuverlässigkeit voraussetzen. Zuverlässigkeit ist deshalb als ein Surrogat zu betrachten, welches sich als deckungsgleich mit Validität und Objektivität darstellt.

    Google Scholar 

  140. Das gilt im besonderen Maße für das selbst unter seinen Verwendern nicht unumstrittene Accuracy-Maß (vgl. Kapitel IV. 1.4). Im Vergleich zu den psychometrischen Gütekriterien wie Objektivität wird Accuracy häufig als “aggregierte” Güte verwendet, unter der verschiedenste andere Gütekriterien subsumiert werden. In dieser aggregierten Form liegt allerdings eine deutlich eingeschränkte Möglichkeit zur Differenzierung von gütebezogenen Aussagen: “[...] accuracy is not the ultimate criterion that should be used in evaluating ratings. [...] criteria such as inter-rater agreement [S.H.: Objektivität], validity, ease of use or distributional characteristics of ratings might be more important to differentiate within given performance appraisal systems” (Murphy 1991, S.49). Neben einem möglichen Zusammenhang mit anderen Gütekriterien wird Accuracy vor allem unter univariaten Bedingungen ein gegenteiliger Vorwurf im Hinblick auf den Zusammenhang mit Beurteilungsfehlern gemacht. Offensichtlich ist die Signifikanz bestimmter Beurteilungsfehler (zum Beispiel Halo-Effekte) und Accuracy-Güte unabhängig. Genauigkeit deshalb als Maßstab für die Evidenz von Beurteilungsfehler zu verwenden, scheint ebenso unzulässig, wie umgekehrt anhand von identifizierten Wahrnehmungsverzerrungen auf die Genauigkeit eines Urteils zu schließen (vgl. Murphy/Balzer 1989).

    Google Scholar 

  141. Auch das gilt besonders für “Accuracy”. In der Regel drückt Genauigkeit den Übereinstimmungsgrad mit sogenannten True-Score- Experten Urteilen (vgl. Kapitel IV. 1.4) aus. Sollen darüber hinaus Aussagen über die Vorhersagbarkeit zukünftigen Verhaltens getroffen werden (prognostische Genauigkeit), werden über die True-Score-Urteile hinaus VES-Skalen hinzugezogen, um Genauigkeit zu operationalisieren (vgl. Wexley/Youtz 1985). Nur unter bestimmten Voraussetzungen wie beispielsweise bei nachgewiesen hoher Konstruktvalidität konnte empirisch eine Korrelation dieser beiden Formen der Accuracy-Messung herausgefunden werden. In der Mehrzahl aller Fälle aber fehlt eine Konsistenz bzw. ein Zusammenhang der Ergebnisse nach den verschiedenen Ermittlungsmethoden. Sie scheinen von einander unabhängig (vgl. Murphy/Garcia/Kerkar/Martin/Balzer 1982; Zalesny/Highhouse 1992). Insofern dient Genauigkeit nur dann als Gütekriterium, wenn gleichzeitig die Art der Erfassungsmethode benannt wird. In den meisten empirischen Studien finden sich derlei Hinweise aber selten. Es liegt deshalb der Verdacht nahe, daß genau solche Form der Ermittlung von Accuracy verwendet wird, welche die Forschungshypothesen stützt. Ein Willkürvorwurf wird deshalb von Sulsky/Balzer (1988) angeführt.

    Google Scholar 

  142. Diese liegt zum Beispiel zwischen 36 und 51 Prozent bei intraindividueller Urteilskonkordanz (vgl. Fletcher 1995), zwischen 47–79 Prozent bei interindividueller Urteilskonkordanz und zwischen 84–91 Prozent [!] bei der prognostischen Validität (vgl. Dickinson/Hassett/Tannenbaum 1986). Im Umkehrschluß werden mithin im schlechtesten Fall der prognostischen Validität nicht mehr als höchstens 16 Prozent der Varianz aufgeklärt.

    Google Scholar 

  143. Zum Beispiel Vorgaben eines Mittelwertes an die Beurteiler oder gar Vorgabe mehrerer fixer Prozentpunkte wie Quintile.

    Google Scholar 

  144. Vgl. Kapitel IV. 1.2 zu Zielen und Funktionen der traditionellen Mitarbeiterbeurteilung.

    Google Scholar 

  145. Zum Beispiel einer impliziten Eignungstheorie. Vgl. hierzu Kapitel IV.2.3.

    Google Scholar 

  146. Vgl. zu den Nachteilen der Antworteinschränkung bei Einstufungsverfahren im Vergleich zu freien Beurteilungen Kapitel IV. 1.5.

    Google Scholar 

  147. In empirischen Studien wurden Skalierungen von bis zu neun Stufen identifiziert (vgl. Lattmann 1975b). In gleichem Maße konnte empirisch das Problem zu vieler Merkmale identifiziert werden. Bei dem Versuch einer möglichst vollständigen Erfassung der Leistung mit einer entsprechend hohen Anzahl von Kriterien, wird die Unabhängigkeitsanforderung an die Kriterien vernachlässigt (vgl. Mungenast 1990, S.52f.). Schuler (1989a) fend heraus, daß sich die Anzahl von durchschnittlich über dreizig verschiedenen Beurteilungskriterien auf rund drei bis fünf reduzierte, wenn die inhaltliche Unabhängigkeit der Kriterien sichergestellt werden sollte (vgl. S.422). Die Vernachlässigung des Unabhängigkeitspostulats führt somit zu einer impliziten, (ungewollten?) Verschiebung der Gewichtung einzelner Kriterien (vgl. Neuberger 1980, S.31). In der Praxis haben diese Überlegungen teilweise zu einer deutlichen Reduktion der Kriterienanzahl geführt (vgl. Zander/Knebel 1980, S.44ff.).

    Google Scholar 

  148. Mit Notenstufen von eins bis fünf. Vgl. Wagner (1989, S.538).

    Google Scholar 

  149. mit verbalen Aussagen wie hoch, mittel, tief

    Google Scholar 

  150. Die Ursache der Invarianz gegenüber monoton steigenden Transformationen und nicht wie bei kardinalem Meßniveau gegenüber allen linearen Transformationen liegt in den Abständen zwischen den Stufen begründet. In einer Ordinalskala besitzen diese keinen Informationswert (vgl. Büning/Trenkler 1978, S.21): Für das Beispiel von Schulnoten kann zwar die Aussage gemacht werden, daß eine “eins” besser ist als eine “zwei”. Um wieviel besser wird aber nicht vermittelt.

    Google Scholar 

  151. Ein quantitativer Gesamtwert ist das Ergebnis fast jedes Einstufungsverfahrens unabhängig der diesem zugrundeliegenden Skalierungsformen wie VES oder VBS.

    Google Scholar 

  152. Zum Beispiel Vergleiche und Differenzbildungen von Beurteilungsergebnissen eines Mitarbeiters in der Zeitreihe

    Google Scholar 

  153. Vgl. zur Unterscheidung übergreifender Ziele der Mitarbeiterbeurteilung Kapitel IV. 1.1.

    Google Scholar 

  154. Vgl. Kapitel IV.4

    Google Scholar 

  155. Darüberhinaus werden nicht allein Erkenntnisse der Medizin, sondern ebenso für die Erforschung von Wahrnehmungsverhalten relevante Entdeckungen der Neurobiologie (vgl. Schnabel 1996, S.34) und der Himforschung (vgl. Roth 1996, S.34) nicht berücksichtigt. Forscher wie Roth verstehen “Bewußtsein” als ein Emergenzphänomen verschiedener Gehirnbereiche, betonen allerdings, daß “Bewußtsein” ebenso wie “Gedächtnis” keinen örtlich lokalisierbaren Sitz im Gehirn haben. Bewußtsein und Wahrnehmung ist nicht in irgendeiner Form verdinglicht, kann jedoch als Funktion eines zu rekursiver Interaktion fähigen Nervensystems dargestellt werden. Insofern ist das Nervensystem für seine eigenen Zustände sensibel und kann über seine eigenen Zustände operieren (vgl. Schmidt 1987b, S.20; siehe auch Engel 1994, S.24). Ein Widerspruch zu “filterlosem, objektiven” Wahrnehmen ist identifiziert.

    Google Scholar 

  156. Vgl. hierzu die Modelle von Borman (1974) und Feldman (1981) in Kapitel IV.2.2.2.

    Google Scholar 

  157. Als eine solche läßt sich beispielsweise der Urteilertyp “ich bin hart zu mir und hart zu anderen” (Breisig 1989, S.116) bezeichnen. Solche Typologien besitzen in eigenschaftstheoretischer Tradition häufig den Charakter einer Stigmatisierung.

    Google Scholar 

  158. Luegers Versuch (1993), sich Wahrnehmungsprozessen mit Hilfe der Freud’schen Psychoanalyse bzw. mit Hilfe der Individualpsychologie nach Adler zu nähern, ist im übrigen die seltene Ausnahme für eine theoretische Untermauerung von Analysen zu Wahrnehmungsprozessen (vgl. S.153–172).

    Google Scholar 

  159. Schuler (1989a) interpretiert die Wahrnehmungsmodelle als anwendungsstrategische Heuristiken. “Von einer integrierenden theoretischen oder gar formal-modellhaften Aufklärung kann nicht die Rede sein” (S.420).

    Google Scholar 

  160. Wegen der Pseudowissenschaftlichkeit glauben die Urteiler selbst an die ihnen in personifizierter Form entgegenbrachten Kritik. Mängel lasten sie sich selbst und nicht dem System an (vgl. Neuberger 1980, S.42).

    Google Scholar 

  161. Vgl. Kapitel IV.1.2 und IV.1.3.

    Google Scholar 

  162. ‘‘Subordinates (are) like products on an assembly line, to be accepted or rejected as a result of an inspection process” (Mc Gregor 1957, S.90).

    Google Scholar 

  163. “Playing God is something dangerously close to a violation of the integrity of the personality” (Mc Gregor 1957, S.90).

    Google Scholar 

  164. Vgl. Kapitel IV.1.2.

    Google Scholar 

  165. Lediglich in Fällen, in denen Kritik mit für den Beurteilten frustrierenden Erlebnissen zusammenfiel, wurde das Selbstvertrauen des Beurteilten derart erschüttert, daß seine Leistung in späteren Aufgaben darunter litt.

    Google Scholar 

  166. Vgl. einen Überblick zu Motivationstheorien und deren Grundlagen bei Holzkamp-Osterkamp (1981a; 1981b). Einen indirekten d. h. über zahlreiche Zwischenschritte wirksamen konzeptionellen Erklärungsversuch für den Zusammenhang von Motivation und Leistung vermittelt Mitchell (1983). Goodman/Fichman (1983) kritisieren an diesem Kettenmodell deren Theorie- und Konzeptionslosigkeit, weil in der Argumentation zahlreiche bestehende Motivationskonzepte vermischt werden und der Vorschlag empirisch nicht überprüfbar sei.

    Google Scholar 

  167. Die Verhaltensreaktion einer Person auf Feedback ist gewöhnlich mehrfach individuell determiniert. Wichtige Einflußgrößen sind zum Beispiel vorangegangene affektive Gefühle und kognitive Attributionen, Anspruchsniveau oder Erfahrungen (vgl. Farhn 1991, S.68f.).

    Google Scholar 

  168. vgl. auch einen Überblick der Kenntnis zu Motivations-Leistungszusammenhängen bei Six/Kleinbeck (1989, S.350ff.).

    Google Scholar 

  169. Auch wenn eine bestimmte “schlechte” Leistung möglicherweise stärker durch ein Team oder eine spezifische organisationale Konstellation zustande kommt.

    Google Scholar 

  170. Behaviorismus als Forschungsmethode geht zurück auf den amerikanischen Psychologen Watson (1930). Diese Forschungsrichtung bezeichnet ein verhaltenswissenschaftliches Programm, welches in methodischer Rigorosität lediglich beobachtetes Verhalten als Datenbasis zuläßt (vgl. Staehle 1989, S.135).

    Google Scholar 

  171. Der Behaviorismus ist im übrigen bekannt geworden durch seine Versuche mit Tieren. Da qualitative Unterschiede zwischen den Organismen verschiedener evolutionärer Entwicklungsstufen nicht berücksichtigt werden, gilt der Mensch zwar in quantitativer Hinsicht als komplexester Organismus. Wie alle anderen Organismen auch unterliegt er allerdings übergreifenden, allgemeinen Gesetzmäßigkeiten (vgl. Holzkamp-Osterkamp 1981a, S.229).

    Google Scholar 

  172. Vgl. zur funktionalen Überfrachtung und zu Zielkonflikten der Mitarbeiterbeurteilung Kapitel IV.2.1.

    Google Scholar 

  173. Dieser Motivationskonflikt ist abzulesen am sogenannten “Impression-Management”, der Bemühung der Beurteilten, den Eindruck, den sie auf andere machen, zu kontrollieren und zu steuern. Unbewußt wird dieser Steuerungsprozeß dazu benutzt, dem anderen ein bestimmtes Bild von sich zu repräsentieren, um angenehme oder erwünschte Reaktionen zu bewirken. Die These besagt, daß Impression-Management umso häufiger angewendet wird, je größer die wahrgenommene Abhängigkeit ist. Im Falle von Beurteilungen konnte der Einsatz von Impression-Management in zahlreichen Fällen nachgewiesen werden (vgl. Goffman 1985; Mummendey/Bolten 1985; Rosemann/Kerres 1986; Witte 1989; Wayne/Liden 1995).

    Google Scholar 

  174. Vgl. zu dirser Hypothese ausführlich Kapitel IV.6.

    Google Scholar 

  175. Vgl. die Diskussion zu Leistung als Konstrukt von Letztkriterien in Kapitel IV.2.2.1.1.

    Google Scholar 

  176. Vgl. hierzu die Wahrnehmungsmodelle von Borman und Feldman in Kapitel IV.2.2.2.

    Google Scholar 

  177. Vor allem Wirkungen von “Nicht-Leistungen” auf Beurteilungsergebnisse finden offenbar zu selten Berücksichtigung: “Because the field studies [...] have not examined the effects of nonperformance influences on performance evaluations as their main concern, these studies have not utilized multiple raters of different sex or race to assess each ratee. As a result, definitive statements concerning the effects of rater bias in these studies cannot be made” (Wendelken/Inn 1981, S.152).

    Google Scholar 

  178. Verstärkt wird Eindruck der Theorielosigkeit durch eine relative Isoliertheit der bisherigen Forschungsansätze, die konzeptionelle Grundlage empirischer Studien wurden (vgl. Solomon/Bishop/Bresser 1986, S.37). Zur Erklärung von Diskriminierungsergebnissen werden stereotypentheoretische und attributionstheoretische Argumente verwendet. Auf gleicher Ebene werden diese selten miteinander in Verbindung gebracht (Ausnahme: Nieva/Gutek 1980). Eine Einordnung dieser Ansätze in übergreifende Taxonomien oder Theorietraditionen zum Beispiel der Frauenforschung fehlt ebenfalls. Das innerhalb der Frauenforschung abgedeckte Untersuchungsgebiet des “Geschlechterverhältnis, Formen der Unterdrückung von Frauen, Möglichkeiten des weiblichen Widerstandes, weibliche Praxisfelder” und ähnliches (Knapp/Wetterer 1992, S.9) wird erkenntnistheoretisch, methodisch und auch im Hinblick auf den letztlich gewählten inhaltlichen Ausschnitt aus ganz verschiedenen Perspektiven bearbeitet. Die Abbildung von Begründungszusammenhängen über Stereotypen- oder Attributionstheorie ist hierbei nur eine von anderen möglichen und diskutierten und muß deshalb im Rahmen seriöser, wissenschaftlicher Ausführungen eine diesbezügliche Eindordnung erfahren. Vgl. hierzu Kapitel IV.5.3.2.

    Google Scholar 

  179. Die widersprüchlichen Ergebnisse konterkarieren eine Verallgemeinerung ohnehin.

    Google Scholar 

  180. Vgl. hierzu die bereits in der Zielsetzung der Arbeit formulierte Kritik an der Selektivität der wissenschaftlichen Arbeiten zu Mitarbeiterbeurteilung (Kapitel I.3). Nicht nur für das Beispiel von geschlechtsspezifischen Beurteilungen erstaunt im übrigen das konsequente Festhalten an den beschriebenen Forschungsdesigns ob der widersprüchlichen Ergebnisse.

    Google Scholar 

  181. Empirische Studien lassen sich vor allem unter Laborbedingungen relativ zügig durchführen und veröffentlichen. In einem Universitätssystem, daß seine Forscher auch nach quantitativen Outputgrößen wie Zahl der Veröffentlichungen beurteilt, mag die Tatsache einer schnellen Verwertung nicht unbedeutend sein.

    Google Scholar 

  182. Vgl. Kapitel II.3.3.

    Google Scholar 

  183. Wie zum Beispiel der Frauenforschung. Vgl. Fußnote 286.

    Google Scholar 

  184. Eine Nähe zu eigenschaftstheoretischen Argumenten ist aufgrund des Stabilitätskriteriums zu vermuten (vgl. Abele/Schaper 1995, S. 250).

    Google Scholar 

  185. Die Maximierung der genetischen Weitergabe aller Individuen ist die Grundannahme der Behavioral-Ecology-Theorie (vgl. Miersch 1996, S.35).

    Google Scholar 

  186. Vgl. zum Beispiel das Konzept der Erfolgsvermeidung von Homer (1972).

    Google Scholar 

  187. Neuere Ansätze der vorberuflichen “weiblichen Sozialisation” machen vor allem Diskontinuitäts- und Konflikterfahningen als Sanktionsmechanismus, d. h. für eine dem Stereotypen entsprechende Verhaltensweise (zum Beispiel bei der Berufswahl) verantwortlich (vgl. Krüger 1993). Darüber hinaus wird nicht nur vorberufliche Sozialisation als Träger von Lernprozessen proklamiert. Vor allem das als doppelte Vergesellschaftung (Integration von Frauen sowohl in die Erwerbs- als auch in die Familienarbeit) und die daraus resultierenden Integrations-, (Dis)Kontinuitäts- und Erfahningsfelder dienten als Bezugspunkt der beruflichen, geschlechtstypischen Sozialisation (vgl. Schiersmann 1993; Hoff/Theobald/Hörrmann-Lecher 1993).

    Google Scholar 

  188. Und beruht insofern auf einer halbierten Vermarktung der menschlichen Arbeitskraft (vgl. Beck-Gernsheim 1980).

    Google Scholar 

  189. Daß der Frau im Rahmen der Trennung von Berufs- und Privatwelt die häuslichen, abgewerteten Aufgaben zugefallen sind, wird neben dieser ökonomischen Argumentation auch anders begründet. Capra (1991) zum Beispiel interpretiert in der Zuteilung der häuslichen Tätigkeiten an Frauen ein weiteres Indiz der Unterwerfung der Natur unter die Technik (vgl. S.60). Indem Frau mit Natur auf eine Ebene gestellt wird (vgl. auch Zöhrer-Ernst 1994, S.208), dienen wiederum sehr stark stereotype Zuschreibungen an das Verhalten von Frauen als Argumente der Diskussion. Die Frau mit ihren weiblichen Eigenschaften wird als ein verlorengegangenes Paradies mystifiziert. Solche Ausführungen basieren nach wie vor auf der Verschiedenartigkeit der Geschlechter und erwecken den Eindruck, die Fremdheit des anderen Geschlechts durch Spiritualität beherrschbar zu machen (vgl. Pinl 1995, S.77). Navarra (1982) begründet die häusliche Betätigung der Frau mit der Etablierung des Bürgertums. Frauen oblag die Zurschaustellung eines erfolgreichen Geschäftsgebahrens von Ehemann und Söhnen. Daß sie zu Hause bleiben konnte und sich lediglich moralisch einwandfreien Beschäftigungen wie Kindererziehung und Organisation des Haushalts zuwenden durfte, unterschied sie von der Adels- wie auch von der Arbeiterfrau (vgl. S.37). Insofern liegt in dieser Argumentation ein standesspezifisches “bürgerliches” Interesse in der geschlechtstypischen Arbeitsteilung. Sozialistische Argumentation begründet die Zuweisung der häuslichen Tätigkeiten an die Frau mit der kapitalistischen Eigentums- und Erwerbsordnung. Sie gilt als ein Unterwerfungsmechanismus; eine vermeintliche -auch durch Arbeitgeberprogramme (wie beispielsweise Kochkurse für Arbeiterfrauen)- unterstützte Lösungsmöglichkeit der “sozialen Frage” (vgl. Bebel 1919, S.104).

    Google Scholar 

  190. Vgl. Kapitel IV.3.3.

    Google Scholar 

  191. Das entspricht einer Größenordnung von Zwillingsgeburten.

    Google Scholar 

  192. Die zitierte Studie bezieht sich auf Messungen des männlichen Geschlechtshormons Testosteron.

    Google Scholar 

  193. Vgl. zur Unterscheidung von Selbstbildern bei verheirateten und unverheirateten Frauen die Studie von Hall/Gordon (1973).

    Google Scholar 

  194. Abele/Klinke (1993) konnten weder mit der Bern’sehen Skala, noch mit Hilfe eines Männlichkeits- und Weiblichkeitsfragenbogens von Wollschläger (1981) Unterschiede in der Selbsteinschätzung männlicher und weiblicher Versuchspersonen ermitteln. Vgl. im Gegensatz dazu die ältere Untersuchung von Mc Kee/Sheriffs (1957).

    Google Scholar 

  195. Zu einem umgekehrten Schluß kommt Stäudel (1993) in ihrer empirischen Studie zu Entscheidungs- und Problemlösungsverhalten von Männern und Frauen. Zwar erzielten beide Geschlechter nahezu identische Ergebnisse bzw. zeigten ein vergleichbares Verhalten. Die erhobenen Selbstbilder und Selbsteinschätzungen unterschieden sich aber geschlechtstypisch und spiegelten vor allem bei den Frauen stereotype Vorstellungen über “weibliches Verhalten” wider.

    Google Scholar 

  196. Im einem anderen Land sind dagegen Alter oder Fähigkeiten von Bedeutung.

    Google Scholar 

  197. Bei Erfolg von Frauen: Glück oder Anstrengung; bei Erfolg von Männern: Fähigkeiten und Können

    Google Scholar 

  198. Bei dieser Studie handelt es sich um einer Felduntersuchung innerhalb der amerikanischen Militärakademie Westpoint. Während eines Kadettentrainings wurde eine vorgegebene, simulierte Leistung von Kadetten und Kadettinnen durch andere Kadetten (Probanden) beurteilt. Bei den zu Beurteilenden wurde durch Vignetten und sonstige Vorabinformationen versucht, geschlechtsneutral einen identischen Status zu fixieren.

    Google Scholar 

  199. Vgl. Kapitel IV.3.

    Google Scholar 

  200. Im übrigen sind durch die Berücksichtigung der motivationalen Funktion von Stereotypen, über methodische Unzulänglichkeiten hinaus, der eine oder andere Widerspruch in den empirischen Studien zu interpretieren.

    Google Scholar 

  201. Vgl. Kapitel IV.5.2.1.

    Google Scholar 

  202. Vgl. die Kapitel IV.5.1.2 bis IV.5.1.4.

    Google Scholar 

  203. Wenn zum Beispiel bei einem Urteiler ein starker Halo-Effekt auftritt, führt dieses zu einem verzerrten Urteil, mangelnder Objektivität, minderer Beurteilungsgüte und falscher Beförderungsentscheidung.

    Google Scholar 

  204. Innerhalb der wissenschaftlichen Auseinandersetzung

    Google Scholar 

  205. In der praktischen Umsetzung

    Google Scholar 

  206. Vgl. Kapitel III.2.1.1.

    Google Scholar 

  207. Der interessierte Leser greife zu gängigen Lehrbüchern der Organisationstheorie zum Beispiel Rogers (1975); Neuberger (1989b); Kieser (1992); Kieser (1995a).

    Google Scholar 

  208. Erhöhung der Tagesleistung der Roheisenverlader von 12,5t auf 47t und Senkung der Transport- und Verladekosten pro Tonne von $ 0,072 auf $ 0,033.

    Google Scholar 

  209. Vgl. Kapitel IV.5.2.

    Google Scholar 

  210. Eine Reaktion von Schmid (1983) auf diese Aussage von Goldman betont zum Beispiel die Ansicht, daß zwischen Mitarbeiter und Management deutliche Interessenunterschiede bestehen (vgl. S.353).

    Google Scholar 

  211. Vgl. Kapitel IV.5.1.2 und IV.5.3.1.

    Google Scholar 

  212. Es könnten gar zusätzliche Kosten entstehen, wenn durch Mitarbeiterbeurteilung verursachte Enttäuschungen und Unzufriedenheiten der beteiligten Individuen erfaßt werden könnten (vgl. Murphy/Cleveland 1995, S.348).

    Google Scholar 

  213. Vgl. auch Teil VII.

    Google Scholar 

  214. Die Identifikation eines Mythos und der damit einhergehende Schluß von existierenden Handlungsalternativen, die in ihren Konsequenzenund Beziehungen nicht vollständig bekannt sind, erweist die Annahme der vollständigen Rationalität des geschlossen-rationalen Modells als realitätsfremd.

    Google Scholar 

  215. Vgl. Kapitel IV.5.2.2 und hierin besonders die Ausführungen über motivatorische Wirkungszusammenhänge.

    Google Scholar 

  216. An dieser Stelle findet sich wiederum eine Analogie zum Taylorismus. Die tayloristischen, ideologischen Komponenten und sozialen Befriedungsstrategien auf gesamtgesellschaftlicher Ebene finden ihr Abbild auf betrieblicher Ebene durch traditionelle Mitarbeiterbeurteilung.

    Google Scholar 

  217. Grieger/Bartölke (1992) sehen darin weiterhin eine Zementierung und Sicherstellung der Management-Perspektive in der Forschung (S.91).

    Google Scholar 

  218. Die Festlegung von Beurteilern unter unreflektierter, hierarchiebedingter Rollenkonstellation kritisieren auch Domsch/Gerpott (1992, Sp.1634).

    Google Scholar 

  219. Es ist bezeichnend, daß nicht das aus Betroffenensicht “Unangenehme” der Mitarbeiterbeurteilung thematisiert wird, sondern die Verfahren als imgrunde den Interessen der Mitarbeiter dienend “verkauft” wird (Breisig 1990, S.348).

    Google Scholar 

  220. Unter einer Sozialtechnik wird verstanden: Ziel des Managements, das Bewußtsein der Beschäftigten zu beeinflussen. Sozialtechniken haben insofern einen Doppelcharakter, als daß sie trotz des Beeinflussungsziels scheinbar auf die Interessen der Mitarbeiter Rücksicht nehmen (vgl. Breisig 1989, S.12ff.). Im Vergleich zu anderen Sozialtechniken wie dem Konzept der teilautonomen Arbeitsgruppen, die in ähnliche Richtung wirken, ist die Mitarbeiterbeurteilung durch ihren hohen Formalisierungsgrad eine relativ bürokratische Sozialtechnik. Insofern wäre hier eine Analogie zum Bürokratiemodell von Weber (vgl. 1972) zu sehen.

    Google Scholar 

  221. Vgl. Kapitel IV.5.3.2.

    Google Scholar 

  222. Vgl. auch die Frau in den Medien in Kapitel I.1.

    Google Scholar 

  223. Und zur Entlastung des Mannes beiträgt

    Google Scholar 

  224. Vgl. die in Kapitel IV.5.3.2 dargelegten Ansätze zur Herleitung von Geschlechtsrollen.

    Google Scholar 

  225. Vgl. Kapitel IV.5.3.2.

    Google Scholar 

  226. Vgl zusammenfassend Elemente der Modernisierung bei Beck-Gernsheim (1983).

    Google Scholar 

  227. Die Biographie Taylors selbst ist ein dokumentiertes Beispiel für den Zusammenhang von Herrschaft, Selbstbeherrschung, Sublimierung und Selbstzerstörung (vgl. Krell 1984, S.188ff.).

    Google Scholar 

  228. Es ist anzumerken, daß der Stereotyp des “harten Mannes” nicht mehr überall unkritisch als existent betrachtet wird. So deuten Metz-Göckel/Müller (1985) mit Hilfe einer Befragung den Stereotyp des “harten Mannes” als Klischee, welches nicht mehr anzutreffen ist. Auch Männer wollen mehrheitlich Gefühle zeigen und finden es nicht mehr peinlich, wenn ein Mann weint (vgl. S. 139). Auf der anderen Seite bezieht sich dieser Punkt der Befragung allein auf den privaten Bereich. Es ist anzunehmen, daß für den beruflichen, stärker vergesellschafteten und damit als weniger subjektiv empfundenen Bereich der Stereotyp des “harten Mannes” noch verbreitet ist.

    Google Scholar 

  229. Scheub (1993) konnte darüberhinaus ermitteln, daß dann, wenn sich Männer zu ihren “weiblichen” und subjektiven Anteilen bekannten, dieser Prozeß nicht unter dem Gesichtspunkt einer Veränderung ihrer Beziehung zu Frauen stattfindet. Die Betrachtung von subjektiven Anteilen bei Frauen unter Defizitgesichtspunkten bleibt bestehen.

    Google Scholar 

Download references

Authors

Rights and permissions

Reprints and permissions

Copyright information

© 1998 Springer Fachmedien Wiesbaden

About this chapter

Cite this chapter

Hennersdorf, S. (1998). Mitarbeiterbeurteilung in traditioneller Perspektive. In: Aufstiegsdiskriminierung von Frauen durch Mitarbeiterbeurteilungen. Betriebliche Personalpolitik. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-663-08124-1_4

Download citation

  • DOI: https://doi.org/10.1007/978-3-663-08124-1_4

  • Publisher Name: Deutscher Universitätsverlag, Wiesbaden

  • Print ISBN: 978-3-8244-6683-2

  • Online ISBN: 978-3-663-08124-1

  • eBook Packages: Springer Book Archive

Publish with us

Policies and ethics