Mitarbeiterbeurteilung in traditioneller Perspektive

Hennersdorf, Susan

doi:10.1007/978-3-663-08124-1_4

Mitarbeiterbeurteilung in traditioneller Perspektive

Susan Hennersdorf

Chapter

91 Accesses

Part of the book series: Betriebliche Personalpolitik ((BPERSO))

Zusammenfassung

Aus einer Studie des Bundesarbeitsministeriums von 1975 geht hervor, daß 38 Prozent der befragten deutschen Unternehmen¹⁰⁹ für mindestens eine ihrer Mitarbeitergruppen eine systematische Beurteilung durchführen (vgl. bei Kador 1983, S.25). Heute, rund zwanzig Jahre später, werden Mitarbeiterbeurteilungen bereits in über neunzig Prozent aller deutschen Unternehmen eingesetzt (vgl. Stehle 1993, S.174). Mitarbeiterbeurteilung gilt deshalb nicht allein als ein verbreitetes, sondern mit Blick auf seine Verbreitungsgeschichte als relativ junges organisationales Instrument.¹¹⁰ Die im Rahmen der immanenten Analyse zuerst dokumentierte „traditionelle“ Perspektive ist als historisch ältere der beiden zu verstehen. Sie wurde durch die modernere „politische“ Perspektive aber nicht ersetzt und vollständig abgelöst, sondern besitzt in ihrem Anwendungsspektrum nach wie vor eine hohe Bedeutung. Die als zweites dargestellte „politische Perspektive“ ist deshalb als Ergänzung und nicht als Substitution der „traditionellen Perspektive“ zu verstehen.

Wir können sagen: alle unbestimmte und unbestimmbare Komplexität muß im mechanistisch vorgestellten System als Abfall registriert werden, weil er tendenziell die interne, triviale Ordnung sabotiert.

(Bardmann 1994, S.289)

This is a preview of subscription content, log in via an institution.

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 49.99; Price excludes VAT (USA)

Softcover Book: USD 49.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Learn about institutional subscriptions

Preview

Unable to display preview. Download preview PDF.

Referenzen

Stichprobenelemente der Studie waren Industrieunternehmen sowie Banken und Versicherungen.
Google Scholar
Auch wenn außerhalb des unternehmerischen Kontextes die Beurteilung von Fähigkeiten und Tätigkeiten von Menschen eine zweitausendjährige Tradition besitzt (zum Beispiel Wei Dynastie in China von 221–265, der Kirche).Vgl. einen historischen Überblick bei Lattmann (1975b, S.17ff.).
Google Scholar
Vgl. Kapitel III. l.
Google Scholar
Greve/Wentura (1991) gehen allerdings davon aus, daß eine strenge Abgrenzung der Begriffe unangemessen wäre, weil Beurteilung auch Teil des Messens sein kann (vgl. S. l0ff.)
Google Scholar
Andere als formalisierte Beurteilungen zum Beispiel “beim Einkaufen, im Alltagsgespräch” sind per definiti-onem ausgeschlossen (vgl. Crisand/Stephan 1994, S.11).
Google Scholar
Vgl. zur Potentialbeurteilung -Bestandteil der politischen Perspektive- Kapitel V. l.3.
Google Scholar
Vgl. einen Überblick zu (angewandten) Methoden der Arbeitsbewertung bei Zander (1970, S. 115ff.) und Wöhe (1986, S.195ff.). Vgl. zur Kritik dieser Methoden und deren Anwendung unter dem Gesichtspunkt von Entgeltdiskriminierung gegen Frauen Krell (1994a).
Google Scholar
Vgl. zur Kritik zum Beispiel Krell/Winter (1997)
Google Scholar
In zahlreichen Personallehrbüchern wird diese Funktion häufig verkürzend beschrieben mit “der richtige Mann sollte für den richtigen Platz ausgewählt werden”. Eine derartige Umschreibung dieser Funktion der traditionellen Mitarbeiterbeurteilung mag bereits als “Vorgeschmack” der Diskriminierungsanalyse in Kapitel IV.3 verstanden werden. Vgl. vorerst die Erörterung dieser “Funktionsbeschreibung” aus der Perspektive weiblicher Mitarbeiter bei Gerhard/Osterloh/Schmid (1993, S.34).
Google Scholar
Beginnend bei Einstellung über die Personal Versetzung bis hin zur Freisetzung.
Google Scholar
Hinsichtlich der Informationsfunktion ist zu betonen, daß Mitarbeiterbeurteilung zumindest indirekt vom Betriebsverfassungsgesetz geboten ist (vgl. §82, Abs.2, BetrVG). Dem Anspruch des Gesetzes kann ein Unternehmen am leichtesten durch eine allgemein verbindliche und einheitliche betriebliche Beurteilung nachkommen (vgl. Berkel/Herzog/Schmid 1987, S.11).
Google Scholar
Im englischsprachigen Raum wird in der Regel der Ausdruck “performance appraisal” verwendet. Dieser Begriff kann nicht überall als -identische Sachverhalte bezeichnende- geeignete Übersetzung von “Mitarbeiterbeurteilung” verstanden werden. “Performance appraisal” tituliert eine sehr viel stärker empirisch geleitete Forschung als der deutsche Begriff (vgl. Lattmann 1975b, S.20). Unterschiede zwischen deutschsprachigen und angelsächsischen Ansätzen werden deshalb, sofern bedeutsam, explizit dargestellt.
Google Scholar
Denkbar wären zur Gehaltsfestsetzung ebenso andere (leistungsunabhängige) Organisationale Instrumente wie zum Beispiel Gehalt nach Alter (vgl. Zander 1970, S.14), per Vorgesetztenentscheidung oder nach Formalqualifikation.
Google Scholar
Vgl. Kapitel IV. 1.2.
Google Scholar
Zum Beispiel als Terminus “Kraft x Weg”. In der Physik ist Leistung eindeutig bestimm- und meßbar, d. h. in eindeutigen Einheiten angebbar: 1PS=735.49874W (vgl. Jung 1979, S.396).
Google Scholar
Leistungsverhalten wird wiederum konstituiert aus den Komponenten Leistungsfähigkeit und Leistungsbereitschaft (vgl. Crisand/Stephan 1994, S.15).
Google Scholar
Vgl. das “gemeinsame Anliegen” in diesem Kapitel und in Kapitel IV. 1.2.
Google Scholar
Vgl. die detaillierte und kritische Auseinandersetzung mit dem Leistungsprinzip in Kapitel VII.3.1.
Google Scholar
vgl. weitere Funktionen des Leistungsprinzips bei Becker (1994b, S.102L).
Google Scholar
Vgl die organisationale Abbildung des Leistungsprinzips durch Mitarbeiterbeurteilung in einer anderen Interpretation in Kapitel VII.3.2.
Google Scholar
Die Messung der Zuverlässigkeit setzt im übrigen ein Mindestmaß an Objektivität voraus. Können bei Vorliegen einer mangelnden Objektivität (zum Beispiel hohe Interkorrelationen der Urteilsvarianzen), die in der klassischen Testtheorie (vgl. Schlittgen 1996, S.327ff.) vorausgesetzten wiederholten Messungen zur Bestimmung der Zuverlässigkeit nicht durchgeführt werden, empfiehlt es sich, das Zuverlässigkeitskriteriums durch das Konzept der Generalisierbarkeit zu ersetzen (vgl. Brandstätter 1970, S.706). Beim Konzept der Generalisierbarkeit wird für den Fall der Beurteilungen nach Cronbach (1955) geschätzt, wie weit die unter den spezifischen Bedingungen einer Beurteilungssituation gewonnenen Aussagen auf eine bestimmte Gesamtheit von Urteilsbedingungen verallgemeinert werden können.
Google Scholar
Zu den unterschiedlichen Arten der Validität (zum Beispiel Inhalts Validität, Konstruktvalidität) vgl. Schuler (1989b, S.12ff.) und Kompa (1990, S.590ff.).
Google Scholar
Das heißt Annahmen darüber, in welchen kognitiven Schritten Urteile im allgemeinen und Mitarbeiterbeurteilungen im besonderen durch einen Beurteiler gebildet werden. Kapitel IV.2.2.2 gibt einen Überblick über die verschiedenen, diskutierten Beurteilungsprozesse.
Google Scholar
Aus diesem Unterschied zwischen anglo-amerikanischen und deutschsprachigen Veröffentlichungen allerdings die Kritik zu begründen, neueste deutschsprachige Untersuchungen ständen neueren US-amerikanischen empirischen Erkennmissen in Qualität nach (vgl. Lueger 1993, S.7 und Becker 1994b, S.231) ist meines Erachtens nicht zulässig. Kapitel IV.5.1.2 und Kapitel IV.5.3.1 setzen sich dezidierter mit den Schwächen der amerikanisch-empirischen Forschung und deren Gütemerkmalen auseinander.
Google Scholar
Vgl. zur Kritik an “idealen” Beurteilungsabläufen Kapitel IV.5.
Google Scholar
Vgl. eine Sammlung situationsübergreifend als wichtig erachtete Beurteilungsmerkmale bei Fischer (1973, S.138f.).
Google Scholar
Der Vorgesetzte ist deshalb am geeignetesten, weil er die Anforderungen einer Aufgabe zum Beispiel durch eine Arbeitsplatzbeschreibung kennt, Verständnis für die Arbeitssituation mitbringt, in der Regel in Kontakt zu dem Mitarbeiter steht und damit -aus der Situation begründet- die Möglichkeit einer umfassenden Beobachtbarkeit des Verhaltens gegeben ist. Sollten die für einen Urteiler beschriebenen Anforderungskriterien nicht erfüllt sein, kann anstelle des direkten Vorgesetzten auch ein anderer, dem zu Beurteilenden rangmäßig überlegener Mitarbeiter die Beurteilung vornehmen (vgl. Knebel 1992, S.63). Eine solche Indikation wäre zum Beispiel gegeben bei der Beurteilung eines Innendienstverkäufers, dessen unmittelbarer Vorgesetzter ein Gebietsleiter im Außendienst ist und dem es wegen der räumlichen Distanz an Beobachtungsmöglichkeiten fehlt (vgl. Curth/Lang 1991, S.25).
Google Scholar
Im Hinblick auf die beurteilten Dimensionen eines Mitarbeiters besitzt die freie Beurteilung häufig den Charakter einer Persönlichkeitsbeurteilung (vgl. Curth/Lang 1991, S.242). Vgl. hierzu die Ausführungen in Kapitel IV.2.2.1.2.
Google Scholar
Hierzu gehören zum Beispiel summarische Rangordnungsverfahren, Paarvergleiche und Verfahren der erzwungenen Verteilung (vgl. Becker 1994b, S.253ff.).
Google Scholar
Bei größeren Gruppen geht man dazu über, statt einer summarischen Rangreihe für alle Mitarbeiter in einem Schritt, über multiple Paarvergleiche in vielen Zwischenschritten letzlich eine Gesamtrangordnung herzuleiten. Gegen diesen “Mann-zu-Mann”-Vergleich (Bartölke 1972b, S.653) spricht allerdings der hohe kombinatorische und zeitliche Aufwand.
Google Scholar
Es Skann keine Gleichheit von zwei Personen geben. Die Neuplazierung einer Person in der Rangreihe bedeutet automatisch auch die Neuplazierung zumindest einer weiteren Person. Wird eine Person besser beurteilt, muß automatisch mindestens eine andere Person in der Rangreihe sinken.
Google Scholar
Zu der Methode der “kritischen Ereignisse” im weiteren Sinne gehören im speziellen das Check-List-Verfahren, das Zwangswahlverfahren und das Verfahren der kritischen Ereignisse im engeren Sinn. Das Verfahren der kritischen Ereignisse i.e.S. ist als eigenständiges Verfahren wie auch als Basis der beiden ersten Verfahren zu verstehen (vgl. Becker 1994b, S.256ff.).
Google Scholar
In einer verhaltensorientierten oder aufgabenorientierten Variante (vgl. Capol 1965). Vgl. zu neuesten verhaltensorientierten Skalierungen Kapitel IV.2.3.1.4.
Google Scholar
Häufig liegt eine fünf- bis siebenstufige Likert-Skala vor (vgl. Likert 1967/1975).
Google Scholar
Vgl. hierzu Kapitel IV.2.2.1.4
Google Scholar
Validitäten (vgl. Kapitel IV. 1.4) werden in Form von Validitätskoeffizienten ausgedrückt. Validitätskoeffizienten sind als bestimmte Form von Korrelationskoeffizienten zu verstehen. Im spezifischen Fall der Validitätsbe-trachtung wird zum Beispiel bei der Konstruktvalidität die Korrelation zwischen dem, was ein Kriterium mißt und dem, was es tatsächlich messen soll, berechnet. Vgl. zur Kritik an der Berechnung von Validitätskoeffizienten Ulrich (1989, S.312ff.).
Google Scholar
Unter einer ergebnisbezogenen Beurteilung wird in diesem Zusammenhang die Beurteilung auf Basis quantitativer Zielvorgaben verstanden. Kramer (1996) ist der Auffassung, daß jede Funktion meßbare und insbesondere quantitative Ziele besitzt, die als Grundlage ergebnisorientierter Kriterien gelten können (vgl. S.102).
Google Scholar
Vgl. Kapitel IV.3.2.1 zur detaillierteren Unterscheidung nach Kriteriendimensionen.
Google Scholar
Für das diesbezüglich entstehende Entscheidungsproblem gibt es lösbare lineare Optimierungsmodelle (vgl. Bainter 1994).
Google Scholar
Zum Beispiel Messung der Arbeitsleistung als Produktionsmenge pro Zeit.
Google Scholar
Vgl. Zur detaillierten Analyse bzw. Kritik der eigenschaftsorientierten Skalierungen Kapitel IV.2.2.1.2.
Google Scholar
Vgi zur “Politischen Perspektive” Teil V.
Google Scholar
Im Laufe der Analyse wird sich der Titel allerdings auch unter inhaltlichen Gesichtspunkten als adäquat herausstellen. Vgl. Kapitel IV.6.
Google Scholar
Vgl. Kapitel IV.1.4 und Kapitel IV.1.5.
Google Scholar
l53 Vgl. zum Beispiel Brandstätter (1969) und DeNisi/Cafferty/Meglino (1984).
Google Scholar
Geringe Einflüsse amerikanischer Prägung finden sich in deutschen Veröffentlichungen nur vereinzelt (zum Beispiel bei Hampp/Hilgenfeld 1985; Schuler 1989a).
Google Scholar
Trägt eher der deutschsprachigen Herangehensweise Rechnung, enthält aber in der empirischen Aufarbeitung deutlich angelsächsische Einflüsse.
Google Scholar
Zum Beispiel Entgeltpolitik, Beförderung.
Google Scholar
Zum Beispiel “neutraler Richter” versus “kooperative Führungskraft”?
Google Scholar
Zum Beispiel Agitation des Urteilers als Mitarbeiter desselben Unternehmens, d. h. als Kollege oder als hierarchisch übergeordneter Urteiler?
Google Scholar
Eine explizite Definition von Beurteilungsfehlern und übergreifende Ursachen ihrer Entstehung finden sich allerdings nicht. Diese Definitionslücke gilt auch für die amerikanischen, wahrnehmungstheoretischen Arbeiten, die eigentlich für sich postulieren, gerade jene Black-Box (vgl. Becker 1994b, S.199) im Urteiler näher zu erläutern, die in anderen Ansätzen nicht thematisiert wird.
Google Scholar
Im der Druckertechnik wird unter einem Stereotypen ein häufig wiederholbarer Druckvorgang mit einer Stereotypendruckplatte verstanden (vgl. Dorsdowski 1992, S.709).
Google Scholar
Unter impliziten Persönlichkeitstheorien werden individuelle Vorstellung darüber verstanden, wie eine Person (zum Beispiel eine Führungskraft) ist bzw. zu sein hat (vgl. Neubauer 1989, S.191).
Google Scholar
De Beurteilertypologie soll den Charakter eines Beurteilers vermitteln: “Jeder Mensch ist ein Produkt aus Erbanlagen und Umwelteinflüssen. Sie prägen ihn zum ‘Typen’. Dementsprechend wird seine Beurteilung immer eine für ihn ‘typische’ Form ausmachen. Er kann sozusagen ‘vaus seiner Haut’ nicht heraus (vgl. Knebel 1992, S.55).
Google Scholar
Grundlagen dieser Wahmehmungsverzerrungen finden sich bei Helson (1948; 1964). In zwei Studien konnte er nachweisen, daß sich abhängig von Stärke und Reihenfolge physikalischer Reize und der Nachwirkung sowohl der früheren als auch der gegenwärtigen Serie von Reizen ein Reiz-Adaptionsniveau herausbildet. Dieses Adaptionsniveau dient als Bezugpunkt der Beurteilung. Wenn das Adaptionsniveau genau erreicht wird, führt dieses zu einer mittleren Bewertung.
Google Scholar
Vgl. Kapitel IV. 1.4.
Google Scholar
Überwiegend amerikanisch-empirische Arbeiten.
Google Scholar
Vgl. Kapitel IV.1.4.
Google Scholar
Vgl. Kapitel IV. 1.1.
Google Scholar
Vgl. Kapitel II.2.2.1.
Google Scholar
Was ist zum Beispiel “Persönlichkeitsreife”? (vgl. Müller 1975, S.476).
Google Scholar
Vgl. Kapitel IV.1.1.
Google Scholar
In der englischsprachigen Literatur werden diese Verfahren eingeführt unter dem Namen BARS (Behavior Anchored Rating Scales). Später wird aber auch der Name BES verwendet (Behavior Expectation Scales). Hier soll mit VES eine deutschsprachige Abkürzung verwendet werden. Weitere Abkürzungen finden sich bei Weinert (vgl. 1981, S.307ff.).
Google Scholar
Das Problem des Letztkriteriums (vgl. Kapitel IV.2.2.1.1) scheint hierdurch reduzierbar.
Google Scholar
Skalierungen können auch zwischen den Ankern liegen. Die Anker dienen lediglich dazu, ein konzeptionelles Beispiel für die Skalierung von tatsächlich beobachtetem Verhalten zu geben (vgl. Domsch/Gerpott 1985, S.672).
Google Scholar
Ausgehend von diesem durch Smith/Kendall entwickelten BARS wurden in der nachfolgenden wissenschaftlichen Diskussion dieser Verfahren eine Reihe von Modifikationen vorgeschlagen. So ist zum Beispiel denkbar, am Prozeß der Skalenentwicklung nicht nur die Beurteiler, sondern auch die Beurteilten oder sonstige untere Hierarchieebenen einer Organisation einzubeziehen (vgl. Zedeck et al. 1974, S. 250f.; Zedeck/Jacobs/Kafry 1976, S.112ff.; Ivancevich 1980, S.159ff.). Auch hinsichtlich der Abfolge des Skalenentwicklungsprozesses werden abweichende Vorgehensweisen vorgeschlagen (vgl. zum Beispiel Campbell et al. 1973, S. 16ff.; Schwab/Heneman/De Cotiis 1975, S.550; Latham/Fay/Saari 1979, S.300f). Vgl. hierzu Kapitel V. l.5.
Google Scholar
Vgl. eine kritische Auseinandersetzung mit der gewählten empirischen Methodik in Kapitel IV.5.1.2 und Kapitel IV.5.3.1.
Google Scholar
Vgl. zur “Abspeicherung” von Verhaltensbeobachtungen auch Kapitel IV.2.3.2.
Google Scholar
In englischsprachigen Raum werden VBS als BOS (Behavior Observation Scales) bezeichnet.
Google Scholar
Siehe auch Kapitel IV. 1.5.
Google Scholar
Siehe auch Kapitel IV.1.5.
Google Scholar
übereinstimmungsgrad in zeitbezogener Betrachtung, d. h. so wie der Urteiler vor einem Monat urteilte, fällt auch das heutige Urteil aus.
Google Scholar
Innerhalb der Sozialpsychologie werden die gestalttheoretische, die kognitive, die lemtheoretische, die soziologische und die psychoanalytische Orientierung unterschieden. Der kognitive Ansatz der Sozialpsychologie ist experimentell ausgerichtet. Es wird von der Alltagserfahrung -zum Beispiel im Sinne der ganzheitlichen Wahrnehmung sozialer Ereignisse- ausgegangen (vgl. Heinz 1992, S.709).
Google Scholar
Durch den Anspruch der empirischen Überprüfung unterscheiden sie sich von den zuvor beschriebenen, stärker psychometrisch orientierten Publikationen. Dieser Sachverhalt ist erstaunlich. Gerade psychometrische Verfahren böten aufgrund ihrer Nähe zur statistische Testtheorie und der damit relativ leichten Operationalisierbarkeit eigentlich eine gute Basis für empirische Forschungsdesigns. Möglicherweise liegt dieser Sachverhalt in der grundsätzlich unterschiedlichen Forschungstradition deutschsprachiger “Kaufleute” und amerikanischer “Managementforscher” begründet (vgl. Staehle 1989, S.88ff.).
Google Scholar
Vgl zum Vorwurf eines rein praxisorientierten Verwertungsinteresses von Publikationen zur Mitarbeiterbeurteilung Kapitel I.3. Vgl. zur Kritik der vermeitlich wissenschaftlichen Methodik der kognitiven “Prozeßschule” die Kapitel IV.5.1.2 und IV.5.3.1.
Google Scholar
Vgl. Kapitel IV.2.2.1.4.
Google Scholar
Vgl. Kapitel IV.1.5.
Google Scholar
Allerdings werden in den betreffenden Studie lediglich zwölf Prozent der Bewertungsvarianz durch Rasse und Geschlecht dagegen aber siebzig Prozent durch Variation der erbrachten Leistung bei den Probanden erklärt (vgl. Schmitt/Lappin 1980). Das Argument einer höheren Güte (vgl. Kapitel IV. 1.4) von Bewertungen bei rassen- und geschlechterbezogener emotionalen Nähe ist nach dieser Studie mithin nur als Trend zu verstehen (vgl. Pulakos/White/Oppler/Borman 1989).
Google Scholar
Diese Sicht Bormans führt neben einer Abkehr psychometrischer Argumente auch zu einer Abkehr der psychometrischen Gütekriterien. Borman arbeitet verstärkt mit dem Accuracy-Merkmal. Vgl. Kapitel IV. 1.4.
Google Scholar
Zum Beispiel hinsichtlich des Aufgabeninhalts einer über die Beurteilung zu besetzenden Stelle.
Google Scholar
Aufgrund der Borman’sehen Argumentation eines über Persönlichkeitstheorien gesteuerten bzw. geordneten Wahrnehmungsprozesses ist die Beurteilungsgenauigkeit negativ korreliert mit der Auffassung des Urteilers über die Variabilität der menschlichen Natur (vgl. Schmitt/Lappin 1980; Wexley/Youtz 1985). Ein Zusammenhang zwischen der kognitiven Komplexität eines Urteils und die Art der Denkstrukturen eines Urteilers im Hinblick auf die Genauigkeit des Urteils wird dagegen empirisch negiert (vgl. Bernardin/Cardy/Carlyle 1982).
Google Scholar
Es muß eine kategoriale Einordnung der Information vorgenommen werden.
Google Scholar
An dieser Stelle ist die Verbindung zu Bormans Modell der dimensionalen Schemata zu sehen.
Google Scholar
“The search for performance information is sensitive to the demands of the situation. Raters may for example actually require different information to reach appraisal decisions for different purposes” (Williams/DeNisi/Blencoe/Cafferty 1985, S.335).
Google Scholar
Landy/Farr (1980) entwickelten ein Prozeßmodell, welches versucht, Erkenntnisse zu Wahrnehmungsprozessen mit jenen aus der psychometrischen Forschungsrichtung zu kombinieren. Dieses Modell enthält die nach Auffassung der Forscher relevanten Variablen in ausdifferenzierter Form (vgl. S.321). Entstanden ist allerdings ein Gebilde, welches sich im höchsten Maße komplex darstellt, so daß dieses Modell weder empirisch zu testen, geschweige denn praktisch anwendbar ist.
Google Scholar
Es werden Studenten Videofilme gezeigt, bei denen ein Hochschullehrer zu bewerten ist. “Three of five dimensions of performance were manipulated to be opposite to that of the lecturers overall performance” (Nathan/Lord 1983, S. 102).
Google Scholar
Auf der anderen Seite sind diese beiden Studien aufgrund der nicht explizit zugrunde gelegten Verwendung der Genauigkeitsmessung mit Vorsicht zu genießen. Murphy/Reynolds (1988) untersuchten die Konsistenz der Leistung von Beurteilten über verschiedene Leistungskriterien hinweg. Sie maßen Genauigkeit mit Hilfe der True-Score-Methode und fanden heraus,”[...] that the level of true halo in ratees’performance only affected the intercorrelation among performance dimension ratings when true level of intercorrelation was extremely high or extremely low” (S. 238; vgl. auch Murphy/Jako 1989). Diese Ergebnisse sprechen dafür, einen Halo-Effekt nicht unbedingt im Widerspruch zu dem Borman’sehen Modell zu betrachten. Möglicherweise liegt die mangelnde Fähigkeit der Beurteiler, sich an beobachtetes Verhalten zu erinnern und deshalb der Rückgriff auf die Feldman’sehe globale Kategorisierung nur in Extremsituation (sehr hohe oder sehr niedrige von True-Score-Experten geschätzte Interkorrelation der Beurteilungskriterien) vor.
Google Scholar
Vgl. Kapitel IV.2.1.
Google Scholar
Vgl. Kapitel IV.1.1.
Google Scholar
Vgl. Kapitel IV.2.4.
Google Scholar
Besonders in der angelsächsischen Forschung
Google Scholar
“Human resource managers have approached the elimination of wage differences [...] by developing sophisticated and unbiased performance appraisal techniques designed to base evaluation of women on actual performance rather than on stereotypes” (vgl. Drazin/Auster 1987, S.158f.).
Google Scholar
Insofern übernehmen Stereotype eine kognitive Funktion zur Reduktion von Komplexität. Eine weitere ebenfalls diskutierte Funktion einer Stereotypisierung emotionaler Art, zum Beispiel zur Verteilung von Macht, Herrschaft (vgl. Alfermann 1993, S. 303) findet an dieser Stelle keine Anwendung.
Google Scholar
Bei Alfermann (1993, S. 309f.) findet sich am Beispiel einer häufig reproduzierten Studie von Goldberg (1968) eine relativ detaillierte Beschreibung des empirisch-experimentellen Untersuchungsdesigns, an dem sich die überwiegende Zahl der Forscher orientiert. Sofern nicht anders gekennzeichnet, handelt es sich bei den nachfolgend zitierten Studien (zumeist männlicher Urheberschaft) um Laborexperimente, bei denen Studenten unterschiedlicher Seniorität als Probanden (Urteiler) dienen, sich die Vermittlung der zu beurteilenden Tätigkeit an die studentischen Beurteiler über Video-Clips oder materialisierte Leistung (zum Beispiel ein Aufsatz, ein gemaltes Bild) vollzieht und ein Einstufungsverfahren mit unterschiedlichen bzw. variierten Skalierungen verwendet wird.
Google Scholar
Geschlechtsrollen selbst sind allerdings nicht Gegenstand der jeweiligen Untersuchungen. Der Begriff sowie theoretische Überlegungen hinter diesem Begriff werden im Rahmen der empirischen Studien in der Regel nicht problematisiert.
Google Scholar
Ein ähnliches Phänomen wurde im übrigen auch für zu beurteilende Männer identifiziert, wenn diese sich nicht konform mit der männlichen Geschlechtsrolle verhielten (im Fall einer hohen Familienorientierung) (vgl. Rosen/Jerdee 1973).
Google Scholar
Die Geschlechtsrollenidentität wurde im Vorfeld der Studie mit Hilfe der von Bern (1974; 1975) entwickelten BSRI-Skala (Behavior Sex Role Identification) ermittelt. Nach dieser Skala kann ein Beurteiler entweder eine “sex typed identity” (weiblich oder männlich) oder eine “non sex-typed identity” (neutral: weder weiblich noch männlich oder androgyn: sowohl männlich als auch weiblich) annehmen.
Google Scholar
In dieser Studie mit 59 Collegestudenten wurden zwei Gruppen gebildet. Der einen Gruppe wurde vermittelt, daß die zu beurteilende Aufgabe normalerweise von Männern besser ausgeführt wird, der anderen Gruppe entsprechend vermittelt, daß Frauen sich in der Regel bei dieser Aufgabe besser bewähren (vgl. Lee 1987, S.153).
Google Scholar
Diese beiden Forscher testeten die Fragen, “[whether] the perceived masculinity/feminity of the raters and the congruence of those characteristics with the job type may have an influence in the bias process independent of social category (man/woman)” (Maurer/Taylor 1994, S.232).
Google Scholar
Die vier Führungsstile wurden bezeichnet als: initiating structure [hier: strukturiert], consideration [hier: beziehungsorientiert], production emphasis [hier: aufgabenorientiert], tolerance for freedom [hier: partizipativ].
Google Scholar
Eine 1985 in Israel durchgeführte Replikationsstudie mit dem von Bartol/Butterfield angewendeten Untersuchungsdesign konnte deren Ergebnisse nicht bestätigen (vgl. Izraeli/Izraeli 1985). Die Autoren der Replikationsstudie stellen die Ergebnisse von Bartol/Butterfield dennoch nicht in Frage, sondern begründen die Abweichungen mit kulturellen Unterschieden zwischen Israel und den USA sowie durch leicht modifizierte Auswahlkriterien der studentischen Beurteiler.
Google Scholar
Die daraus abgeleitete implizite Schlußfolgerung, daß Frauen nicht führen könnten, kann unter anderem dazu verleiten, daß Frauen unabhängig vom Instrument der Mitarbeiterbeurteilung weniger gefördert und beobachtet werden (vgl. Parkin/Hearn 1987, Sp.330; Friedel-Howe 1995, S.456). Krell (1997b) unabhängig davon daraufhin, daß die Schlußfolgerung, daß Frauen im Vergleich zu Männern schlechter, besser oder gleich gut führen könnten, häufig von der Perspektive des Betrachters abhängt (vgl. S.8).
Google Scholar
Selbst Karriereratgeber für Frauen führen die Unterrepräsentanz von Frauen auf einen Widerspruch zwischen geschlechtstypischen, weiblichen Eigenschaften und vermeintlichen Anforderungen an eine Führungkraft zurück (vgl. Abele/Schaper 1995, S.237).
Google Scholar
Zur Erklärung dieser Skala vgl. Fußnote 205.
Google Scholar
Die Differenz in der Selbsteinschätzung nimmt jedoch mit zunehmender Erfahrung der weiblichen Probanden ab (vgl. zum Beispiel deutliche Unterschiede zwischen Studentinnen im Grund- und Hauptstudium). Neben der Verwendung dieser Ergebnisse für die Dokumentation eines männlichen Führungsstereotypen, sind diese Ergebnisse ein Indiz für eine Selbstselektion von Frauen (vgl. Powell/Butterfield 1979, S.401). Bei Frauen wird im Zuge der Berufssozialisation das Konzept von “Frau” männlicher, jenes von “Führungskraft” weiblicher (vgl. Steins/Wickenheiser 1995, S.79). Als Begründung für dieses empirisch nachweisbare Phänomen dienen tägliche Erfahrungen der beruftätigen Frauen: Durch positives Feedback, Erfolg, Beförderung und sonstige verbale Aktivität (vgl. Stimpson/Robinson/Gregory 1986) werden die ehemals starken Hypothesen der “schwachen” Frau und der “männlichen” Führungskraft” von weiblichen Führungskräften immer wieder in Frage gestellt und abgeschwächt.
Google Scholar
Vgl. eine ähnlich geführte empirische Diskussion bezogen auf Altersstereotype bei Cleveland/Landy (1983).
Google Scholar
Ausgehend von den Civil-Right-Acts des Jahres 1964, in denen unter anderem eine geschlechts-, rassen-, altersbezogene Diskriminierung verboten wurde, ist in diesem Zusammenhang vor allem auf das Affirmative Action Program (AAP) zu verweisen. Im Vergleich zum alleinigen Versuch, Diskriminierung abzubauen, ist das AAP zusätzlich durch das Bestreben gekennzeichnet, den Anteil unterrepräsentierter Mitarbeitergruppen zu erhöhen (vgl. Benett-Alexander 1990).
Google Scholar
Im Vergleich zu den sonst zitierten (experimentellen) Labor-Studien wird in dieser Studie von Thompson/Thompson (1985) eine andere Erhebungsmethodik verwendet. Es liegt eine Feldstudie vor. Im Rahmen von Felduntersuchungen inkludiert das Forschungsdesign eine Beurteilungssituation mit realen Akteuren von ausgewählten Unternehmen. Feldstudien sind nicht durch die für Laborexperimente typischen vollständig kontrollierbaren Versuchsbedingungen gekennzeichnet.
Google Scholar
Vgl. Kapitel IV.2.2.
Google Scholar
Vgl. zu Kritik der Methodik Kapitel IV.5.1.2 und Kapitel IV.5.3.1.
Google Scholar
Trotz der umstrittenen Ergebnisse, werden die zitierten und weitere Studien mit ähnlicher Methodik und Fragestellung in den USA herangezogen, um Diskriminierungsfragen und -klagen abzuweisen. Insofern ist um Fragen zu Beurteilungsverfahren und deren potentieller Zusammenhang mit Diskriminierung eine wissenschaftliche Diskussion um Forschungdesigns und Meßinstrumente entbrannt. Obwohl die überwiegende Zahl der Veröffentlichungen zu diesem Thema (vgl. einen Überblick bei Bennett-Alexander 1990) psychometrische Argumentationslinien um Themen der Genauigkeit, Validität und ähnliches vertreten, sind ihre Ergebnisse teilweise zu einem Politikum geworden: “We must conclude that the (scientific) burden is certainly on those experts who maintain that there is some causal connection between a particular deleterious outcome for some protected class members” (Bernardin/Hennessey/Peyrefitte 1995, S.73).
Google Scholar
Vgl. Kapitel IV.5.3.1.
Google Scholar
Vgl. Kapitel IV.2.2.2.
Google Scholar
Der Begriff “Infonnationskategorisierung” stammt von Feldman. Er entspricht bei Borman den Prozeßkomponenten “Evaluieren” und “Gewichten”.
Google Scholar
“Although sex of subject had an effect in terms of the subject’s expectations for his own performance, there was no evidence that the subject’s own sex related to his or her evaluation of either male or female stimulus persons” (Deaux/Emswiller 1974, S.84).
Google Scholar
Vgl. zum Beispiel “Frauen, die es geschafft haben” bei Metzler (1985).
Google Scholar
Vgl. Kapitel IV.2.2.2.
Google Scholar
Im Sinne Bonnans wäre Geschlecht hier als eine Dimension der Persönlichkeit des Urteilers zu verstehen.
Google Scholar
Vgl. Fußnote 205.
Google Scholar
Ausmaß an Vorabinformationen, auf die ein Urteiler zurückgreifen kann und Ausmaß der verlangten Zukunftsorientierung.
Google Scholar
Vgl. Kapitel IV. 1.1.
Google Scholar
So wird zum Beispiel davon ausgegangen, daß die Kenntnis gängiger Attributionsmodelle von weiblichen im Vergleich zu männlichen Arbeitsergebnissen ausreicht, diskriminierende, durch stereotype Attribution verursachte Effekte zu reduzieren (vgl. Heilmann/Guzzo 1978, S.355).
Google Scholar
Dazu gehören: “Konzentiert beobachten, Beobachtungen nicht deuten, regelmäßig und fortlaufend beobachten”.
Google Scholar
Meta-Analysen ergaben, daß Wahrnehmungsverzerrungen eher durch interaktive Trainings reduzierbar seien (vgl. Smith 1986). Andere bezweifeln dies (vgl. Pulakos 1984).
Google Scholar
Vor allem bei bestehender großer Unsicherheit (vgl. Mc Farlan Shore/Thornton III 1986)
Google Scholar
In attributionstheoretischer Überlegung könnten diese Ergebnisse von Ilgen aber auch mit Lerneffekten des Urteilers bzw. seiner Urteilsvalidierung an der Realität begründet werden. Eine Urteilsvalidierung läßt sich annehmen, weil es durch häufiges Beurteilen oder durch Wahrnehmung neuer Sachverhalte zu einer Vergrößerung der Stichprobe der Beobachtungen und einer damit einhergehenden verbesserten Ursachenschließung sowie ein Zurücktreten von stereotypen Attributionen kommen mag.
Google Scholar
Vorausgesetzt die mit der Beurteilung verbundenen Ziele sind kompatibel (Vgl. Bartölke 1972b, S.664; Zedeck/Cascio 1982; Mc Intyre/Smith/Hassett 1984). Vgl. Kapitel IV.2.1.
Google Scholar
Unabhängig davon, ob die Urteilsqualität in Genauigkeit, Objektivität oder Validität gemessen wird.
Google Scholar
Vgl. IV.3.3.
Google Scholar
Vgl. zur Vorgehensweise ebenso Kapitel I.4 und Teil III.
Google Scholar
Vgl. Kapitel IV. 1.3
Google Scholar
Vgl. Kapitel IV. 1.3.
Google Scholar
Vgl die Ausführungen zu Messen und Bewerten im Rahmen des traditionellen Begriffsverständnis von Mitarbeiterbeurteilung in Kapitel IV. 1.1.
Google Scholar
Wie in Kapitel II. 1.1 und speziell in Fußnote 43 verdeutlicht, ist ein Forscher in der Wahl seiner Definitionen und seines Untersuchungsgegenstandes grundsätzlich frei. Die Auswahl kann deshalb ebensowenig richtig oder falsch, sondern lediglich adäquat oder nicht adäquat sein.
Google Scholar
Zu zielen und Funktionen der Mitarbeiterbeurteilung vgl. Kapitel IV. 1.2.
Google Scholar
Vgl. Kapitel IV. 1.4.
Google Scholar
Im rein mathematisch-statistischen Sinn können die Gütekriterien als eine spezielle Form der Korrelation bezeichnet werden, da sie Zusammenhänge zwischen zwei Größen (zum Beispiel zwischen dem, was ein Kriterium mißt und dem, was es messen soll) abbilden. In der Inferenzstatistik können Korrelationskoeffizienten auf Basis einer bekannten Stichprobe berechnet oder geschätzt werden. Validitäten und ebenso die anderen Gütekriterien werden innerhalb der hier verwendeten Studien aufgrund der fehlenden eindeutig abgrenzbaren und meßbaren Größen in der Regel durch Surrogate geschätzt denn exakt berechnet. Wie bei jeder Schätzung entstehen hierdurch systematische Fehler (vgl. Bol 1995, S.100f.).
Google Scholar
Uneindeutigkeit ist bereits durch die Tatsache der mangelnden Konstanz der Testbedingungen gegeben. Lediglich in Laborexperimenten gelingt es, die Umfeldbedingungen annähernd konstant zu halten. Unter Realbedingungen oder in Feldstudien ist allein diese testtheoretische Grundforderung für die Ermittlung von Gütekennzahlen über Zufallsexperimente nicht gegeben (vgl. Grieger/Bartölke 1992, S.85f).
Google Scholar
Capol (1974) stellt fest, daß Zuverlässigkeit als Ergänzung von nachgewiesener hoher Validität und Objektivität keinerlei zusätzlichen Informationsgewinn liefert, da Validität und Objektivität im Rahmen von Mitarbeiterbeurteilung Zuverlässigkeit voraussetzen. Zuverlässigkeit ist deshalb als ein Surrogat zu betrachten, welches sich als deckungsgleich mit Validität und Objektivität darstellt.
Google Scholar
Das gilt im besonderen Maße für das selbst unter seinen Verwendern nicht unumstrittene Accuracy-Maß (vgl. Kapitel IV. 1.4). Im Vergleich zu den psychometrischen Gütekriterien wie Objektivität wird Accuracy häufig als “aggregierte” Güte verwendet, unter der verschiedenste andere Gütekriterien subsumiert werden. In dieser aggregierten Form liegt allerdings eine deutlich eingeschränkte Möglichkeit zur Differenzierung von gütebezogenen Aussagen: “[...] accuracy is not the ultimate criterion that should be used in evaluating ratings. [...] criteria such as inter-rater agreement [S.H.: Objektivität], validity, ease of use or distributional characteristics of ratings might be more important to differentiate within given performance appraisal systems” (Murphy 1991, S.49). Neben einem möglichen Zusammenhang mit anderen Gütekriterien wird Accuracy vor allem unter univariaten Bedingungen ein gegenteiliger Vorwurf im Hinblick auf den Zusammenhang mit Beurteilungsfehlern gemacht. Offensichtlich ist die Signifikanz bestimmter Beurteilungsfehler (zum Beispiel Halo-Effekte) und Accuracy-Güte unabhängig. Genauigkeit deshalb als Maßstab für die Evidenz von Beurteilungsfehler zu verwenden, scheint ebenso unzulässig, wie umgekehrt anhand von identifizierten Wahrnehmungsverzerrungen auf die Genauigkeit eines Urteils zu schließen (vgl. Murphy/Balzer 1989).
Google Scholar
Auch das gilt besonders für “Accuracy”. In der Regel drückt Genauigkeit den Übereinstimmungsgrad mit sogenannten True-Score- Experten Urteilen (vgl. Kapitel IV. 1.4) aus. Sollen darüber hinaus Aussagen über die Vorhersagbarkeit zukünftigen Verhaltens getroffen werden (prognostische Genauigkeit), werden über die True-Score-Urteile hinaus VES-Skalen hinzugezogen, um Genauigkeit zu operationalisieren (vgl. Wexley/Youtz 1985). Nur unter bestimmten Voraussetzungen wie beispielsweise bei nachgewiesen hoher Konstruktvalidität konnte empirisch eine Korrelation dieser beiden Formen der Accuracy-Messung herausgefunden werden. In der Mehrzahl aller Fälle aber fehlt eine Konsistenz bzw. ein Zusammenhang der Ergebnisse nach den verschiedenen Ermittlungsmethoden. Sie scheinen von einander unabhängig (vgl. Murphy/Garcia/Kerkar/Martin/Balzer 1982; Zalesny/Highhouse 1992). Insofern dient Genauigkeit nur dann als Gütekriterium, wenn gleichzeitig die Art der Erfassungsmethode benannt wird. In den meisten empirischen Studien finden sich derlei Hinweise aber selten. Es liegt deshalb der Verdacht nahe, daß genau solche Form der Ermittlung von Accuracy verwendet wird, welche die Forschungshypothesen stützt. Ein Willkürvorwurf wird deshalb von Sulsky/Balzer (1988) angeführt.
Google Scholar
Diese liegt zum Beispiel zwischen 36 und 51 Prozent bei intraindividueller Urteilskonkordanz (vgl. Fletcher 1995), zwischen 47–79 Prozent bei interindividueller Urteilskonkordanz und zwischen 84–91 Prozent [!] bei der prognostischen Validität (vgl. Dickinson/Hassett/Tannenbaum 1986). Im Umkehrschluß werden mithin im schlechtesten Fall der prognostischen Validität nicht mehr als höchstens 16 Prozent der Varianz aufgeklärt.
Google Scholar
Zum Beispiel Vorgaben eines Mittelwertes an die Beurteiler oder gar Vorgabe mehrerer fixer Prozentpunkte wie Quintile.
Google Scholar
Vgl. Kapitel IV. 1.2 zu Zielen und Funktionen der traditionellen Mitarbeiterbeurteilung.
Google Scholar
Zum Beispiel einer impliziten Eignungstheorie. Vgl. hierzu Kapitel IV.2.3.
Google Scholar
Vgl. zu den Nachteilen der Antworteinschränkung bei Einstufungsverfahren im Vergleich zu freien Beurteilungen Kapitel IV. 1.5.
Google Scholar
In empirischen Studien wurden Skalierungen von bis zu neun Stufen identifiziert (vgl. Lattmann 1975b). In gleichem Maße konnte empirisch das Problem zu vieler Merkmale identifiziert werden. Bei dem Versuch einer möglichst vollständigen Erfassung der Leistung mit einer entsprechend hohen Anzahl von Kriterien, wird die Unabhängigkeitsanforderung an die Kriterien vernachlässigt (vgl. Mungenast 1990, S.52f.). Schuler (1989a) fend heraus, daß sich die Anzahl von durchschnittlich über dreizig verschiedenen Beurteilungskriterien auf rund drei bis fünf reduzierte, wenn die inhaltliche Unabhängigkeit der Kriterien sichergestellt werden sollte (vgl. S.422). Die Vernachlässigung des Unabhängigkeitspostulats führt somit zu einer impliziten, (ungewollten?) Verschiebung der Gewichtung einzelner Kriterien (vgl. Neuberger 1980, S.31). In der Praxis haben diese Überlegungen teilweise zu einer deutlichen Reduktion der Kriterienanzahl geführt (vgl. Zander/Knebel 1980, S.44ff.).
Google Scholar
Mit Notenstufen von eins bis fünf. Vgl. Wagner (1989, S.538).
Google Scholar
mit verbalen Aussagen wie hoch, mittel, tief
Google Scholar
Die Ursache der Invarianz gegenüber monoton steigenden Transformationen und nicht wie bei kardinalem Meßniveau gegenüber allen linearen Transformationen liegt in den Abständen zwischen den Stufen begründet. In einer Ordinalskala besitzen diese keinen Informationswert (vgl. Büning/Trenkler 1978, S.21): Für das Beispiel von Schulnoten kann zwar die Aussage gemacht werden, daß eine “eins” besser ist als eine “zwei”. Um wieviel besser wird aber nicht vermittelt.
Google Scholar
Ein quantitativer Gesamtwert ist das Ergebnis fast jedes Einstufungsverfahrens unabhängig der diesem zugrundeliegenden Skalierungsformen wie VES oder VBS.
Google Scholar
Zum Beispiel Vergleiche und Differenzbildungen von Beurteilungsergebnissen eines Mitarbeiters in der Zeitreihe
Google Scholar
Vgl. zur Unterscheidung übergreifender Ziele der Mitarbeiterbeurteilung Kapitel IV. 1.1.
Google Scholar
Vgl. Kapitel IV.4
Google Scholar
Darüberhinaus werden nicht allein Erkenntnisse der Medizin, sondern ebenso für die Erforschung von Wahrnehmungsverhalten relevante Entdeckungen der Neurobiologie (vgl. Schnabel 1996, S.34) und der Himforschung (vgl. Roth 1996, S.34) nicht berücksichtigt. Forscher wie Roth verstehen “Bewußtsein” als ein Emergenzphänomen verschiedener Gehirnbereiche, betonen allerdings, daß “Bewußtsein” ebenso wie “Gedächtnis” keinen örtlich lokalisierbaren Sitz im Gehirn haben. Bewußtsein und Wahrnehmung ist nicht in irgendeiner Form verdinglicht, kann jedoch als Funktion eines zu rekursiver Interaktion fähigen Nervensystems dargestellt werden. Insofern ist das Nervensystem für seine eigenen Zustände sensibel und kann über seine eigenen Zustände operieren (vgl. Schmidt 1987b, S.20; siehe auch Engel 1994, S.24). Ein Widerspruch zu “filterlosem, objektiven” Wahrnehmen ist identifiziert.
Google Scholar
Vgl. hierzu die Modelle von Borman (1974) und Feldman (1981) in Kapitel IV.2.2.2.
Google Scholar
Als eine solche läßt sich beispielsweise der Urteilertyp “ich bin hart zu mir und hart zu anderen” (Breisig 1989, S.116) bezeichnen. Solche Typologien besitzen in eigenschaftstheoretischer Tradition häufig den Charakter einer Stigmatisierung.
Google Scholar
Luegers Versuch (1993), sich Wahrnehmungsprozessen mit Hilfe der Freud’schen Psychoanalyse bzw. mit Hilfe der Individualpsychologie nach Adler zu nähern, ist im übrigen die seltene Ausnahme für eine theoretische Untermauerung von Analysen zu Wahrnehmungsprozessen (vgl. S.153–172).
Google Scholar
Schuler (1989a) interpretiert die Wahrnehmungsmodelle als anwendungsstrategische Heuristiken. “Von einer integrierenden theoretischen oder gar formal-modellhaften Aufklärung kann nicht die Rede sein” (S.420).
Google Scholar
Wegen der Pseudowissenschaftlichkeit glauben die Urteiler selbst an die ihnen in personifizierter Form entgegenbrachten Kritik. Mängel lasten sie sich selbst und nicht dem System an (vgl. Neuberger 1980, S.42).
Google Scholar
Vgl. Kapitel IV.1.2 und IV.1.3.
Google Scholar
‘‘Subordinates (are) like products on an assembly line, to be accepted or rejected as a result of an inspection process” (Mc Gregor 1957, S.90).
Google Scholar
“Playing God is something dangerously close to a violation of the integrity of the personality” (Mc Gregor 1957, S.90).
Google Scholar
Vgl. Kapitel IV.1.2.
Google Scholar
Lediglich in Fällen, in denen Kritik mit für den Beurteilten frustrierenden Erlebnissen zusammenfiel, wurde das Selbstvertrauen des Beurteilten derart erschüttert, daß seine Leistung in späteren Aufgaben darunter litt.
Google Scholar
Vgl. einen Überblick zu Motivationstheorien und deren Grundlagen bei Holzkamp-Osterkamp (1981a; 1981b). Einen indirekten d. h. über zahlreiche Zwischenschritte wirksamen konzeptionellen Erklärungsversuch für den Zusammenhang von Motivation und Leistung vermittelt Mitchell (1983). Goodman/Fichman (1983) kritisieren an diesem Kettenmodell deren Theorie- und Konzeptionslosigkeit, weil in der Argumentation zahlreiche bestehende Motivationskonzepte vermischt werden und der Vorschlag empirisch nicht überprüfbar sei.
Google Scholar
Die Verhaltensreaktion einer Person auf Feedback ist gewöhnlich mehrfach individuell determiniert. Wichtige Einflußgrößen sind zum Beispiel vorangegangene affektive Gefühle und kognitive Attributionen, Anspruchsniveau oder Erfahrungen (vgl. Farhn 1991, S.68f.).
Google Scholar
vgl. auch einen Überblick der Kenntnis zu Motivations-Leistungszusammenhängen bei Six/Kleinbeck (1989, S.350ff.).
Google Scholar
Auch wenn eine bestimmte “schlechte” Leistung möglicherweise stärker durch ein Team oder eine spezifische organisationale Konstellation zustande kommt.
Google Scholar
Behaviorismus als Forschungsmethode geht zurück auf den amerikanischen Psychologen Watson (1930). Diese Forschungsrichtung bezeichnet ein verhaltenswissenschaftliches Programm, welches in methodischer Rigorosität lediglich beobachtetes Verhalten als Datenbasis zuläßt (vgl. Staehle 1989, S.135).
Google Scholar
Der Behaviorismus ist im übrigen bekannt geworden durch seine Versuche mit Tieren. Da qualitative Unterschiede zwischen den Organismen verschiedener evolutionärer Entwicklungsstufen nicht berücksichtigt werden, gilt der Mensch zwar in quantitativer Hinsicht als komplexester Organismus. Wie alle anderen Organismen auch unterliegt er allerdings übergreifenden, allgemeinen Gesetzmäßigkeiten (vgl. Holzkamp-Osterkamp 1981a, S.229).
Google Scholar
Vgl. zur funktionalen Überfrachtung und zu Zielkonflikten der Mitarbeiterbeurteilung Kapitel IV.2.1.
Google Scholar
Dieser Motivationskonflikt ist abzulesen am sogenannten “Impression-Management”, der Bemühung der Beurteilten, den Eindruck, den sie auf andere machen, zu kontrollieren und zu steuern. Unbewußt wird dieser Steuerungsprozeß dazu benutzt, dem anderen ein bestimmtes Bild von sich zu repräsentieren, um angenehme oder erwünschte Reaktionen zu bewirken. Die These besagt, daß Impression-Management umso häufiger angewendet wird, je größer die wahrgenommene Abhängigkeit ist. Im Falle von Beurteilungen konnte der Einsatz von Impression-Management in zahlreichen Fällen nachgewiesen werden (vgl. Goffman 1985; Mummendey/Bolten 1985; Rosemann/Kerres 1986; Witte 1989; Wayne/Liden 1995).
Google Scholar
Vgl. zu dirser Hypothese ausführlich Kapitel IV.6.
Google Scholar
Vgl. die Diskussion zu Leistung als Konstrukt von Letztkriterien in Kapitel IV.2.2.1.1.
Google Scholar
Vgl. hierzu die Wahrnehmungsmodelle von Borman und Feldman in Kapitel IV.2.2.2.
Google Scholar
Vor allem Wirkungen von “Nicht-Leistungen” auf Beurteilungsergebnisse finden offenbar zu selten Berücksichtigung: “Because the field studies [...] have not examined the effects of nonperformance influences on performance evaluations as their main concern, these studies have not utilized multiple raters of different sex or race to assess each ratee. As a result, definitive statements concerning the effects of rater bias in these studies cannot be made” (Wendelken/Inn 1981, S.152).
Google Scholar
Verstärkt wird Eindruck der Theorielosigkeit durch eine relative Isoliertheit der bisherigen Forschungsansätze, die konzeptionelle Grundlage empirischer Studien wurden (vgl. Solomon/Bishop/Bresser 1986, S.37). Zur Erklärung von Diskriminierungsergebnissen werden stereotypentheoretische und attributionstheoretische Argumente verwendet. Auf gleicher Ebene werden diese selten miteinander in Verbindung gebracht (Ausnahme: Nieva/Gutek 1980). Eine Einordnung dieser Ansätze in übergreifende Taxonomien oder Theorietraditionen zum Beispiel der Frauenforschung fehlt ebenfalls. Das innerhalb der Frauenforschung abgedeckte Untersuchungsgebiet des “Geschlechterverhältnis, Formen der Unterdrückung von Frauen, Möglichkeiten des weiblichen Widerstandes, weibliche Praxisfelder” und ähnliches (Knapp/Wetterer 1992, S.9) wird erkenntnistheoretisch, methodisch und auch im Hinblick auf den letztlich gewählten inhaltlichen Ausschnitt aus ganz verschiedenen Perspektiven bearbeitet. Die Abbildung von Begründungszusammenhängen über Stereotypen- oder Attributionstheorie ist hierbei nur eine von anderen möglichen und diskutierten und muß deshalb im Rahmen seriöser, wissenschaftlicher Ausführungen eine diesbezügliche Eindordnung erfahren. Vgl. hierzu Kapitel IV.5.3.2.
Google Scholar
Die widersprüchlichen Ergebnisse konterkarieren eine Verallgemeinerung ohnehin.
Google Scholar
Vgl. hierzu die bereits in der Zielsetzung der Arbeit formulierte Kritik an der Selektivität der wissenschaftlichen Arbeiten zu Mitarbeiterbeurteilung (Kapitel I.3). Nicht nur für das Beispiel von geschlechtsspezifischen Beurteilungen erstaunt im übrigen das konsequente Festhalten an den beschriebenen Forschungsdesigns ob der widersprüchlichen Ergebnisse.
Google Scholar
Empirische Studien lassen sich vor allem unter Laborbedingungen relativ zügig durchführen und veröffentlichen. In einem Universitätssystem, daß seine Forscher auch nach quantitativen Outputgrößen wie Zahl der Veröffentlichungen beurteilt, mag die Tatsache einer schnellen Verwertung nicht unbedeutend sein.
Google Scholar
Vgl. Kapitel II.3.3.
Google Scholar
Wie zum Beispiel der Frauenforschung. Vgl. Fußnote 286.
Google Scholar
Eine Nähe zu eigenschaftstheoretischen Argumenten ist aufgrund des Stabilitätskriteriums zu vermuten (vgl. Abele/Schaper 1995, S. 250).
Google Scholar
Die Maximierung der genetischen Weitergabe aller Individuen ist die Grundannahme der Behavioral-Ecology-Theorie (vgl. Miersch 1996, S.35).
Google Scholar
Vgl. zum Beispiel das Konzept der Erfolgsvermeidung von Homer (1972).
Google Scholar
Neuere Ansätze der vorberuflichen “weiblichen Sozialisation” machen vor allem Diskontinuitäts- und Konflikterfahningen als Sanktionsmechanismus, d. h. für eine dem Stereotypen entsprechende Verhaltensweise (zum Beispiel bei der Berufswahl) verantwortlich (vgl. Krüger 1993). Darüber hinaus wird nicht nur vorberufliche Sozialisation als Träger von Lernprozessen proklamiert. Vor allem das als doppelte Vergesellschaftung (Integration von Frauen sowohl in die Erwerbs- als auch in die Familienarbeit) und die daraus resultierenden Integrations-, (Dis)Kontinuitäts- und Erfahningsfelder dienten als Bezugspunkt der beruflichen, geschlechtstypischen Sozialisation (vgl. Schiersmann 1993; Hoff/Theobald/Hörrmann-Lecher 1993).
Google Scholar
Und beruht insofern auf einer halbierten Vermarktung der menschlichen Arbeitskraft (vgl. Beck-Gernsheim 1980).
Google Scholar
Daß der Frau im Rahmen der Trennung von Berufs- und Privatwelt die häuslichen, abgewerteten Aufgaben zugefallen sind, wird neben dieser ökonomischen Argumentation auch anders begründet. Capra (1991) zum Beispiel interpretiert in der Zuteilung der häuslichen Tätigkeiten an Frauen ein weiteres Indiz der Unterwerfung der Natur unter die Technik (vgl. S.60). Indem Frau mit Natur auf eine Ebene gestellt wird (vgl. auch Zöhrer-Ernst 1994, S.208), dienen wiederum sehr stark stereotype Zuschreibungen an das Verhalten von Frauen als Argumente der Diskussion. Die Frau mit ihren weiblichen Eigenschaften wird als ein verlorengegangenes Paradies mystifiziert. Solche Ausführungen basieren nach wie vor auf der Verschiedenartigkeit der Geschlechter und erwecken den Eindruck, die Fremdheit des anderen Geschlechts durch Spiritualität beherrschbar zu machen (vgl. Pinl 1995, S.77). Navarra (1982) begründet die häusliche Betätigung der Frau mit der Etablierung des Bürgertums. Frauen oblag die Zurschaustellung eines erfolgreichen Geschäftsgebahrens von Ehemann und Söhnen. Daß sie zu Hause bleiben konnte und sich lediglich moralisch einwandfreien Beschäftigungen wie Kindererziehung und Organisation des Haushalts zuwenden durfte, unterschied sie von der Adels- wie auch von der Arbeiterfrau (vgl. S.37). Insofern liegt in dieser Argumentation ein standesspezifisches “bürgerliches” Interesse in der geschlechtstypischen Arbeitsteilung. Sozialistische Argumentation begründet die Zuweisung der häuslichen Tätigkeiten an die Frau mit der kapitalistischen Eigentums- und Erwerbsordnung. Sie gilt als ein Unterwerfungsmechanismus; eine vermeintliche -auch durch Arbeitgeberprogramme (wie beispielsweise Kochkurse für Arbeiterfrauen)- unterstützte Lösungsmöglichkeit der “sozialen Frage” (vgl. Bebel 1919, S.104).
Google Scholar
Vgl. Kapitel IV.3.3.
Google Scholar
Das entspricht einer Größenordnung von Zwillingsgeburten.
Google Scholar
Die zitierte Studie bezieht sich auf Messungen des männlichen Geschlechtshormons Testosteron.
Google Scholar
Vgl. zur Unterscheidung von Selbstbildern bei verheirateten und unverheirateten Frauen die Studie von Hall/Gordon (1973).
Google Scholar
Abele/Klinke (1993) konnten weder mit der Bern’sehen Skala, noch mit Hilfe eines Männlichkeits- und Weiblichkeitsfragenbogens von Wollschläger (1981) Unterschiede in der Selbsteinschätzung männlicher und weiblicher Versuchspersonen ermitteln. Vgl. im Gegensatz dazu die ältere Untersuchung von Mc Kee/Sheriffs (1957).
Google Scholar
Zu einem umgekehrten Schluß kommt Stäudel (1993) in ihrer empirischen Studie zu Entscheidungs- und Problemlösungsverhalten von Männern und Frauen. Zwar erzielten beide Geschlechter nahezu identische Ergebnisse bzw. zeigten ein vergleichbares Verhalten. Die erhobenen Selbstbilder und Selbsteinschätzungen unterschieden sich aber geschlechtstypisch und spiegelten vor allem bei den Frauen stereotype Vorstellungen über “weibliches Verhalten” wider.
Google Scholar
Im einem anderen Land sind dagegen Alter oder Fähigkeiten von Bedeutung.
Google Scholar
Bei Erfolg von Frauen: Glück oder Anstrengung; bei Erfolg von Männern: Fähigkeiten und Können
Google Scholar
Bei dieser Studie handelt es sich um einer Felduntersuchung innerhalb der amerikanischen Militärakademie Westpoint. Während eines Kadettentrainings wurde eine vorgegebene, simulierte Leistung von Kadetten und Kadettinnen durch andere Kadetten (Probanden) beurteilt. Bei den zu Beurteilenden wurde durch Vignetten und sonstige Vorabinformationen versucht, geschlechtsneutral einen identischen Status zu fixieren.
Google Scholar
Vgl. Kapitel IV.3.
Google Scholar
Im übrigen sind durch die Berücksichtigung der motivationalen Funktion von Stereotypen, über methodische Unzulänglichkeiten hinaus, der eine oder andere Widerspruch in den empirischen Studien zu interpretieren.
Google Scholar
Vgl. Kapitel IV.5.2.1.
Google Scholar
Vgl. die Kapitel IV.5.1.2 bis IV.5.1.4.
Google Scholar
Wenn zum Beispiel bei einem Urteiler ein starker Halo-Effekt auftritt, führt dieses zu einem verzerrten Urteil, mangelnder Objektivität, minderer Beurteilungsgüte und falscher Beförderungsentscheidung.
Google Scholar
Innerhalb der wissenschaftlichen Auseinandersetzung
Google Scholar
In der praktischen Umsetzung
Google Scholar
Vgl. Kapitel III.2.1.1.
Google Scholar
Der interessierte Leser greife zu gängigen Lehrbüchern der Organisationstheorie zum Beispiel Rogers (1975); Neuberger (1989b); Kieser (1992); Kieser (1995a).
Google Scholar
Erhöhung der Tagesleistung der Roheisenverlader von 12,5t auf 47t und Senkung der Transport- und Verladekosten pro Tonne von $ 0,072 auf $ 0,033.
Google Scholar
Vgl. Kapitel IV.5.2.
Google Scholar
Eine Reaktion von Schmid (1983) auf diese Aussage von Goldman betont zum Beispiel die Ansicht, daß zwischen Mitarbeiter und Management deutliche Interessenunterschiede bestehen (vgl. S.353).
Google Scholar
Vgl. Kapitel IV.5.1.2 und IV.5.3.1.
Google Scholar
Es könnten gar zusätzliche Kosten entstehen, wenn durch Mitarbeiterbeurteilung verursachte Enttäuschungen und Unzufriedenheiten der beteiligten Individuen erfaßt werden könnten (vgl. Murphy/Cleveland 1995, S.348).
Google Scholar
Vgl. auch Teil VII.
Google Scholar
Die Identifikation eines Mythos und der damit einhergehende Schluß von existierenden Handlungsalternativen, die in ihren Konsequenzenund Beziehungen nicht vollständig bekannt sind, erweist die Annahme der vollständigen Rationalität des geschlossen-rationalen Modells als realitätsfremd.
Google Scholar
Vgl. Kapitel IV.5.2.2 und hierin besonders die Ausführungen über motivatorische Wirkungszusammenhänge.
Google Scholar
An dieser Stelle findet sich wiederum eine Analogie zum Taylorismus. Die tayloristischen, ideologischen Komponenten und sozialen Befriedungsstrategien auf gesamtgesellschaftlicher Ebene finden ihr Abbild auf betrieblicher Ebene durch traditionelle Mitarbeiterbeurteilung.
Google Scholar
Grieger/Bartölke (1992) sehen darin weiterhin eine Zementierung und Sicherstellung der Management-Perspektive in der Forschung (S.91).
Google Scholar
Die Festlegung von Beurteilern unter unreflektierter, hierarchiebedingter Rollenkonstellation kritisieren auch Domsch/Gerpott (1992, Sp.1634).
Google Scholar
Es ist bezeichnend, daß nicht das aus Betroffenensicht “Unangenehme” der Mitarbeiterbeurteilung thematisiert wird, sondern die Verfahren als imgrunde den Interessen der Mitarbeiter dienend “verkauft” wird (Breisig 1990, S.348).
Google Scholar
Unter einer Sozialtechnik wird verstanden: Ziel des Managements, das Bewußtsein der Beschäftigten zu beeinflussen. Sozialtechniken haben insofern einen Doppelcharakter, als daß sie trotz des Beeinflussungsziels scheinbar auf die Interessen der Mitarbeiter Rücksicht nehmen (vgl. Breisig 1989, S.12ff.). Im Vergleich zu anderen Sozialtechniken wie dem Konzept der teilautonomen Arbeitsgruppen, die in ähnliche Richtung wirken, ist die Mitarbeiterbeurteilung durch ihren hohen Formalisierungsgrad eine relativ bürokratische Sozialtechnik. Insofern wäre hier eine Analogie zum Bürokratiemodell von Weber (vgl. 1972) zu sehen.
Google Scholar
Vgl. Kapitel IV.5.3.2.
Google Scholar
Vgl. auch die Frau in den Medien in Kapitel I.1.
Google Scholar
Und zur Entlastung des Mannes beiträgt
Google Scholar
Vgl. die in Kapitel IV.5.3.2 dargelegten Ansätze zur Herleitung von Geschlechtsrollen.
Google Scholar
Vgl. Kapitel IV.5.3.2.
Google Scholar
Vgl zusammenfassend Elemente der Modernisierung bei Beck-Gernsheim (1983).
Google Scholar
Die Biographie Taylors selbst ist ein dokumentiertes Beispiel für den Zusammenhang von Herrschaft, Selbstbeherrschung, Sublimierung und Selbstzerstörung (vgl. Krell 1984, S.188ff.).
Google Scholar
Es ist anzumerken, daß der Stereotyp des “harten Mannes” nicht mehr überall unkritisch als existent betrachtet wird. So deuten Metz-Göckel/Müller (1985) mit Hilfe einer Befragung den Stereotyp des “harten Mannes” als Klischee, welches nicht mehr anzutreffen ist. Auch Männer wollen mehrheitlich Gefühle zeigen und finden es nicht mehr peinlich, wenn ein Mann weint (vgl. S. 139). Auf der anderen Seite bezieht sich dieser Punkt der Befragung allein auf den privaten Bereich. Es ist anzunehmen, daß für den beruflichen, stärker vergesellschafteten und damit als weniger subjektiv empfundenen Bereich der Stereotyp des “harten Mannes” noch verbreitet ist.
Google Scholar
Scheub (1993) konnte darüberhinaus ermitteln, daß dann, wenn sich Männer zu ihren “weiblichen” und subjektiven Anteilen bekannten, dieser Prozeß nicht unter dem Gesichtspunkt einer Veränderung ihrer Beziehung zu Frauen stattfindet. Die Betrachtung von subjektiven Anteilen bei Frauen unter Defizitgesichtspunkten bleibt bestehen.
Google Scholar

Download references

Authors

Susan Hennersdorf
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Hennersdorf, S. (1998). Mitarbeiterbeurteilung in traditioneller Perspektive. In: Aufstiegsdiskriminierung von Frauen durch Mitarbeiterbeurteilungen. Betriebliche Personalpolitik. Deutscher Universitätsverlag, Wiesbaden. https://doi.org/10.1007/978-3-663-08124-1_4

Download citation

DOI: https://doi.org/10.1007/978-3-663-08124-1_4
Publisher Name: Deutscher Universitätsverlag, Wiesbaden
Print ISBN: 978-3-8244-6683-2
Online ISBN: 978-3-663-08124-1
eBook Packages: Springer Book Archive

Publish with us

Policies and ethics

Zusammenfassung

Buying options