Schlüsselwörter

1 Einleitung: Neue Kooperationen

Der vorliegende Beitrag möchte zeigen, wie in einer Kooperation von interpretativer Sozialforschung und medienwissenschaftlicher Textanalyse neue Wege der Auswertung audiovisueller Daten gegangen werden können. Den Überlegungen liegen konkrete Erfahrungen aus zwei mittlerweile abgeschlossenen, durch die Deutsche Forschungsgemeinschaft geförderten Projekten zugrunde, die an den Universitäten Wuppertal und Marburg durch die AutorInnen geleitet wurden. Der Beitrag fragt zunächst mit Blick auf die disziplinären Gegebenheiten nach spezifischen Schnittstellen und Anknüpfungsmöglichkeiten zwischen Sozial- und Medienwissenschaft, die sich ganz anders darbieten, als es auf den ersten Blick scheinen will. Auf der Seite der Soziologie wird dabei vor allem die Tradition und die aktuelle Forschungslandschaft der interpretativen Sozialforschung und hier wiederum der Ansatz der hermeneutischen Wissenssoziologie fokussiert. Auf der Seite der Medienwissenschaft ist zu beachten, dass es zwischen den Fächern Medien- und Kommunikationswissenschaft in Deutschland schon seit längerer Zeit ein spannungsvolles Nebeneinander gibt, das sich nicht zuletzt der Tatsache verdankt, dass man um teilweise eng beieinander liegende Drittmitteltöpfe, Studiengangseinrichtungen und Lehrstuhletats konkurriert. Diese Konstellation ist als zusätzliche interdisziplinäre Komplikation zu beachten, wenn Missverständnisse vermieden werden sollen. Im zweiten Teil des Beitrags soll dann der Weg einer sozialwissenschaftlich-medienwissenschaftlichen Kooperation anhand der zwei konkreten empirischen Forschungsprojekte beleuchtet werden. Dabei wird zunächst das spezifische Forschungsdesign dargestellt, um dann anhand von Ergebnissen aufzuzeigen, worin der besondere Erkenntnisgewinn einer solchen interdisziplinären Zusammenarbeit bestehen kann.

2 Interpretative Sozialforschung und medienwissenschaftliche Anknüpfungspunkte

2.1 Zur Konstellation von Medien- und Kommunikationswissenschaft

Bei allen Fragen der gegenwärtigen Unterschiede und Konkurrenzen ist es zunächst einmal interessant, sich die fachgeschichtlichen Herkünfte von Medien- und Kommunikationswissenschaft anzuschauen. Bei der geistes- beziehungsweise kulturwissenschaftlich orientierten Medienwissenschaft lässt sich der Entstehungsprozess grob gesehen als Ausdifferenzierung und spätere Autonomisierung aus dem Kontext der philologischen beziehungsweise literaturwissenschaftlichen Disziplinen heraus beschreiben (siehe den Überblick zur Fachgeschichte bei Leschke 2014, S. 21–30). Der literarische Textbegriff wurde hier zunächst weitgehend auf audiovisuelle Bewegtbildtexte erweitert, und man griff auf philologische Methoden zurück.

Ein großer Vorteil lag darin, dass ausgefeilte literaturwissenschaftliche Interpretationsmethoden und ein besonderes Gespür für die Komplexität textueller Realitäten fruchtbar gemacht werden konnten. Gleichzeitig entwickelte sich jedoch bei vielen Forschern ein Verständnis für die spezifische Medialität der audiovisuellen Medien und für die Andersartigkeit der methodischen und methodologischen Herausforderungen gegenüber der literaturwissenschaftlichen Tradition. Es kam zur Ausdifferenzierung einer Medienwissenschaft mit eigenen Lehrstühlen, Instituten und Studiengängen seit den 1990er Jahren, verstärkt seit der Jahrtausendwende. Heute stellt diese kulturwissenschaftlich orientierte Disziplin, teilweise auch explizit als Medienkulturwissenschaft firmierend (Liebrand et al. 2005, S. 36), eine beachtliche Größe im akademischen Fächerkanon Deutschlands dar.

Demgegenüber ist die Entwicklung der Kommunikationswissenschaft hierzulande ganz anders verlaufen. Das heutige Selbstverständnis der Kommunikationswissenschaft in Deutschland ist das einer empirisch ausgerichteten Sozialwissenschaft (siehe Peiser et al. 2003, S. 310–339), in der zweiten Hälfte des 20. Jahrhunderts zudem mit einem klaren Schwerpunkt auf der quantitativen Methodik. Dieses sehr szientistische, auf Messbarkeit ausgerichtete Selbstverständnis prägt die Disziplin jedoch keineswegs seit ihren Anfängen. Im Gegenteil, die frühere Zeitungs- und Publizistikwissenschaft in der ersten Hälfte des 20. Jahrhunderts verstand sich durchaus als geisteswissenschaftliches Fach mit philologisch geprägten Methoden und einer normativen Ausrichtung (Averbeck 1999, S. 99–101). Erst in der zweiten Hälfte des Jahrhunderts vollzog sich eine weitgehende „Versozialwissenschaftlichung“, die sich bis zum heutigen Tage gehalten hat (siehe dazu ausführlich die Analyse von Löblich 2010, S. 306–309).

Hinzu kommt, dass die einstmalige Vormacht-, fast Monopolstellung, der quantitativen Methodologie in der deutschen Kommunikationswissenschaft in dieser Weise nicht mehr beobachtbar ist. Stattdessen haben interpretative, qualitative Forschungsdesigns deutlich an Einfluss gewonnen. Ein sichtbares Symptom dafür sind nicht nur die mittlerweile erschienenen Einführungs- und Handbücher, die versuchen, qualitative Kommunikationsforschung zu systematisieren und für einen gesteigerten Bedarf in der akademischen Lehre aufzuarbeiten (siehe exemplarisch Mikos und Wegener 2005). Auch die (drittmittelgeförderte) Forschungspraxis dokumentiert einen deutlichen Aufwind der interpretativen Ansätze, wie etwa das in der dritten Förderphase befindliche DFG-Schwerpunktprogramm 1505 „Mediatisierte Welten“ unter der Leitung von Friedrich Krotz und Andreas Hepp belegt.

2.2 Die Tradition der interpretativen Sozialforschung

Dieser Trend zu den interpretativen Methoden kommt jedoch nicht von ungefähr, sondern verdankt sich im Wesentlichen Entwicklungen, die seit den 1980er Jahren in der Soziologie und der dort beheimateten Methodenlehre der empirischen Sozialforschung stattgefunden haben. Ein Blick in die Geschichte macht sichtbar: Die langjährige Vorherrschaft der quantitativ ausgerichteten Methodik und Methodologie in der (deutschen) Soziologie wie in der (deutschen) Kommunikationswissenschaft stellt ein Phänomen der zweiten Hälfte des 20. Jahrhunderts dar. Fachgeschichtlich zeigen sich Traditionsstränge, die später bei der Ausarbeitung interpretativer Paradigmen der Sozialforschung wieder aufgegriffen wurden: die Webersche Soziologie, die als handlungstheoretisch fundierte Disziplin auf die Rekonstruktion des subjektiven Sinnes der Akteure und damit auf die Methodik des Interpretierens einen besonderen Schwerpunkt legen muss; die Sozialphänomenologie in der Tradition von Alfred Schütz, die den „sinnhaften Aufbau der sozialen Welt“ (Schütz 1932/2004) rekonstruieren und die sozialen Akteure dabei beobachten will, wie sie in Handlungs- und Interaktionszusammenhängen „die gesellschaftliche Konstruktion der Wirklichkeit“ bewerkstelligen – so der bekannte Buchtitel von Peter Berger und Thomas Luckmann (1969); und die frühe amerikanische Soziologie, insbesondere die sogenannte „Chicago School“ mit ihren ethnografischen Methoden, deren Arbeiten im ersten Drittel des 20. Jahrhunderts an der Universität Chicago entstanden (Bulmer 1984, S. 1–12).

2.3 Die hermeneutische Wissenssoziologie

Die hermeneutische Wissenssoziologie hat aus diesen Traditionen die methodologischen und methodischen Konsequenzen gezogen. Wenn Weber, Schütz und ihre Nachfolger die Sinnhaftigkeit des Sozialen so stark betonen, bedarf es demnach in der soziologischen Methodologie der Ausarbeitung einer spezifischen sozialwissenschaftlichen Hermeneutik, die Kriterien und Verfahrensweisen für eine methodisch kontrollierte Interpretation empirischer Daten entwickelt. Die sozialwissenschaftliche Hermeneutik interpretiert die immer schon vorinterpretierten, das heißt sinnhaften Daten aus der sozialen Welt in Form von methodisch überprüften und überprüfbaren, verstehenden Rekonstruktionen (Soeffner und Hitzler 1994, S. 33). Die hermeneutische Wissenssoziologie versteht sich vor diesem Hintergrund als ein Ansatz, der „zum Ziel hat, die gesellschaftliche Bedeutung jeder Form von Interaktion (sprachlicher wie nichtsprachlicher) und aller Arten von Interaktionsprodukten (Kunst, Religion, Unterhaltung etc.) zu (re)konstruieren“ (Reichertz 2007, S. 113). Der Kernbegriff der Hermeneutik zeigt deutlich die Schnittstelle zur philologisch fundierten Medienwissenschaft an, denn auf bestimmte Kunstregeln der Auslegung kann eine textorientierte, interpretierende Wissenschaft auch heute nicht verzichten, allen prä-, post- und neostrukturalistischen Herausforderungen des hermeneutischen Denkens zum Trotz.

2.4 Das neuere Interesse an der Bewegtbildanalyse

Vor diesem Hintergrund ist nun zu beobachten, dass aus dem Ansatz der hermeneutischen Wissenssoziologie heraus seit einigen Jahren besonderes Augenmerk auf die Analyse einer Datensorte gelegt wird, die früher kaum eine Rolle in der soziologischen Arbeit gespielt hat. Gemeint sind Bewegtbilddaten, die zwar auch schon seit längerem in der klassischen ethnografischen Forschung Verwendung fanden, aber dort nicht mit einer eigens ausgefeilten Methodik erhoben und ausgewertet wurden (Tuma et al. 2013; S. 36; siehe auch Knoblauch et al. 2006; S. 69–85 sowie Raab 2008; S. 134–163).

Für unseren Zusammenhang ist besonders die hermeneutische Videoanalyse einschlägig, wie sie von Jo Reichertz entwickelt und angewendet wurde. Dabei liegt der Gegenstandsbezug auf Medienprodukten, die nicht komplett durch ein Drehbuch vorstrukturiert, aber dennoch durch professionelle Akteure erstellt wurden. Grundlegend wird bei der Analyse im Sinne des oben dargestellten handlungstheoretischen Ansatzes unterschieden zwischen „Handlung vor der Kamera“ und „Kamerahandlung“ beziehungsweise zwischen der „gezeigten Handlung“ und der „Handlung des Zeigens“ (Reichertz und Englert 2011, S. 28). Betont werden soll durch diese Terminologie der Handlungscharakter, die Gemachtheit der audiovisuellen Texte, die jeweils die Spuren der Handlungslogik aller beteiligten Akteure in sich tragen. Mit Kamerahandlung und Handlung des Zeigens sind dabei vor allem die Anwendung von Gestaltungsmitteln wie Kameraarbeit, Schnitt und Montage, Sounddesign, Kommentierung und Insertierung gemeint. Hinzu kommt die Dramaturgie, die den Aufbau und die Abfolge von Sequenzen bestimmt (Reichertz und Englert 2011, S. 81). Ergänzt werden muss bei Medientexten wie Talkshows, Nachrichten und Berichten sowie natürlich für alle fiktional angelegten Medienformate die Erstellung von mehr oder weniger genau ausformulierten Drehbüchern, die sich vor allem bei neueren TV-Serienproduktionen durch kollektive Autorschaft auszeichnen („Writers‘ Room“ mit jeweiligen „Showrunners“), ein komplexer redaktioneller Prozess, der je nach Format und Genre eine kleinere oder größere Rolle im Gesamtgeschehen spielt. Außerdem sind Aspekte wie Bühnenbild und Beleuchtung zu beachten.

Zu überdenken wäre aus unserer Sicht aber die bei Reichertz und Englert vorgeschlagene Unterscheidung zwischen „Film“ und „Video“: „Filme folgen einem Drehbuch, Videos in der Regel nicht“ (Reichertz und Englert 2011, S. 17). Mit der Videoanalyse werden durchaus auch Medienprodukte wie Reportagen, Shows oder Formate aus dem Bereich des Reality TV untersucht, und dort sind sehr wohl Prozesse des „Scriptens“ vorhanden. Selbst Formaten wie dem ZDF-Fernsehgarten (seit 1986) oder der ProSieben-Show Absolute Mehrheit (2012–2013) liegen ausformulierte Moderationsbücher zugrunde. Reportagen haben häufig detaillierte Drehbücher, viele Doku-Soaps sind weiter oder enger „gescripted“, und auch Talkshows folgen oft redaktionell vorbereiteten dramaturgischen Vorgaben.

Ungeachtet solcher Detailfragen bieten diese neuen soziologisch-kommunikationswissenschaftlichen Ansätze spannende Anknüpfungspunkte für die interdisziplinäre Analyse – insbesondere da, wo sie über die reine Videohermeneutik hinausgehen und mit klassischen Methoden der qualitativen empirischen Sozialforschung zu ethnografisch eingebetteten Studien erweitert werden. Hier wird gleichsam an die ethnografische Tradition der „Chicago School“ angeknüpft. Dabei werden beispielsweise teilstandardisierte Interviews, teilnehmende Beobachtungsverfahren und die Auswertung von Felddokumenten aller Art hinzugezogen (etwa Bidlo et al. 2012, S. 73–97). Auf diesem Weg kann es tatsächlich gelingen, die Medienprodukte als Interaktionsprodukte von AkteurInnen mit unterschiedlichen Handlungslogiken und Wissensbeständen zu rekonstruieren. Im Folgenden soll gezeigt werden, wie das konkret funktioniert und welchen Erkenntnisgewinn es bringen kann.

3 Die ethnografisch eingebettete Medienanalyse in der Praxis

3.1 Das Projektdesign

Die beiden Forschungsprojekte, in denen das Design einer ethnografisch eingebetteten Medienanalyse in einer interdisziplinären Kooperation von medienwissenschaftlichen und soziologischen ForscherInnen an den Universitäten Marburg und Wuppertal angewendet wurde, hatten beziehungsweise haben Politikerauftritte in Talkformaten des deutschen Fernsehens zum Gegenstand.Footnote 1 Dabei wurden Talkformate untersucht, zu denen in Deutschland noch sehr wenige Forschungsergebnisse vorliegen, obwohl es sich hierbei um relevante Teile der politischen Medienöffentlichkeit handelt. Analysiert wurden zum einen Personality-Talkshows, in denen Prominenz aus unterschiedlichen Feldern der Gesellschaft auftritt, um sich dort als öffentliche Persönlichkeiten zu präsentieren und dabei häufig auch PR für eigene Projekte zu machen. Gemeint sind Formate wie Johannes B. Kerner (ZDF, 1998–2009), Markus Lanz (ZDF, seit 2008), Beckmann (ARD Das Erste, 1999–2014), die NDR Talkshow (NDR, seit 1979), 3 nach 9 (Radio Bremen, seit 1974) oder der Kölner Treff (WDR, seit 1976–1983, fortgesetzt seit 2006). Im zweiten Projekt werden satirisch beziehungsweise komisch gerahmte, hybrid angelegte Talkformate fokussiert, die sich seit einigen Jahren zunehmender Popularität erfreuen. Es handelt sich hierbei um Produktionen wie Pelzig hält sich (zunächst mit dem Titel Aufgemerkt! Pelzig unterhält sich beim BR von 1998 bis 2010, dann mit dem aktuellen Titel seit 2011 im ZDF), TV total (Pro 7, 1999–2015), Absolute Mehrheit (Pro 7, 2012–2013), Stuckrad-Barre (2010–2012 bei ZDF neo, 2012–2013 bei Tele 5) und die überaus erfolgreiche heute-show (ZDF, seit 2009), die nicht regelmäßig, aber doch immer wieder politische Akteure als Studiogäste zum Interview einlädt. Beide Formatgruppen sind Bestandteile der politischen Unterhaltungsöffentlichkeit einer modernen Mediendemokratie und bieten Raum für Politainment (Dörner 2001, S. 97–111). Die zentrale Fragestellung in beiden Projekten bezog und bezieht sich auf die jeweiligen Konstellationen von Inszenierung und Kontingenz in den Auftritten; das heißt darauf, wie die teils gleichsinnigen, teils aber doch sehr unterschiedlichen Inszenierungsziele und Strategien der politischen AkteurInnen, der MedienakteurInnen und des Publikums jeweils in kooperativen oder konfrontativen Interaktionen zusammenlaufen. Gerade konfligierende Inszenierungsstrategien, so die Annahme, produzieren immer wieder Kontingenz und damit Raum für Unerwartetes, Neues wie Interessantes im öffentlichen Bild politischer AkteurInnen. Die Bühnen der Talkshows erweisen sich dabei auch als riskante Bühnen für die AkteurInnen, weil die Möglichkeit besteht, sich hier durchaus auch zu blamieren oder als kommunikativ untalentiert zu präsentieren.

Im Folgenden konzentriert sich die Darstellung auf das bereits komplett abgeschlossene Projekt, wobei das noch laufende der gleichen Architektur folgt. Konkret sieht das Projektdesign so aus: Am medienwissenschaftlichen Standort Marburg wurden die einschlägigen Sendungen durch Mitschnitte erhoben, archiviert und dann mithilfe medienwissenschaftlich-soziologischer Analyseverfahren ausgewertet. Bei der Auswertung der audiovisuellen Daten wurde das wissenssoziologische Verfahren sequenzanalytischer Videoanalyse (Reichertz und Englert 2011, S. 62–107) angewendet und um die medienwissenschaftliche Interpretation medialer Gestaltungsmittel (vom Bühnenbild und der Ablaufdramaturgie der Sendungen bis zu Bildregie, Schnitt und Montage sowie der spezifischen Ästhetik der Einspielfilme; Hickethier 2012, S. 39–104) ergänzt. Nach mehrfacher Lektüre wurden die einzelnen Sendungen mit Politikerauftritten in „Suprasegmente“ gegliedert, die das Material anhand inhärenter Faktoren in (thematische oder formale) Sinnabschnitte einteilen. Darauf folgte eine dichte Beschreibung der zentralen Sequenzen. Für die Interpretation wurden nicht nur die Interaktionen vor der Kamera, sondern alle Gestaltungshandlungen der beteiligten Akteure von der Redaktion bis zum Kameramann und Bildmischer berücksichtigt. Die gewonnenen Einzelbefunde wurden anschließend mithilfe von Verfahren der minimalen und maximalen Kontrastierung systematisiert und in eine Typologie von Rahmen, Rahmungen und Rollen überführt. Erhebungszeitraum des ersten Projekts war die Zeit von April bis Dezember des „Superwahljahrs“ 2009, in dem außer der Bundestagswahl auch Wahlen zum europäischen Parlament, die Wahl des Bundespräsidenten, sechs Landtagswahlen sowie diverse Kommunalwahlen stattfanden und daher mit einer vergleichsweise großen Menge an Auftritten von PolitikerInnen zu rechnen war. Insgesamt wurden 81 Auftritte in 58 Sendungen untersucht. Die Homepages der Formate dienten ergänzend als Felddokumente, die zur Erstellung von Sendungsprofilen ausgewertet werden konnten. Die audiovisuellen Texte wurden zunächst gesichtet und segmentiert, um in der Folge zu den zentralen Passagen Sequenzprotokolle und Feinanalysen anzufertigen. Zudem wurden bestimmte Strukturelemente der Sendungen – wie die Intros, Einspielfilme und das Bühnenbild – sendungsübergreifend systematisch analysiert.

Gerade die Einspielfilme erwiesen sich mitunter als kleine Filmkunstwerke, die mit erheblichem Gestaltungsaufwand produziert worden waren. Beispielhaft kann hier deutlich gemacht werden, worin der Mehrwert einer medienwissenschaftlichen Textanalyse besteht. Gegenstand ist der Einspielfilm, mit dem die Redaktion von Johannes B. Kerner in der Sendung vom 3. Juni 2009 den Tagesablauf des Politikers Frank Walter Steinmeier inszeniert, der in der Sendung zu Gast ist. Der Clip weist eine Ästhetik auf, welche der US-amerikanischen Action-Thriller-Serie 24 nachempfunden ist.Footnote 2 Dazu gehören die Einblendung von Zeit- und Ortsangaben, der Multisplitscreen, eine drängende, spannungsgeladene Musik und eine kaum still stehende Kamera (vgl. Abb. 1). Diese Stilmittel korrespondieren mit dem narrativen Ablauf des Clips, der das vielfältige Aufgabenspektrum des Außenministers abdecken will. Diese Ästhetik erzeugt ein fast atemloses Tempo: Während die Dynamik der Kameraarbeit auf den Akteur Steinmeier abstrahlt, suggeriert der ständige Zeit- und Ortswechsel die Vielseitigkeit des Aufgabengebietes. Durch die vielen Screens (welche das jeweilige Geschehen einer Sequenz aus unterschiedlichen Perspektiven einfangen) entsteht außerdem der Eindruck, der Außenminister sei an mehreren Orten gleichzeitig präsent. Dies scheint seine übermenschlichen Fähigkeiten und Anstrengungen symbolisieren zu wollen.

Abb. 1
figure 1

Screenshot Johannes B. Kerner (03.06.2009). Ein Einspieler präsentiert den Tagesablauf des Außenministers und Kanzlerkandidaten. Er wird als ein vielbeschäftigter, omnipräsenter Politiker inszeniert. Verdeutlicht wird seine Arbeitsbelastung durch den Einsatz von split screens und Uhrzeitangaben (TC: 0:08:45)

Der politische Akteur wird im Einspielfilm auf vielen Stationen seiner Tätigkeit gezeigt, in Telefonaten mit US-Außenministerin Clinton ebenso wie in Verhandlungen zur Opel-Rettung im Kanzleramt. Betrachtet man den Clip als eine zusammenhängende Narration, so zielt dessen Dramaturgie auf verschiedene Bedeutungspotenziale ab: Erstens wird Steinmeier inszeniert als politisches Multitalent, als politischer Allrounder. Er ist in verschiedenen Kontexten zu sehen und weiß sich dort jeweils situationsadäquat zu bewegen. Der Clip zeigt, dass Steinmeier viele politische Rollen beherrscht, womit er sich für das Amt des Bundeskanzlers qualifiziert, da er es als solcher mit einem ähnlich umfangreichen Aufgabenspektrum zu tun hätte. Dennoch bleibt diese positive Darstellung Steinmeiers nicht ungebrochen. Hat man auf den ersten Blick den Eindruck, hier habe die Kerner-Redaktion geradezu einen Wahlwerbespot für den Kanzlerkandidaten produziert, werden beim zweiten Blick Brüche und Kontingenzen sichtbar. Der Clip arbeitet mit stark (über-)stilisierten Bildern und sehr gestellt wirkenden Situationen (etwa das Telefonat mit Hilary Clinton), die sich hart an der Grenze zur Karikatur bewegen. Hyperbolische, übertreibende Darstellungen bergen immer die Möglichkeit, eine ironisierende Ebene der Deutung zu eröffnen und letztlich ins Gegenteil umzuschlagen. Wenn die Zuschauer die übertrieben positive Darstellung des Kandidaten wahrnehmen, also der Clip seinen Charakter als Werbespot gleichsam reflexiv offenlegt, dann entfaltet er zugleich subversive Bedeutungen. Reflexive Theatralität unterläuft auf diese Weise simple, lineare Wirkungszusammenhänge.

Am interessantesten wird dieser Zusammenhang durch die von der Redaktion gewählte ästhetische Rahmung der Action-Thriller-Serie 24 gestaltet. Niemand käme ernsthaft auf die Idee, einen nüchternen, diplomatisch geschulten und vorsichtig agierenden Politiker wie Frank-Walter Steinmeier mit der fiktiven Figur des (Super-)Helden Jack Bauer zu parallelisieren, einer Figur, die gerne auch auf Gewaltmittel zurückgreift, um Staatsfeinde zur Strecke zu bringen, und die gleich in der ersten Staffel die eigene Frau im Dienste an der Gemeinschaft opfern muss. Ein solcher republikanischer Heroismus hat in der fiktionalen Welt amerikanischer Actionserien seinen Platz, nicht jedoch in der Alltagswelt bundesdeutscher Politik. Es ist daher plausibel zu vermuten, dass die Redaktion genau mit diesem Stilmittel eine ironisierende Brechung in eine ansonsten zu positiv wirkende Darstellung des Kandidaten eingebaut hat. Auch wenn viele Kerner-Zuschauer das ironisierende Zitat der Serie nicht direkt erkannt haben werden, so ist doch die ästhetische Gestaltung auf der Bild- und Tonebene mit einem starken Verfremdungseffekt verbunden. Das ist, wohlgemerkt, keine offene Konfrontation, denn der Grundtenor bleibt hier wie auch in den späteren Gesprächssequenzen kooperativ. Aber es sind zumindest Kontingenzpotenziale angelegt in der Fremdinszenierung des Politikers.

Am soziologischen Standort Wuppertal wurde die ethnografische Einbettung geleistet. Im Zentrum standen dabei teilstandardisierte Interviews mit PolitikerInnen, MedienakteurInnen, Talkgästen aus nicht politischen Kontexten und KommunikationsberaterInnen. Insgesamt konnten 45 Interviews ausgewertet werden. Die GesprächspartnerInnen setzten sich aus neun PolitikerInnen, drei politischen ReferentInnen, neun PolitikberaterInnen, sechs ModeratorInnen, zwei Programmverantwortlichen, fünf Redaktionsmitgliedern, sechs MitarbeiterInnen aus der Talkshowproduktion und Programmgestaltung, vier als ExpertInnen geladenen Talkshowgästen sowie einem Journalisten/einer Journalistin zusammen. Für die Datenerhebung wurden Leitfäden für „problemzentrierte Interviews“ (Witzel und Reiter 2012, S. 64–94) mit den jeweiligen Akteursgruppen ausgearbeitet. In drei analytischen Schritten erfolgte dann die hermeneutische Auswertung der Interviews (Soeffner und Hitzler 1994, S. 28–55). Bei der Auswertung, insbesondere bei der vergleichenden Kodierung der Interviews, wurde das qualitative Analyseprogramm MaxQDA genutzt. Hinsichtlich der Bewertung der Validität der Interviewdaten war jeweils zu bedenken, dass sich die AkteurInnen, zumal die prominenten AkteurInnen immer auch in einem Darstellungsmodus befanden. Sie haben nicht offen von der Hinterbühne geplaudert, sondern uns das erzählt, was sie erzählen wollten. Erst aus dem Vergleich der diversen Interviewdaten untereinander sowie im Abgleich mit den audiovisuellen Daten und weiterem Feldwissen konnte evaluiert werden, wie nah die dargestellten Perspektiven der tatsächlichen Handlungslogik der Beteiligten kamen. Hilfreich bei dieser Einschätzung war auch die Hinzunahme weiterer Datensorten über teilnehmende Beobachtungen und die Auswertung von Felddokumenten (interne Dossiers von Sendungen oder Kommunikationsratgeber). Vor allem wurden die Auswertungen immer wieder in der Gruppe diskutiert, um durch eine Zusammenführung verschiedener ForscherInnenperspektiven eine höhere Intersubjektivität der Befunde sicherzustellen (siehe Steinke 2000, S. 319–331).

3.2 Triangulation auf der Makroebene

Der entscheidende Erkenntnisgewinn ergab sich dann aus der Triangulation der Daten und Methoden (Flick 2011, S. 27–50), die auf einer Makro- und einer Mikroebene durchgeführt wurde. Auf der sendungsübergreifenden Makroebene konnten die Befunde der audiovisuellen Textanalysen in Relation gesetzt werden zu den Ergebnissen der Interviewauswertung. Dadurch ließen sich feldspezifische Wissensformationen und Handlungslogiken der AkteurInnen rekonstruieren, um ein differenziertes Bild der komplexen Realität dieser interaktiv entstandenen Medienprodukte zu entwerfen. So konnten zum einen durch die Interviews mit RedakteurInnen und RegisseurInnen Prozessabläufe auf der medialen Hinterbühne rekonstruiert werden: wie wird recherchiert, nach welchen Kriterien werden die Gästerunden komponiert, welcher Handlungslogik folgt die Bildmischung bei der Zusammenstellung des konkreten Sendungstextes (Dörner et al. 2015, S. 97–103)?

Zum anderen machten die Interviews mit den PolitikerInnen, ihren MitarbeiterInnen und BeraterInnen sichtbar, wie hier systematisch Kontingenzmanagement betrieben wird, um die eigene Inszenierung gegen mitunter konfligierende Inszenierungskonzepte des Medienpersonals abzusichern und Unberechenbarkeiten zu vermeiden.

Die Strategien des Kontingenzmanagements lassen sich wie folgt systematisieren: (1) vorbereitende Maßnahmen, (2) Kontingenzmanagement während der Sendung und (3) nachbereitende Aktionen; sie sollen stellvertretend für die Interviewbefunde im Folgenden zumindest kurz exemplarisch dargestellt werden (ausführlich in Dörner et al. 2015, S. 366–369).

Der erste Bereich umfasst zunächst professionelle Schulungen und Coachings, wie sie heutzutage für die meisten PolitikerInnen schon auf der landespolitischen Ebene üblich sind. Das betrifft Sprech- und Schauspielschulungen sowie Beratungen für die gesamte Darstellungsstrategie auf verbaler wie nonverbaler Ebene. Weiterhin gehören dazu Auswahl und Planung der konkreten Talkshowauftritte. Angesichts der Vielzahl von Anfragen verlassen sich PolitikerInnen auf die Empfehlungen ihrer PressesprecherInnen, BüroleiterInnen und ReferentInnen. Für diese Akteursgruppe wiederum bildet das vorhandene oder fehlende Vertrauen zu medialen AkteurInnen eine wichtige Entscheidungsgrundlage. Teilweise treten PolitikerInnen auch von einer bereits erfolgten Zusage zurück (oder drohen dies an), wenn weitere Personen in die Sendung eingeladen werden, von deren Seite aus Konfrontationen oder unberechenbare Aktionen zu befürchten sind. So wurde ein Autor dieses Beitrags, Andreas Dörner, selbst einmal von der Redaktion in eine Sendung zunächst ein- und dann wieder ausgeladen, weil der seinerzeit amtierende Außenminister sich ungern öffentlich wissenschaftlich analysiert sehen wollte.

Kontingenzmanagement erfolgt auch durch die Antizipation von Erwartungshaltungen des Medienpersonals. Indem PolitikerInnen den impliziten oder expliziten Wünschen der Redaktion entgegenkommen und entsprechende Angebote bereithalten (z. B. private Fotodokumente, Kostümierung oder Requisiten), versprechen sie sich einen kooperativeren Umgang. Antizipiert werden natürlich auch Erwartungen des Publikums, etwa hinsichtlich des Unterhaltungswertes oder der „menschlichen“ Nähe, die geboten werden muss, um Sympathien beim Publikum im Studio und vor dem Fernseher zu erheischen.

Themenabsprachen zwischen PolitikerInnen und Redaktionen gehören zu den wichtigsten Faktoren bei den Vorbereitungen. Die Interviewauswertungen sowie Dokumentenanalysen redaktionsinterner Unterlagen zeigen, dass Themenabsprachen inklusiver oder exklusiver Art sein können. Durch inklusive Themenabsprachen drücken PolitikerInnen den Wunsch aus, in der Sendung ein bestimmtes Thema anzuschneiden. Typischerweise halten Redaktionen während der Vorgespräche Präferenzen der Gäste hinsichtlich Gesprächsthema und -ablauf fest. So werden beispielsweise Buchveröffentlichungen oder bestimmte Veranstaltungen auf Wunsch der Gäste zum Gegenstand des Gesprächs. Exklusive Themenabsprachen benennen kommunikative Tabus, die in der Talkshow ausdrücklich nicht – oder nur unter Auflagen – Gesprächsgegenstand werden sollen.

Der zweite Bereich des Kontingenzmanagements läuft während der Produktion ab. So greifen politische AkteurInnen im Gesprächsverlauf auf Sprachregelungen zurück, um ihre „Kernaussagen“ zu vermitteln. Diese häufig von den Pressestellen der Fraktionen vorbereiteten Formulierungen zentraler „Botschaften“ entlasten die Akteure davon, passende Formulierungen improvisieren zu müssen. Das Abrufen schematischer Aussagen oder erlernter Rhetoriktechniken verleiht Sicherheit bei konfrontativen Nachfragen vonseiten der ModeratorInnen oder anderer Gäste. Auch die Modulation der eigenen Darstellung im Gesprächsverlauf kann als Form des Kontingenzmanagements begriffen werden. Eine gängige Form der Selbstthematisierung, um Sympathien zu generieren, ist das Negieren einer parteipolitischen Funktionsrolle und damit die Ausblendung machtpolitischer Motive. Besondere Bedeutung kommt dabei auch der humorvollen Modulation der Kommunikation zu, die vieles sagbar macht, das im ernsthaften Modus nicht geäußert werden dürfte. Schließlich versuchen politische AkteurInnen auch, durch Interaktion mit dem Studiopublikum (in dem teilweise MitarbeiterInnen der Gäste als Claqueure platziert sind) Unterstützung für die eigene Performance zu erlangen. Mit den so rekonstruierten Akteursperspektiven lässt sich besser einordnen, warum politische Gäste in Personality Talks in der beobachtbaren Weise agieren.

Der dritte Bereich umfasst Maßnahmen im Nachgang zur Sendung. Diese können in einer strategischen Auswertung von Auftritten mit kontingenzmindernden Folgerungen für weitere Auftritte bestehen, aber auch darin, dass PolitikerInnen beziehungsweise deren Personal bei den Redaktionen oder auf übergeordneten Ebenen, etwa bei der Intendanz oder beim Rundfunkrat, gegen das Verhalten der MedienakteurInnen Protest einlegen.

3.3 Triangulation auf der Mikroebene

An einem kleinen Fallbeispiel soll abschließend gezeigt werden, wie die Triangulation auf der sendungsbezogenen Mikroebene helfen kann, einzelne Sequenzen aus den Sendungstexten differenzierter zu interpretieren. Es geht um den Auftritt des damals amtierenden thüringischen Ministerpräsidenten Dieter Althaus, der eine Sendung der Reihe Johannes B. Kerner nutzen wollte, um am 30. April 2009 einen reichweitestarken Auftakt zum Landtagswahlkampf zu leisten (siehe dazu ausführlich Vogt 2015, S. 163–199). Althaus hatte zuvor in seinem Winterurlaub einen schweren, selbstverschuldeten Skiunfall erlitten, bei dem eine junge Frau und Mutter tödlich verletzt worden war. Die Talkshow sollte nun als „öffentliche Beichte“ und als Versicherung dafür dienen, dass der Politiker nach Krankenhausaufenthalt und Reha wieder fit sei für den Wahlkampf.

Die Sendung fand mit dem für das Format typischen Bühnenbild statt, obwohl sie nicht wie üblich im Hamburger Studio aufgezeichnet wurde, sondern auf Wunsch des Ministerpräsidenten in einer eigens dafür aufgebauten Studiokulisse in der Landeshauptstadt Erfurt. Der ebenfalls als Studiogast geladene Journalist Michael Jürgs berichtet im Projektinterview, dass „wir halt mit ‘nem Privatflieger von Hamburg da hin geflogen sind, was billiger war als die Deutsche Bundesbahn, weil wir zu etwa 30 Leuten waren, die ganze Mannschaft.“

Das „Heimspiel“ in Erfurt diente als eine erste Maßnahme des proaktiven Kontingenzmanagements. Zweitens berichtete Jürgs, dass Althaus bis kurz vor Aufzeichnungsbeginn über einem Briefing seiner MitarbeiterInnen saß und offensichtlich Formulierungen einstudierte. Dies korrespondiert mit der später auch in der Sendung sichtbaren Formelhaftigkeit und geringen Flexibilität von Althaus‘ Sprechakten. Die Vermeidung von Kontingenz durch unbedachte Wortwahl ging hier zu Lasten von Lebendigkeit und Authentizität in der Ausstrahlung des Akteurs.

Drittens schließlich beschreibt Jürgs, wie der Talkgast und Abtprimas des Benediktinerordens Notker Wolf kurz vor der Sendung seine Ordenstracht mit Kutte und Kreuz anzog, was seiner Erscheinung als autorisierter Beichtvater und Exkulpator visuell Nachdruck verlieh (siehe Abb. 2).

Abb. 2
figure 2

Screenshot mit Althaus und Wolf aus der Sendung Johannes B. Kerner vom 30. April 2009 [TC 08:24]. Der Kleriker mit Kreuz und Ordenstracht spricht über Vergebung – die Kameraeinstellung legt eine Beichtsituation nahe. Kurz zuvor war einer Bauchbinde zu entnehmen, dass Althaus ein gläubiger Katholik sei. In der Mitte zwischen den beiden Akteuren steht ein Wasserglas, das später durch eine ausgreifende Geste von Althaus vom Tisch gestoßen wird und Anlass zu mehreren religiösen Anspielungen und Scherzen gibt

Wäre Wolf in seinem „normalen“ Anzug mit Krawatte aufgetreten, hätten seine Worte nicht in gleicher Weise die gewünschte theologische Autorität entfalten können. Jürgs selbst war redaktionell die Rolle des Althaus-Kritikers und Gegengewichts zu Notker Wolf zugedacht worden, damit es nicht zu harmonisch, sondern auch unterhaltsam im Sinne von interaktiver Spannung werden würde. Jürgs hatte früher bereits häufiger in Talkshows den Part des kritischen Journalisten eingenommen, der aggressiver auftreten darf als der Moderator (so gegenüber der SPD-Politikerin Andrea Ypsilanti in einer Sendung des Formats Beckmann). Er änderte jedoch nach eigenem Bekunden während der Sendung selbst seine Strategie, um Althaus nicht zu sehr in die Rolle eines Medienopfers zu bringen: „Dann dachte ich ‚Wenn ich das jetzt sage, dann ist er erledigt. Weil es zeigt, dass er partiell nicht da ist.’ Und dann kam bei mir die Überlegung: ‚Nein, dann hat er gewonnen. Dann ist er der Arme, und ich bin der Böse’“ (Projektinterview Jürgs). Also übernahm Jürgs, was im Sendungstext auch gut sichtbar wird, die Rolle des Beraters und Therapeuten, der Althaus ermahnt, mehr Gefühl zu zeigen, um authentischer zu wirken. Der Redaktion war das aus ihrem Unterhaltungsinteresse heraus zu zahm, sie hatte erwartet, Jürgs werde Althaus „schlachten“ und zeigte sich später enttäuscht.

Althaus wiederum zeigte sich im Projektinterview zufrieden mit der Gästekomposition der Redaktion. Er sei Wolf persönlich auf „Besinnungstagen“ begegnet und habe auch Literatur von ihm gelesen. Der Politiker erläuterte uns gegenüber auch, warum er überhaupt eine Talkshow wie Kerner gewählt hatte, um sich nach der Unfallkrise dem breiteren Publikum zu präsentieren: „Als Politiker hat man in solchen Sendungen die Möglichkeit, sich als authentische Persönlichkeit darzustellen. Je komplizierter die Wirklichkeiten, die politischen Antworten und auch die Strukturen werden, desto mehr muss die Politik auf die Glaubwürdigkeit der vermittelnden Personen setzen. Fritz Stern, ein großer Historiker, sprach einmal davon, dass die Demokratie vom Systemvertrauen lebe. Dafür ist es aber wichtig, dass man dem Menschen, der politische Verantwortung trägt, vertraut. Dafür leisten auch Sendungen wie diese eine wichtige Rolle. Am Ende werden nicht Parteiprogramme gewählt, sondern Menschen“ (Projektinterview mit Dieter Althaus).

Diese Passage zeigt zugleich, dass und wie politische Akteure in solchen (redigierten) wissenschaftlichen Interviews immer auch im Darstellungsmodus agieren. Althaus zitiert eine Autorität und rückt die PR-Maßnahme zu Beginn der heißen Wahlkampfphase in einen größeren demokratietheoretischen Kontext, der das Vorgehen legitimiert. Interessant ist schließlich, dass der Politiker indirekt den Erfolg von Jürgs‘ Beratungsstrategie bestätigt. Man habe, so der ehemalige Ministerpräsident im Projektinterview, die Kerner-Sendung ausführlich nachbereitet und dann entschieden, kurze Zeit später einen weiteren Auftritt in einem regionalen MDR-Format für die Thüringer Wähler stattfinden zu lassen. Diese Maßnahme lässt sich durchaus als Kontingenzmanagement im Nachgang zur Kerner-Sendung interpretieren, da es hier darum ging, den insgesamt nicht als rundum gelungen eingeschätzten Auftritt mit einem weiteren aufzufangen.

4 Fazit

Es sollte auf knappem Raum gezeigt werden, dass und wie medienwissenschaftliche Analysen von den Methoden einer ethnografisch eingebetteten Videoanalyse profitieren können. Mit dem ethnografischen Zugang kann jenseits der Textanalyse ein methodisch kontrollierter Zugang zum Produktionskontext und zur konkreten Handlungslogik der beteiligten Akteure gewonnen werden. Indem Sequenzen beispielsweise zunächst textanalytisch untersucht und dann mit Interviewdaten konfrontiert werden, erschließen sich die Motivation und der Sinn bestimmter Interaktionen vor und hinter den Kameras besser. Sinnvoll erscheint ein solcher Zugang vor allem angesichts kollektiver Autorschaften audiovisueller Texte, in denen die Bedeutungsproduktion als Ensembleleistung stattfindet und die Sinnstruktur jeweils das Resultat interaktiver Aushandlungsprozesse zwischen den Beteiligten darstellt (in unserem Fall etwa zwischen Redaktionsmitgliedern, Regie, Moderation, Gästen, Publikum etc.). Auch Verfahren der teilnehmenden Beobachtung (beispielsweise in Redaktionskonferenzen oder im Regieraum) sowie der Auswertung von Felddokumenten (in den Projekten konnten u. a. auch Redaktionsdossiers eingesehen werden) bieten eine wertvolle Ergänzung der Perspektiven. Interessant erscheint schließlich auch eine Einbindung von Rezeptionsprozessen. Dabei kann das ethnografische Vorgehen mit Methoden der interpretativ-empirischen Rezeptionsforschung verknüpft werden, etwa mit narrativen Interviews, Gruppendiskussionen oder teilnehmender Beobachtung zur Kommunikation beim Medienkonsum. Nicht zuletzt kann öffentliche Anschlusskommunikation etwa in sozialen Netzwerken sinnvoll mit einbezogen werden.

Entscheidend ist bei alldem, dass die unterschiedlichen Datensorten und Zugänge sowie auch die Perspektiven mehrerer Forschersubjekte umsichtig miteinander trianguliert werden, um die komplexe Wirklichkeit der Medienpraxis angemessen differenziert rekonstruieren zu können. Die in der Soziologie entwickelten Gütekriterien der interpretativen Sozialforschung sollen gewährleisten, dass die Forschungsergebnisse transparent erarbeitet, gegenstandsangemessen, intersubjektiv nachvollziehbar und somit weitgehend frei von Idiosynkrasien einzelner Forscherpersönlichkeiten gehalten werden. Dies wird hier deshalb so betont, weil die methodische Sorgfalt beispielsweise im Kontext von Arbeiten der British Cultural Studies, wo eine Integration medien- und sozialwissenschaftlicher Perspektiven programmatisch auch eine große Rolle spielte und immer noch spielt, häufig doch sehr zu wünschen übrig lässt.

Die sozialwissenschaftlich geprägten Zugänge weisen in den meisten Fällen ihren „blinden Fleck“ im Bereich der Ästhetik und Formgestaltung auf. Diese Dimension wird häufig ganz ausgeblendet oder nur sehr am Rande beachtet. Hier liegt unseres Erachtens die besondere Relevanz eines medienwissenschaftlichen Zugangs, da in diesem Fach – nicht zuletzt aufgrund der disziplinären Tradition – eine besondere Kompetenz und Sensibilität für das Ästhetische entwickelt wurde. Dies betrifft nicht nur Textsorten wie komplexe Spielfilme und neue TV-Qualitätsserien, die besonders intensiv durch ästhetische Gestaltung gekennzeichnet sind. Auch in vermeintlich anspruchslosen bzw. „trivial“ gestalteten Genres wie Talkshows spielen Gestaltungsmittel wie Bühnenbild, Farbgebung, Lichtsetzung, Bildästhetik, Schnitt und Montage sowie Dramaturgie eine wichtige Rolle bei der Bedeutungskonstitution. Medienwissenschaftliche Analyseperspektiven können das herkömmliche Vorgehen sozialwissenschaftlicher Ansätze in dieser Hinsicht wertvoll bereichern. Wichtig war uns aber vor allem zu zeigen, dass jenseits der großen methodologischen Debatten und disziplinären Grabenkämpfe auf der Basis interpretativen Vorgehens interdisziplinäre Kooperation stattfindet.