1 Einleitung

Obschon Bilder ein inhärenter Bestandteil audiovisueller Medien sind, konzentrieren sich Untersuchungen zur politischen Kommunikation im Fernsehen bisher fast ausschließlich auf die verbal vermittelten Inhalte. Die vorliegende Studie versteht sich als Beitrag zum jungen Forschungsfeld der visuellen Wahlkampfkommunikation (vgl. Knieper und Müller 2004) und vergleicht Fernsehnachrichtenbeiträge aus Deutschland und den USA während der Wahlkämpfe 2009 respektive 2008. Da das Publikum politische Akteure schon in den ersten Sekunden der Rezeption aufgrund visueller Informationen beurteilt (vgl. Maurer 2009), lohnt die Analyse von Fernsehnachrichten, in denen die Kandidaten oftmals nur in kurzen – zum Teil rein visuellen – Bildsequenzen präsentiert werden. Der komparative Ansatz erlaubt zudem Rückschlüsse darauf, welchen Einfluss verschiedene Kommunikationssettings auf die Präsentation der Akteure haben. Die visuelle Darstellung wird zum einen auf inhaltliche Merkmale der Kandidatenauftritte vor dem Hintergrund von Inszenierungsstrategien erhoben. Zum anderen wird der journalistische Einfluss durch die Erhebung sogenannter Sound Bites und Image Bites sowie das Verhältnis von Kommentierung und personengebundenen Merkmalen (Mimik/Gestik) ermittelt. Ziel der komparativen Analyse ist es festzustellen, ob sich länderübergreifende Konvergenzprozesse zeigen oder ob nationale Nachrichtenlogiken und Bildstrategien existieren.

2 Der komparative Rahmen der Untersuchung

Ausgangspunkt der Studie ist die Annahme, dass sich die Strukturbedingungen und Interaktionsnormen eines nationalen politischen Kommunikationssystems in den Rollenwahrnehmungen und Kommunikationshandlungen von Politikern und Journalisten niederschlagen (vgl. Blumler und Gurevitch 1995, S. 74). In der vorliegenden Studie bilden die beiden politischen Kommunikationssysteme USA und Deutschland mit ihren nationalen Einflussfaktoren den theoretischen Rahmen (siehe dazu Esser und Strömbäck 2012, S. 294; Pfetsch und Esser 2012, S. 30). Dabei ist zunächst auf Unterschiede im Wahlsystem zu verweisen, denn Mehrheitswahlrechtsysteme wie in den USA führen oft zu einer starken Kandidatenkonzentration. Systeme mit Verhältniswahlrecht wie Deutschland sind dagegen durch eine stärkere Orientierung an Parteistrukturen gekennzeichnet.

Nach dem Media-Politics-Modell von Hallin und Mancini (2004) zählt Deutschland zu den Vertretern des demokratisch-korporatistischen Modells mit einem gemischten Rundfunksystem aus öffentlich-rechtlichen und privaten Sendern, in dem der staatliche Einfluss auf das Fernsehen dem Prinzip der „politischen Repräsentation“ folgt; die journalistische Autonomie der öffentlich-rechtlichen Sender gegenüber den Parteien wird als „politics-in-broadcasting system“ beschrieben. Die USA sind als Vertreter des liberalen Modells durch ein gering reguliertes, marktbestimmtes Mediensystem geprägt, in dem das Verhältnis zwischen Politik und Fernsehen als „professional model of broadcasting governance“ bezeichnet wird und die Distanz zwischen Politik und Fernsehen sehr groß ist (vgl. Plasser et al. 2009, S. 178).

Vor dem Hintergrund dieser Divergenzen werden unterschiedliche Mediatisierungsgrade vermutet (vgl. Pfetsch 2001, S. 51). Während im „parteipolitisch“ geprägten deutschen System der Kommunikationsmodus noch eher der politischen Logik folgt, ist das „medienorientierte“ amerikanische Kommunikationssystem von den news values der Journalisten und den news management-Interessen der Politiker geprägt (vgl. Pfetsch 2001, S. 49–51). Die deutsche Berichterstattung ist durch geringere und die US-amerikanische Berichterstattung durch höhere journalistische Autonomisierung und Intervention charakterisiert (vgl. Plasser et al. 2009, S. 194). Stärker interventionistische Nachrichtenkulturen rücken interpretative Berichterstattungsstile der Journalisten stärker ins Zentrum, wohingegen Politiker weniger Raum zur Selbstdarstellung erhalten (vgl. Plasser et al. 2009, S. 184). Ob sich die Annahme unterschiedlicher politischer Kommunikationskulturen (Pfetsch 2001) allerdings auch in unterschiedlichen Nachrichtenkulturen niederschlagen, ist nicht gesichert. In einer der wenigen Vergleichsstudien zur visuellen Kandidatendarstellung in der Fernsehberichterstattung findet Esser (2008) gleichzeitig unterschiedliche Kampagnen- und Berichterstattungsstile und transnationale Angleichungsprozesse. Die größte Neigung zur Imageorientierung (und die größte Anfälligkeit für Konvergenztrends) findet er in kommerziell orientierten Medienorganisationen und -systemen. Die Länder USA und Deutschland wurden ausgewählt, weil sie unterschiedliche Mediensysteme (vgl. Hallin und Mancini 2004), unterschiedliche Rundfunksysteme (vgl. Semetko 1996), unterschiedliche politische Kommunikationskulturen (vgl. Pfetsch 2001) und unterschiedliche Nachrichtenkulturen (Esser 2008) vertreten. Andererseits ist das Verhältnis beider Länder in Politik und Medien durch enge Koorientierungs- und Diffusionsprozesse geprägt (vgl. Kamps 2000) und erlaubt damit der oben angesprochene Gleichzeitigkeit weiter nachzugehen. Die vorliegende Studie führt zudem die in Essers (2008) Mehrländerstudie gelegten Grundlagen weiter, indem sie mehr Visualisierungsindikatoren vertiefend analysiert und den Rahmen der Beobachtung weitet.

3 Sound Bite und Image Bite News

Die Neigung von Fernsehjournalisten, Originaltöne von Kandidaten immer mehr zu verkürzen und auszudünnen, wird als Sound-Bite-Journalismus bezeichnet. Er gilt zusammen mit der Präferenz für stumme Kandidatenbilder als Indikator medienzentrierter Berichterstattung (vgl. Esser 2008, S. 402; Plasser und Plasser 2002, S. 72; Hallin 1992, S. 9). Diese Entwicklung zeigt, dass Journalisten nicht nur reproduzieren und übermitteln, sondern durch Selektion, Kürzung, Montage und Re-Framing zunehmend für eine eigenständige Erzählung sorgen. Das Desinteresse an Politikerstatements wird von Kritikern als Hinweis auf abnehmende Authentizität der Berichterstattung und auf „Entmündigung“ der Akteure angesehen (Schulz und Zeh 2010, S. 317; vgl. Donsbach und Jandura 2003, S. 51). Studien zeigen, dass vor allem im US-Journalismus die Politikern zugestandenen O-Ton-Längen („Sound Bites“) eine gravierende Verkürzung erfuhren – von über 40 Sekunden in den 1960er Jahren auf unter 10 Sekunden heute (vgl. Hallin 1992, S. 6; Farnsworth und Lichter 2011, S. 64). In deutschen Wahlkämpfen wurde ebenfalls eine starke Abnahme der O-Ton-Längen seit den 1980er Jahren festgestellt (vgl. Donsbach und Büttner 2005, S. 33). Während Zeh (2005, S. 98) bereits für die Wahl 1994 ermittelte, dass die Privatsender „amerikanischen Standards“ folgten, haben sich die öffentlich-rechtlichen Sender bei jüngsten Wahlkämpfen den Privatsendern angenähert (vgl. Esser 2008, S. 411; Schulz und Zeh 2010, S. 328).

Gleichzeitig wird ein Bedeutungsgewinn sogenannter Image Bites konstatiert. Darunter versteht man Filmsequenzen, in denen die Politiker stumm im Bild zu sehen sind, während journalistische Kommentatoren sprechen („voice over“). Bucy und Grabe (2007, S. 667) stellten in ihrer Langzeitstudie von vier US-Wahlen fest, dass Image Bites den größeren Teil der Berichterstattung ausmachten und kontinuierlich zunahmen. Für deutsche Fernsehnachrichten ermittelten Schulz und Zeh (2010, S. 327), dass die beiden Spitzenkandidaten im Wahljahr 2009 insgesamt etwas länger in Filmsequenzen ohne Ton als in solchen mit O-Ton vorkamen. In einer ländervergleichenden Studie wies Esser (2008) eine graduelle Annäherung der (immer kürzeren) Sound-Bite-Längen an die der USA und einen zunehmenden Einsatz von Image Bites in westeuropäischen Nachrichtensendungen nach.Footnote 1 Privatsender nutzten Image Bites am intensivsten, da sie einen personalisierten, griffigen und unterhaltsamen Zugang zur Politik ermöglichen.

Die Präsenz der Kandidaten in Beiträgen, Image Bites und O-Tönen kann auch in Hinblick auf einen Präsenz- oder Sichtbarkeitsbonus (vgl. Zeh 2005, S. 67; Hagen et al. 1998, S. 229) diskutiert werden. Studien belegen vor allem für Deutschland einen kontinuierlichen Bonus für den Amtsinhaber (vgl. z. B. Brettschneider 2009), während für die amerikanische Berichterstattung generell eine stärkere Beachtung der Chancengleichheit der Kandidaten betont wird (vgl. Semetko 1996; Pfetsch 2001). Nach den bisherigen Erläuterungen ergeben sich bereits folgende erste Hypothesen für unsere Untersuchung:

  • H 1a: In Deutschland zeigt sich hinsichtlich der visuellen Präsenz der Spitzen-kandidaten ein Amtsinhaberbonus.

  • H 1b: In den USA führen strikte Balanceregeln zu einer ausgewogenen Visualisierung.

  • H 2a: Die durchschnittlichen Sound-Bite-Längen von Kandidaten sind im medienzentrierten und kommerzialisierten US-Rundfunksystem kürzer als in Deutschland.

  • H 2b: Der Anteil der Image Bites ist dagegen in der US-Berichterstattung höher als in Deutschland.

4 Visuelle Kandidatendarstellungen und Rollenbilder

Die Beschneidung der Redezeit erfordert von Kandidaten, dass sie auf die neue „Ära des Bildes“ durch die visuelle Verkörperung „zusätzliche[r], andere[r] Rollen“ (Diers 1997, S. 187) reagieren. Der Zugang zur Fernsehberichterstattung setzt zudem die Schaffung symbolkräftiger Events und die Produktion von Bildern mit hoher Qualität voraus (vgl. Donsbach und Jandura 2003, S. 62), da die Visualisierung von Nachrichteninhalten ein wichtiges Selektionskriterium der Medien ist. Da die visuelle Kommunikationslogik auf Assoziationen basiert (vgl. Müller 2003, S. 22), kann die Präsentation der Kandidaten in bestimmten Settings und im Kontext von Symbolen oder Personen (z. B. Nationalflagge, Familien) zur visuellen Verknüpfung mit Rollenanforderungen führen, denen es im Wahlkampf zu entsprechen gilt. Nach Barisione (2009, S. 50) werden diese Anforderungen generell unter „effectiveness“ (z. B. Durchsetzungsstärke) und „trustworthiness“ (z. B. Glaubwürdigkeit) eingeordnet und verbal transportiert. Jedoch erfüllen auch „visuals“ verstärkt konkrete Funktionen (vgl. Schill 2012) und die visuell verkörperten Eigenschaften, wie Führungsstärke oder Mitgefühl, haben Auswirkungen auf die Konstruktion des politischen Images der Kandidaten. Laut Graber (1987, S. 117) schafft die Darstellung der Akteure in verschiedenen Settings „ideal conditions for forming images about the character and qualification of the candidates“. Glassman und Kenney (1994) sprachen nach einer Analyse von Pressefotos in US-Wahlkämpfen von visuell konstruierten Politikertypen. Sie vermuteten, dass sich Fotografen bei ihren Aufnahmen an bestimmten Mythen orientieren und damit inszenierte Images von Kandidaten bewusst oder unbewusst transportieren. Die Typen umfassen unter anderen den „glad-to-see-you“-Kandidaten oder den „beloved leader“, die beim Händeschütteln mit Anhängern oder vor applaudierenden Publika gezeigt werden. Grabe und Bucy (2009) erarbeiteten drei Oberkategorien für die Darstellung der Akteure: „The Ideal Candidate“, „The Popular Campaigner“ und „The Sure Looser“, die sich aus verschiedenen visuell konstituierten Eigenschaften (z. B. „mass appeal“ oder „compassion“) zusammensetzten. Sie wurden als universelle „visual frames“ in die politische Wahlkampfliteratur eingeführt. Wir nehmen diesen Impuls auf und sind daran interessiert, ob sich solche nonverbalen Rollenimages generalisieren lassen und auch in deutschen Wahlkampagnen auftauchen.

Demnach sind Führungsstärke und staatsmännisches Auftreten zentrale Kompetenzen und Bildmotive, die es als Anwärter auf ein Regierungsamt zu verkörpern gilt. Sie sollen die enge Bindung des Politikers mit dem Land beschwören und die Führungsstärke der Akteure durch eine patriotische und mystische Symbolik – z. B. der Kandidat vor der Nationalflagge – untermauern (vgl. Grabe und Bucy 2009, S. 102; Schill 2012, S. 122). Weiterhin kann die Präsentation des Kandidaten im Umfeld einer Entourage oder statushoher Persönlichkeiten staatsmännisches Auftreten und Glaubwürdigkeit verkörpern und die Machtposition unterstreichen (vgl. Bennett 1977, S. 228; Grabe und Bucy 2009, S. 290). Auch formelle Kleidung wie Krawatte und Anzug stehen für würdervolle Ausstrahlung und staatsmännisches Auftreten (vgl. Moriarty und Popovich 1991, S. 375).

Eine wichtige Funktion von Bildern im Wahlkampf ist es, Popularität des Kandidaten zu suggerieren. Bilder des Kandidaten vor applaudierenden Mengen, voll besetzten Reihen, plakatschwenkenden Zuschauern sowie zustimmende Gesten von Publikum oder Unterstützern fungieren als visueller Beweis für die Kompetenz des Kandidaten, unterstreichen die Unterstützung und suggerieren den Erfolg der Kampagne (vgl. Schill 2012, S. 124; Waldman und Devitt 1998, S. 306; Hagen et al. 1998, S. 236; Kepplinger 1980, S. 170). Demgegenüber können Bilder von negativen Publikumsreaktionen – etwa Desinteresse, Kopfschütteln oder Störern – auch zu negativer Wahrnehmung führen und Kandidaten als inkompetent, unpopulär und damit als „Verlierertypen“ erscheinen lassen (vgl. Duck und Baggaley 1975, S. 83; Grabe und Bucy 2009, S. 112).

Die Bodenständigkeit des Kandidaten ist ein weiterer Anspruch an die Kampag­nenführung. Da visuelle Images einfache Botschaften vermitteln und Gefühle sichtbar werden lassen, sind Bilder besonders dafür geeignet, durch die Betonung bestimmter Persönlichkeitseigenschaften Identifikationsflächen und eine emotionale Bindung mit den Zuschauern zu schaffen (vgl. Schill 2012, S. 129). Kandidaten präsentieren sich daher in alltäglichen Kontexten, bspw. beim Einkaufen oder bei Sportveranstaltungen, und verkörpern damit den Typus „Einer von uns“. Das Tragen von „informeller“ Kleidung bei offiziellen Auftritten ist beliebt, z. B. suggerieren das Ablegen des Jacketts und das Hochkrempeln der Ärmel einen uneitlen Einsatz und die Nähe zum Bürger (vgl. Grabe und Bucy 2009, S. 107).

Volksnahes Auftreten steht für die Vertrauenswürdigkeit des Kandidaten und wird durch den Kontakt mit dem Publikum sowie dem Normalbürger als individuellem Akteur visualisiert. Dankesgesten, Händeschütteln, der Weg durch das Publikum, aber auch das Gespräch sind Interaktionen, die die Bindung zum Wähler unterstreichen sollen. Auch das „Bad in der Menge“ sowie der „Besuch vor Ort“ werden als Szenarien wahrgenommen, die Bürgernähe erzeugen und ein Bewusstsein der Politiker für die Probleme ihrer Zeit belegen (vgl. Schicha 2008, S. 261; Banning und Coleman 2009, S. 9; Grabe und Bucy 2009, S. 291). Identifikation wird ferner durch die Inszenierung des Kandidaten als Familienmensch geschaffen; dabei sind „baby-kissing politicians“ ein US-amerikanisches Klischee und Auftritte mit der Familie mittlerweile ein Allgemeinplatz (vgl. Sherr 1999, S. 45). Diese Handlungen stehen für das Mitgefühl des Kandidaten und klassifizieren ihn als „father figure and family guy“ (Glassman und Kenney 1994, S. 6; vgl. Grabe und Bucy 2009, S. 104). Entsprechend können auch weibliche Kandidaten als „Mutterfigur und Familienmensch“ wahrgenommen werden.Footnote 2

Die mediale Darstellung der Kandidaten lässt sich demnach öfter auf das Kampagnenmanagement zurückführen, als es der TV-Zuschauer wahrnimmt. Allerdings erfolgt die Selektion der Bilder immer noch durch die TV-Redakteure und orientiert sich auch an Nachrichtenwerten. Eine Inhaltsanalyse der Berichterstattung dokumentiert somit die Summe von Inszenierung und Nachrichtenauswahl. Vor dem Hintergrund der unterschiedlichen Kommunikationssysteme formulieren wir als weitere Annahmen:

  • H 3: Die inhaltliche Darstellung der Kandidaten unterscheidet sich zwischen den Ländern.

    • H3a: In beiden Ländern werden die Akteure als staatsmännische Kandidaten aufgrund kulturübergreifender Anforderungen an Amtsträger und Kandidaten dargestellt.

    • H3b: Die deutschen Kandidaten erscheinen aufgrund stärkerer Orientierung an der Parteienlogik politiknäher als die Kandidaten im medienzentrierten System der USA.

    • H3c: US-amerikanische Kandidaten sind aufgrund hoher Professionalisierung der Kandidatenführung im Gegensatz zu deutschen Kandidaten viel stärker in inszenierten Settings als Wahlkämpfer zu sehen, die populär sind und in engem Kontakt mit dem Volk stehen.

    • H3d: Die geringere Distanz zwischen Medien und Politik schlägt sich in deutschen TV-Nachrichten häufiger in Bildern von Journalist-Kandidat-Interaktionen nieder; in den US-Nachrichten manifestiert sich die größere Distanz zwischen Medien und Politik auch visuell.

5 Nonverbales Verhalten

Die visuell-nonverbalen Verhaltensweisen, also Körpersprache wie Mimik und Gestik, liefern schnell zugängliche und verallgemeinerbare Informationen zur Meinungsbildung über (politische) Akteure und lassen den Körper somit selbst zum Träger von Bedeutungen avancieren (vgl. Maurer 2009, S. 3; Ontrup 1999, S. 103). Der Einfluss körpergebundener Merkmale wurde in Studien zur Relevanz von „facial expressions“ sowie der Bedeutung von Körpersprache für die unmittelbare und konsistente Eindrucksbildung nachgewiesen (z. B. Todorov et al. 2005; Frey 1999). Vor allem in Redesituationen dienen Gesten sowie mimische Ausdrücke der Sprecher dazu, Glaubwürdigkeit und Überzeugungsstärke zu fördern sowie die verbalen Botschaften zu untermauern (vgl. Diers 1997, S. 186). Überlegungen, welche körpersprachlichen Verhaltensweisen positiv oder negativ konnotiert sind, werden entweder aus kulturunabhängigen Konventionen (z. B. Lachen) oder aus Wirkungsstudien abgeleitet. Bucy und Grabe (2008, S. 86) unterscheiden zwischen agonic und hedonic displays, wenn die Kandidaten bspw. nonverbale Signale von Ärger, Angst (negativ) bzw. Freude und Sicherheit (positiv) ausstrahlen. Es wird postuliert, dass freudige und lachende Gesichtsausdrücke für eine positive Grundausstrahlung sowie erfolgreichere und selbstbewusstere Kandidaten stehen als Kandidaten mit Stirnrunzeln, nach oben gezogenen Brauen, angespannten Gesichtsausdrücken oder herunterhängenden Mundwinkeln, die Unzufriedenheit und Unwohlsein der Kandidaten ausdrücken (vgl. Waldman und Devitt 1998, S. 306; Moriarty und Popovich 1991, S. 375; Bucy und Bradley 2004, S. 74). In Hinblick auf Gesten werden verschiedene Siegesposen (z. B. Daumen hoch, Victory-Zeichen) positiv konnotiert, die als „kodifizierte Handgesten“ (Fleissner 2004, S. 135) gelten. Handgesten während einer Rede verleihen dem Gesagten Nachdruck und schaffen den Eindruck von Stärke und Authentizität. Weiterhin wird ein dynamischer bzw. vorgebeugter Oberkörper positiv als Zeichen der Durchsetzungsfähigkeit gelesen (vgl. Holtz-Bacha und Lessinger 2006, S. 96–123; Kepplinger 1987, S. 40–42). Diers (1997, S. 189) verweist zudem auf die Symbolik der Verbundenheit durch den politischen Handschlag. Zeitgleich vermitteln sowohl starre Körperhaltungen, Auf- oder Anlehnen, verschränkte Arme oder die Hand vor dem Gesicht ein negatives Bild von den Kandidaten. Das Gleiche gilt für Bewegungen, die Aggressivität suggerieren, wie der gehobene Zeigefinger oder die geballte Faust (vgl. Molcho 1998, S. 164–173; Petersen 2001, S. 165; Bucy und Grabe 2008, S. 86; Banning und Coleman 2009, S. 9).

Mimik und Gestik stehen als körpergebundene Eigenschaften unter der Kontrolle der Akteure selbst, allerdings kann über Editierungstechniken und Bildauswahl das medial dargestellte Verhalten vom realen Verhalten abweichen (vgl. Kepplinger 1987, S. 11). Ausgehend von diesen Überlegungen sowie Studien zu Text-Bild-Beziehungen (Wember 1976; vgl. auch Brosius 1998) stellt sich die Frage, ob die journalistische Kommentierung und die nonverbale Darstellung divergieren oder ob es konsistente verbale und nonverbale Darstellungen gibt. Dies führt zu folgender Forschungsfrage:

  • FF1: Gibt es einen strategischen Einsatz von Image Bites mit bestimmten nonverbalen Darstellungen der Kandidaten, um den Bildern journalistische Kommentare zu unterlegen?

6 Methode

Zur Überprüfung der Hypothesen und Beantwortung der Forschungsfrage wurden die Nachrichtensendungen ABC World News und NBC Nightly News aus den USA sowie RTL Aktuell und ARD-Tagesthemen aus Deutschland untersucht. Es handelt sich um die Flaggschiff-Nachrichtensendungen der meistgesehenen Fernsehkanäle. Aufgrund ihrer einheitlichen Dauer und der Moderation durch ausgebildete Journalisten (Anchor-Prinzip) sind sie als funktional gleichwertig einzustufen. Entsprechend der Charakteristika der nationalen Rundfunksysteme wurden aus den USA zwei kommerzielle Sender (ABC, NBC) und aus Deutschland ein öffentlicher-rechtlicher (ARD) und ein privater (RTL) Sender ausgewählt. Der Untersuchungszeitraum erstreckt sich in den USA auf acht Wochen vor dem Präsidentschaftswahltermin 4.11.2008 und in Deutschland auf sieben Wochen vor dem Bundestagswahltermin 27.9.2009.Footnote 3 Das Aufgreifkriterium für die Auswahl eines Beitrags war neben dem klaren Bezug zum Wahlkampf die visuelle Erscheinung eines der untersuchungsrelevanten Kandidaten.Footnote 4

Insgesamt umfassen die untersuchten Beiträge ein Volumen von 334 min (Tab. 1). Zur Analyse der Nachrichteninhalte wurde eine quantitative Inhaltsanalyse angewendet, die sich als standardisiertes Verfahren dazu eignet, die hier untersuchten formalen Gestaltungsaspekte und Darstellungsweisen von Bildern zu erfassen (vgl. Grittmann und Amman 2011, S. 168).Footnote 5 Im Gegensatz zur Bildtypenanalyse wird für die Analyse der Kandidatendarstellungen zunächst das Vorkommen einzelner Bildinhalte auf der „primären Sujetebene“ (Grittmann und Ammann 2011, S. 170) codiert und in der Auswertung den theoretisch erarbeiteten Kandidatentypen zugeordnet. Mit unserer Analyse untersuchen wir in Anlehnung an die Dimensionierung von Geise und Rössler (2013, S. 351) sowohl die Oberflächenstruktur der Bilder (z. B. Person, Ort) als auch die Binnenstruktur (z. B. Symbole).

Tab. 1 Umfang der untersuchten Nachrichtenbeiträge und Nachrichtenszenen

Die Codierung erfolgte hierarchisch. Neben den formalen Daten auf der Beitragsebene erhoben wir in den einzelnen Nachrichtenszenen die inhaltlichen Komponenten der Bildkommunikation. Die Nachrichtenszene ist definiert als „a unit that represents continuity in time, place, character, ideas, or themes in a news story“ (Choi und Lee 2006, S. 703). In Anlehnung an Arbeiten zu Sequenzen sind damit Handlungseinheiten – hier Nachrichtensituationen – berücksichtigt, die „mehrere Einstellungen [umfassen] und sich durch ein Handlungskontinuum von anderen Handlungseinheiten“ (Hickethier 2007, S. 35) unterscheiden. Wird ein Kandidat innerhalb eines Settings (z. B. Bühne) aus verschiedenen Perspektiven oder bei verschiedenen Handlungen (Rede, Interaktion mit Publikum) gezeigt, so bildet dies eine Nachrichtenszene. Ein Wechsel des Präsentationsformats (z. B. Einblendung einer Grafik) oder des Inhalts (z. B. Ortswechsel) bedeutet einen Szenenwechsel (vgl. Graber 1990, S. 135–136). Aufgegriffen wurden nur Nachrichtenszenen, in denen die relevanten Akteure visuell präsent waren (48 % aller Nachrichtenszenen). Die Nachrichtenszene ist enger gefasst als der Beitrag und etwas weiter als die einzelne Einstellung; das wird einerseits der relativen Stärke von Variablen pro Beitrag gerecht und vermeidet andererseits die Überrepräsentation bestimmter Phänomene. Darüber hinaus können die unter dem Terminus „associational juxtaposition“ (Messarias und Moriarty 2005, S. 499) gefassten Aneinanderreihungen von Bildern berücksichtigt werden, z. B. Kandidat und applaudierende Menge in aufeinanderfolgenden Einstellungen.

Die Analyse setzt zusätzlich innerhalb der Szene bei Ton- und Bildsegmenten an. Die Dauer der Sound Bites und Image Bites wurde mit einer Stoppuhr in Sekunden erhoben. Bei Sound Bites wird die gesamte Dauer eines ununterbrochenen Sprechaktes gemessen. Image Bites sind im Gegensatz dazu durch einzelne Schnitte begrenzt (vgl. Bucy und Grabe 2007, S. 665). Ist ein Kandidat in einem Image Bite zu sehen, kann auch ein weiterer untersuchungsrelevanter Kandidat zeitgleich in einem Image oder Sound Bite dargestellt und somit codiert werden (vgl. Sülflow 2014, S. 310). In die Analyse der nonverbalen Darstellung gingen nur jene Sound und Image Bites ein, die mindestens drei Sekunden lang waren, da längere Segmente die Codiergenauigkeit erhöhen und relevanter für die Informationsverarbeitung beim Publikum sind (vgl. Rössler 2010, S. 84; Banning und Coleman 2009, S. 9).Footnote 6

Die Erhebung der verschiedenen Darstellungsarten der Kandidaten beruhte auf einem deduktiv-induktiven Vorgehen, das sich an Studien zur visuellen Darstellung von US-Kandidaten anlehnte (u. a. Grabe und Bucy 2009; Glassman und Kenney 1994; Moriarty und Popovich 1991), diese aber weiterführte. Es wurden neben dem Setting (z. B. Wahlkampfveranstaltung, Parlament) zum einen Variablen codiert, die eine visuelle Assoziation herstellen (z. B. Symbole, Personen), sowie Variablen, die Handlungsbezug besitzen (z. B. Dankesgesten, Interviews). Bei der explorativen Sichtung des Materials sowie nach der Lektüre relevanter Untersuchungen bot es sich ausgehend von der Personalisierungsthese an, politiknahe (z. B. Konferenzen) und politikferne (z. B. Freizeitbetätigung) Kontexte und Handlungen zu codieren (vgl. Van Aelst et al. 2012). Als „mediennahe Darstellungen“ galten Aufritte der Kandidaten in Medienformaten oder im Umkreis von Kameras und Journalisten (vgl. Glassman und Kenney 1994, S. 6).

In Hinblick auf die Tiefe der Erhebung nonverbaler Variablen ist auf die Validität der Befunde vor dem Hintergrund der Forschungsfrage zu verweisen (vgl. Fleissner 2004, S. 135). Daher wurden keine detaillierten Ausprägungen (z. B. einzelne Mimiken) erfasst, sondern lediglich, ob die Mimik/Gestik der Akteure positiv, ambivalent, negativ oder neutral einzuordnen ist. Die Operationalisierung bezog sich auf verschiedene Studien, in denen nonverbales Verhalten als generell vorteilhaft oder ungünstig eingestuft werden (z. B. Molcho 1998; Bucy und Bradley 2004). Die Kommentierung wurde operationalisiert durch wertende Aussagen über Fähigkeiten oder Persönlichkeit des visualisierten Kandidaten.

7 Ergebnisse

7.1 Visualisierung der Spitzenkandidaten

Zunächst untersuchen wir die Ausgewogenheit der medialen Aufmerksamkeit, die dann gegeben ist, wenn die konkurrierenden Kandidaten quantitativ gleich häufig visuell präsent sind. In der US-amerikanischen Berichterstattung zeigt sich, dass die Präsidentschaftskandidaten Barack Obama und John McCain sowohl in den Beiträgen als auch in den Nachrichtenszenen ausgewogen visualisiert werden (Tab. 2). Die Vizekandidaten sind deutlich seltener präsent, lediglich Sarah Palin erfährt zumindest phasenweise an der Seite von McCain mediale Aufmerksamkeit. In Deutschland offenbart sich auf diesen Analyseebenen ein Übergewicht der Kanzlerin Angela Merkel im Vergleich zu Frank-Walter Steinmeier sowie zu den Kandidaten der anderen drei Parteien.

Tab. 2 Visualisierungsgrad der Kandidaten

Bei der verbalen und visuellen Präsenz in O-Tönen liegt in den US-amerikanischen Nachrichten Obama klar vorn, andererseits ist McCain häufiger in stummen Image Bites zu sehen. In Deutschland ist für Merkel ein Vorsprung in Sound und vor allem in Image Bites erkennbar. Eine separate Auswertung zeigt, dass Steinmeier (12,6 Sek.) und Westerwelle (16,7 Sek.) durchschnittlich zwar etwas länger als die Kanzlerin zu Wort (11,4 Sek.) kommen, allerdings bekommt Merkel sehr viel häufiger die Gelegenheit, sich mit ihren kürzeren Statements zu äußern – und ist generell öfter im Bild. In Hinblick auf die quantitative Präsenz kann daher im Sinne von Hypothese 1a von einem „Amtsbonus“ in Deutschland gesprochen werden und einer ausgewogenen Visualisierung der US-amerikanischen Kandidaten (H1b). Die Befunde unterstreichen zudem die hervorgehobene Stellung der Präsidentschaftskandidaten in den USA, implizieren aber auch für Deutschland eine deutliche Zuspitzung im Sinne einer „concentrated visibility“ (Van Aelst et al. 2012, S. 207) auf die beiden Spitzenkandidaten der großen Parteien.

7.2 Sound und Image Bites: Längen und Anteile

Wir haben angenommen, dass US-amerikanische Kandidaten kürzer zu Wort kommen als deutsche Kandidaten und insgesamt länger ohne Ton im Bild zu sehen sind. Die Analyse der Sound-Bite-Längen belegen, dass Kandidaten mit durchschnittlich 10,9 Sekunden in amerikanischen Nachrichten signifikant (z = − 5.710, p < 0,001) kürzer zu Wort kommen als Kandidaten in der deutschen Berichterstattung (12,6 Sek.). Dies bestätigt die Hypothese 2a. Allerdings bestärken die Befunde auch den Trend früherer Untersuchungen (vgl. Esser 2008), die auf eine Annäherung der beiden Länder hindeuten. Es ist jedoch auf die Unterschiede zwischen den Sendern zu verweisen, da die Nachrichten von RTL signifikant kürzere Sound Bites ausstrahlen (9,7 Sek.) als die deutschen Tagesthemen (15,2 Sek.; z = − 3.720, p < 0,001) und sogar die US-amerikanischen Sender (ABC: 11,2 Sek.; NBC: 10,7 Sek.). Diese Unterschiede lassen sich weitgehend auf ausführliche Interviews in den untersuchten Sendungen von ARD, ABC und NBC mit den Spitzenkandidaten zurückführen. Eine separate Auswertung zeigt zudem, dass die US-amerikanischen Kandidaten häufiger pro Beitrag zu Wort kommen als die deutschen (3,7 zu 3,2 Sound Bites pro Beitrag). Allerdings belegen die (kürzeren) Längen, dass die US-Journalisten Statements stärker fragmentieren. Werden die Sound Bites ohne Interviews berechnet, zeigt sich sogar, dass der Wert für die US-amerikanischen Kandidaten mit 7,1 Sekunden im Vergleich zum bisherigen Tiefstwert im Wahlkampf 2004 (vgl. Bucy und Grabe 2007) noch einmal abgenommen hat. In Deutschland ist die Veränderung mit 10,5 Sekunden weniger gravierend, markiert dennoch die kürzesten O-Töne bisher durchgeführter Untersuchungen.

Tab. 3 Sound Bites und Image Bites – Längen und Anteile

Der Vergleich von Sound und Image Bites ist aufgrund der unterschiedlichen Messung (Image Bites sind durch Schnitte begrenzt) nur in Hinblick auf die Anteile sinnvoll: Transnational ist feszuhalten, dass Image Bites einen nicht zu vernachlässigenden Stellenwert in Nachrichtenbeiträgen einnehmen (Tab. 3). Die durchschnittliche Länge der Segmente pro Beitrag sowie die Gesamtvisualisierung der Kandidaten in der Wahlkampfberichterstattung verdeutlicht, dass in den US-amerikanischen Nachrichten Kandidaten etwas länger in O-Tönen zu sehen sind als in Image Bites. Die Hypothese 2b wird daher nicht bestätigt. Es werden jedoch starke (und entgegengesetzte) Divergenzen in den Beiträgen von ABC und signifikant bei RTL (z=− 2.316, p < 0,05) deutlich. Im Gesamtbild zeigt sich, dass das Verhältnis von Sound- und Image-Bite-Darstellungen in etwa ausgewogen ist und Zuschauer die Kandidaten mittlerweile fast genauso lange stumm wie mit O-Tönen in Nachrichtenbeiträgen präsentiert bekommen. Auch an dieser Stelle ist der starke Einfluss der Interviews zu berücksichtigen: Werden diese herausgerechnet, weisen alle Nachrichtensendungen, bis auf jene der ARD, eine stärkere Präsenz der Kandidaten in Image Bites als in Sound Bites auf.Footnote 7 Zudem kann im Vergleich zu früheren Erhebungen US-amerikanischer Nachrichtenbeiträge ein Anstieg der Image-Bite-Dauern um bis zu 15 Sekunden pro Beitrag konstatiert werden (vgl. Bucy und Grabe 2007).

7.3 Visuell konstituierte Kandidatentypen

Im nächsten Analyseschritt untersuchen wir, ob es Unterschiede in den visuell verkörperten Rollenbildern der Kandidaten gibt. Die Ergebnisse zeigen zunächst, dass in beiden Ländern die staatsmännische Darstellung ein elementarer Kampagnenbestandteil ist. Die Kandidaten sind vorwiegend vornehm gekleidet (USA: 69 %; Dtl.: 84 %), d. h. mit Anzug (Männer) oder Blazer (Frauen). Dennoch sind vor allem die Kandidaten in den USA – besonders Obama – in fast jeder dritten Szene in informeller Kleidung (z. B. hochgekrempelte Ärmel) zu sehen. Darüber hinaus überwiegen in den USA patriotische Motive, z. B. Auftritte vor der Landesflagge, die zum festen Bestandteil des Settings gehören. In Deutschland sind die Kandidaten vergleichsweise häufiger in Bauwerken von nationaler Bedeutung zu sehen (vor allem im Deutschen Bundestag) als die US-amerikanischen Kandidaten. Die visuelle Verknüpfung mit Gefolge ist in deutschen Berichten stärker präsent als in den US-amerikanischen, z. B. durch Parteipolitiker im Umfeld der Kandidaten. Deutsche Kandidaten sind zudem häufiger bei Treffen mit Politikern visualisiert, was auf die Ämter der deutschen Kandidaten (Kanzlerin vs. Außenminister) zurückgeführt werden kann. Somit wird die Hypothese 3a bestätigt.

Abseits der klassischen Wahlkampfsituation auf Bühnen werden die deutschen Kandidaten verstärkt auch in politiknahen Handlungsräumen dargestellt, z. B. bei Debatten im Bundestag. Weiterhin sind deutsche Kandidaten auch auf Parteitagen zu sehen, die im Gegensatz zu den US-amerikanischen „Conventions“ in der Regel durch sehr formalen Aufbau, teilweise verhaltenes Publikum und wenig Interaktion mit den Zuschauern geprägt sind. Ausnahmen bildeten lediglich die Veranstaltungen der Parteien zum Wahlkampfauftakt, bei denen das Setting stark arrangiert wirkt. Darüber hinaus dominiert in den deutschen Nachrichten die Darstellung der Kandidaten im Umkreis von anderen Politikern. Sie werden doppelt so häufig als die US-amerikanischen Politiker an der Seite von Parteikollegen (bzw. Politikern anderer Parteien) visualisiert. Auch Bilder, die Politiker im Gespräch miteinander zeigen, dominieren gegenüber Einzeldarstellungen US-amerikanischer Kandidaten (16 vs. 2 %). Politikferne Settings (z. B. Privatsituationen) lassen sich fast ausschließlich – allerdings selten – im US-Wahlkampf beobachten, so dass insgesamt die Hypothese 3b zu bestätigen ist.

US-amerikanische Kandidaten werden dagegen sehr viel stärker als Wahlkämpfer dargestellt. Dafür sprechen zum einen das Setting, denn sie sind in jeder zweiten Szene bei Wahlkampfauftritten in Hallen oder im Freien zu sehen (55 vs. Dtl.: 29 %), während deutsche Kandidaten viermal so häufig in Parteigebäuden zu sehen sind. Zum anderen sieht man die US-amerikanischen Kandidaten mehr als doppelt so oft bei einer Wahlkampfrede (37 vs. 14 %).

Im Rahmen der Wahlkampfaktivitäten wird in den USA der Kontakt des Kandidaten mit dem Volk betont: Die Kandidaten werden häufiger beim „Bad in der Menge“ gezeigt, dabei ist die Darstellung der Kandidaten auf dem Weg zur Bühne, einer Rede und dem anschließenden Händeschütteln mit dem Publikum eine standardisierte Bildfolge in der US-Berichterstattung. In Deutschland ist der Bürgerkontakt stärker an bestimmte Ereignisse wie den „Tag der offenen Tür“ im Kanzleramt geknüpft, ansonsten sieht man die Kandidaten mehrheitlich von Bühnen aus sprechen, jedoch ohne Bürgerkontakt. Die Darstellung der Kandidaten als bodenständige Volksvertreter beim Besuch „vor Ort“ und im Gespräch mit dem Normalbürger findet sich in beiden Stichproben etwa ausgewogen. In Deutschland ist Steinmeier zweimal in Arbeitskleidung in einer Fabrik zu sehen. In den USA zeigt sich Obama öfter bei Rundgängen in Wohnvierteln und gibt sich durch lockere Kleidung und Umarmungen als „common man“.

Besonders auffällig ist darüber hinaus die Darstellung der Familie im Umkreis der US- Kandidaten in jeder sechsten Szene. Die Angehörigen stehen auf der Bühne hinter dem Kandidaten und suggerieren Zustimmung, ohne ein aktive Rolle zu spielen. Bei den deutschen Kandidaten gehören Auftritte der Familie zur Ausnahme (1 %). Die populäre Stellung der Kandidaten wird in den USA besonders durch große, jubelnde Massen (Abb. 1) und das Schwenken von Plakaten visualisiert, die die Massentauglichkeit der Kandidaten verdeutlichen sollen. In Deutschland bilden Menschen mit Plakaten oft eine kleine Gruppe im Publikum und wirken eher fremdplatziert. Es überwiegt in beiden Ländern eindeutig die Zustimmung des Publikums, allerdings werden in Deutschland in wenigen Fällen auch ungünstige Publikumsdarstellungen übertragen (5 %; z. B. ein Flashmob während eines Auftrittes von Angela Merkel). In den USA sind aufgrund der starken Kontrolle des Settings höchstens „Trotz“-Reaktionen nach Angriffen des Kandidaten auf den Gegner zu sehen (z. B. Daumen-runter-Gesten), so dass insgesamt die Hypothese 3c zu bestätigen ist. Die Kandidaten selbst reagieren auf die Zustimmung aus dem Publikum durch Dankesgesten. In beiden Ländern fällt hier vor allem das „Winken“ ins Publikum auf, in den USA zusätzlich der berühmte „Fingerzeig“ in die Menge.

Abb. 1
figure 1

Populäre Darstellungsmerkmale. Basis: USA 444 Akteursauftritte, DTL.: 296 Akteursauftritte

Bei der mediennahen Darstellung werden deutsche Kandidaten häufiger im Umkreis von Kameras und Reportern dargestellt, bspw. auf dem Weg zur Bühne oder bei einer Pressekonferenz, als die US-amerikanischen Kandidaten (32 vs. 18 %). Die US-amerikanischen Kandidaten stehen dagegen bei Wahlkampfauftritten meist in bewusster Distanz zu Kameras oder Journalisten und sind bestrebt zu keinem Zeitpunkt die Kommunikationskontrolle zu verlieren. Dagegen zeigt sich in Deutschland im Sinne der Hypothese 3d eine stärkere Nähe zwischen Medienvertretern und Politikern.

7.4 Journalistische Kommentierung und nonverbale Darstellung

Die Analyse der journalistischen Kommentierung in Image-Bite-Segmenten offenbart, dass die Akteure in den US-amerikanischen Beiträgen häufiger negativ beurteilt werden (71 zu 17 %) als in den deutschen Nachrichten, in denen die Aussagentendenz in etwa ausgewogen ist (Abb. 2). Die Ausprägungen der wertenden Kommentierung verdeutlicht die Möglichkeit der Journalisten, Kandidaten in Image-Bite-Sequenzen kritisch zu beleuchten.

Abb. 2
figure 2

Tendenz journalistischer Kommentierung und Mimik/Gestik in Image Bites. Basis: Jeweils Anzahl Image Bites USA/Deutschland: Kommentierung 105/204; Mimik: 104/171; Gestik 184/152 (Image Bites ≥ 3 Sek.). Keine Darstellung der „keine Tendenz“-Ausprägung

In Hinblick auf die nonverbale Kommunikation dominieren in beiden Ländern eindeutig positive Darstellungen. Dies lässt sich darauf zurückführen, dass Kandidaten in der Öffentlichkeit, z. B. bei Wahlkampfauftritten, besonders auf ihr kameragerechtes Auftreten und ihre Ausstrahlung achten. Zwar haben sie keinen Einfluss auf die Auswahl der Bilder durch die Redaktionen, aber sie schauen nur selten enttäuscht oder verschränken ihre Arme und bieten so wenig Angriffsfläche. Im Ländervergleich ist lediglich bei den Gesten ein leichtes Übergewicht der positiv konnotierten Darstellungen in den US-amerikanischen Beiträgen zu diagnostizieren. Hier sind vor allem Interaktionen mit dem Zuschauer, also Victory-Zeichen, erhobene Daumen oder motivierende Faust-Gesten zu beobachten. In Deutschland ergeben sich positive Gebärden überwiegend in Redesituationen, z. B. als unterstützende Handbewegungen oder durch vorgelehnten Oberkörper. Demgegenüber dominieren in beiden Ländern Darstellungen, die sich keiner Tendenz zuordnen lassen, bspw. die ruhende Handhaltung von Angela Merkel oder die gelassene Körperhaltung von Barack Obama.

Zur Analyse des Text-Bild-Verhältnisses wurden in die Analyse nur Image Bites einbezogen, in denen Mimik und Gestik in der Tendenz die gleiche Richtung aufweisen. Zunächst lässt sich feststellen, dass die Zuschauer der deutschen Beiträge häufiger Kandidaten in übereinstimmender Mimik und Gestik in Sequenzen mit wertender Kommentierung sehen als die Betrachter US-amerikanischer Beiträge. Obschon sich auch US-amerikanische Kandidaten oftmals zeitgleich mit heiterer Mimik und kämpferischer Gestik zeigen, schlagen sich diese Sequenzen in der vorliegenden Auswertung in Verbindung mit einer wertenden Kommentierung nicht so stark nieder. In Hinblick auf das Verhältnis zur Kommentierung kann festgehalten werden, dass in Deutschland eine stärkere Übereinstimmung der Richtung von Urteil und nonverbaler Darstellung vorliegt (Tab. 4a und b). Dabei wird die positive Kommentierung meist mit positiven nonverbalen Darstellungen der Kandidaten unterlegt. Journalisten wählen somit besonders häufig eine vorteilhafte Darstellung des Kandidaten, wenn sie positive Kritik äußern. Negative Kommentierungen rufen in beiden Ländern sowohl vorteilhafte wie unvorteilhafte Visualisierungen hervor und sprechen für eine Text-Bild-Schere. Für einen strategischen Einsatz (Forschungsfrage 1) spricht zum einen die Konsistenz von positiven nonverbalen und verbalen Informationen in deutschen Berichten und zum anderen, dass in den wenigen Image Bites mit unvorteilhafter Gestik/Mimik in beiden Ländern die Kommentierung fast ausschließlich eine negative Tendenz aufweist.

Tab. 4 a und b Verhältnis wertende Kommentierung und nonverbale Kandidatendarstellung USA und Deutschland (Häufigkeiten)

7.5 Zusammenfassung und Diskussion der Befunde

Bucy und Grabe (2007, S. 668) konstatieren: „Images are the lingua franca of politics; yet, they remain among the least scrutinized and least understood aspects of political news.“ Das Forschungsdesiderat im Bereich der visuellen Kommunikation bildete den Ausgangspunkt unserer Analyse deutscher und US-amerikanischer Fernsehnachrichten. Unser Forschungsinteresse galt dem Verhältnis rein visueller und verbaler Kandidatendarstellungen, den inhaltlichen Bildmerkmalen der Kandidatenauftritte sowie den visuell-nonverbalen Verhaltensweisen der Akteure und deren Verhältnis zur journalistischen Kommentierung. Unsere Erkenntnisse lassen sich wie folgt zusammenfassen:

Die Relevanz der visuellen Bildelemente wurde durch den hohen Stellenwert von Image Bites in Nachrichtenbeiträgen belegt. Demnach vernachlässigen Studien zu verbalen Äußerungen in Fernsehnachrichten einen substanziellen Anteil der Infor-mationen. Zudem gehen die Sound-Bite-Längen weiter zurück. Vor allem in den USA fragmentieren die Macher der Fernsehnachrichten O-Töne von Politikern (Medieninterventionismus). Das ist so deutlich in Deutschland noch nicht zu erkennen, allerdings weisen die Entwicklung der letzten Jahre und die Befunde zum Nachrichtenformat von RTL auf eine Annäherung hin. Der steigende Einsatz von rein visuellen Segmenten mag dazu führen, dass Zuschauer sich vermehrt Meinungen anhand nonverbaler Eindrücke bilden und Journalisten neben der Gewichtung von Ton- und Bildsegmenten und kritischer Kommentierung auch Einfluss auf die optische Darstellung haben.

Anzeichen für größere Autonomie unter den Journalisten von ABC und NBC können auch als Reaktion darauf gedeutet werden, dass sich die US-amerikanischen Kampagnenplaner besser auf die Bedeutung der visuellen Informationsvermittlung eingestellt haben und aktives Ereignismanagement betreiben: Die Nachrichtenbilder sind geprägt von Wahlkampfveranstaltungen, die strategisch geplant und inszeniert werden. Dies könnte vor dem Hintergrund der steigenden Anzahl von Image Bites zukünftig an Relevanz gewinnen.

Die Bilder von amerikanischen Wahlkämpfen übermitteln starke Zustimmung durch das Publikum, und Kandidaten setzten sich in Szene durch die visualisierte Interaktion mit Normalbürgern und Auftritten mit der Familie. Das Bad in der Menge gehört zu den Schlüsselbildern US-amerikanischer Berichterstattung. Diese Bilder transportieren Eigenschaften, die von Kandidaten im Wahlkampf erwartet werden, und konstituierten patriotische, populäre und volksnahe Kandidatentypen. In Deutschland ist diese Art der fernsehvermittelten Wahlkampfführung bisher nur schlaglichtartig zu beobachten. Bilder von Wahlkampfveranstaltungen werden journalistischen Kommentaren unterlegt und bilden nicht den Hauptbezugspunkt der Berichte. Zudem sind die Settings weniger stark inszeniert, wodurch auch verhaltene und negative Publikumsreaktionen ins Bild geraten. Deutsche Kandidaten werden zwar auch im Umfeld von Zustimmung und in volksnahen Situationen gezeigt, allerdings gehören diese Situationen nicht zum festen (Fernsehbild-)Inventar. Die Kandidaten tauchen häufig in politiknahen Handlungsräumen auf und erfüllen damit als sachliche und staatsmännische Kandidatentypen erwünschte Ansprüche, allerdings lassen diese Darstellungen nicht auf strategische Wahlkampfinszenierungen schließen.

Dagegen sind Kandidaten in beiden Ländern überwiegend mit positivem nonverbalem Verhalten zu sehen, da zuversichtliche Ausstrahlung eine Grundanforderung an die Kampagnenführung darstellt und einen strategischen Einsatz von negativen Bildsegmenten nur im geringen Maße zulässt.

Nicht zuletzt ist in deutschen Beiträgen eine stärkere Nähe von Medienvertretern und Politikern im Bild zu beobachten, während die Kandidaten wiederum selten Kontakt zu Bürgern suchen. Der Einfluss des Wahlsystems wird zudem darin deutlich, dass US-amerikanische Politiker als Einzelakteure auf Bühnen zu sehen sind, die in erster Linie für ihre eigene Person kämpfen, während deutsche Politiker im Umkreis von anderen Politikern gezeigt werden, mit denen sie für den Erfolg der Partei werben. Dennoch findet auch in den deutschen Nachrichten eine visuelle Zuspitzung auf die Vertreter der Volksparteien statt, und es besteht noch immer ein Sichtbarkeitsbonus für die Amtsinhaberin.

Zusammenfassend lässt sich feststellen, dass sich im Ländervergleich die visuellen Bildstrategien durchaus unterscheiden. Demnach werden die länder- und kulturspezifischen Wahlkampftraditionen durch die „modernen“ Kampagnentechniken ergänzt, die innerhalb kontextueller Rahmenbedingungen praktikabel sind (vgl. Plasser und Plasser 2002, S. 348), z. B. die Herausstellung der Einzelperson. Zudem wird für die USA eine höhere Professionalisierung des Ereignis- und Imagemanagements diagnostiziert, was sich in der Inszenierung der Wahlkampftypen verdeutlicht. Eine Annäherung der Nachrichtenlogik diesseits und jenseits des Atlantiks lässt sich insgesamt primär bei der Relevanz von Image Bites feststellen, sowohl quantitativ als auch mit Blick auf die inhaltlichen Konsequenzen für die (visuelle) politische Kommunikationsvermittlung. Mit Blick auf die senderspezifischen Unterschiede scheint der Kommerzialisierungsgrad neben dem Mediatisierungsgrad eine entscheidende Einflussvariable für die Darstellung der politischen Akteure zu sein.

Abschließend ist auf die Aussagefähigkeit der Befunde zu verweisen, da lediglich zwei Länder und zwei Wahlkämpfe untersucht wurden. Somit können wir nicht ausschließen, dass die Befunde von spezifischen Kandidatenkonstellationen beeinflusst sind. Die tieferliegenden Muster beim Einsatz von Image Bites, Rollenbildern und visueller Kommentierung scheinen jedoch – zumal im Kontext der bereits vorliegenden Forschung (z. B. Esser 2008; Grabe und Bucy 2009) – auf grundlegende Trends zu verweisen, die über die hier studierten Wahlkämpfe hinaus wissenschaftliche Aufmerksamkeit verdienen.

Es sei betont, dass die verschiedenen Darstellungsmodi inhaltsanalytisch erhoben wurden und damit keine Aussagen über die Wirkung auf das Publikum erlauben. Die visuelle Verknüpfung von Personen und Kontexten sollten zukünftig durch Rezepti­onsstudien untermauert werden. Eye-Tracking-Verfahren bieten sich beispielsweise an, um die Wahrnehmung von Bildinhalten, z. B. nonverbale Verhaltensweisen oder Merkmale des Settings, zu messen. Darüber hinaus ist darauf zu verweisen, dass gerade die Analyse von Bewegtbildmaterial eine Herausforderung für die Codierung verschiedener, komplexer Bildinhalte darstellt. So wurden beispielsweise für die Erhebung von Mimik und Gestik sehr detaillierte Analysemodelle entwickelt (z. B. das Facial Action Coding System; vgl. Ekman und Friesen 1978), die sich allerdings vor dem Hintergrund unserer Forschungsfrage und der Vielzahl an Bewegtbildsequenzen hier nicht anboten.

Unsere Befunde beruhen auf der Analyse von Sendungen, und damit dem Endprodukt der journalistischen Selektionsprozesse. Lohnenswert wäre eine vergleichende Analyse der Wahlkampfaktivitäten von Akteuren bzw. des Rohmaterials der Sender und der fertigen Fernsehbeiträge. So könnten einerseits Aussagen darüber getroffen werden, inwiefern Kampagnenteams strategisch Bilder schaffen, um sich an die Selektionskriterien der Medienmacher anzupassen, und andererseits, inwiefern Journalisten Arbeits- und Auswahlprozesse internalisieren und damit z. B. bestimmte „Schlüsselbilder“ (Ludes 2001) in Wahlkampfzeiten besonders häufig transportieren.

Unser Beitrag belegt, dass sich das hier angewendete Untersuchungsinstrument eignet, verschiedene visuelle Darstellungsarten zu erheben. Gleichzeitig verstehen wir ihn aber auch als Forschungsanregung. Bei komparativen Fragestellungen könnten zukünftig zum Beispiel weitere Länder hinzugezogen werden, die sich in anderen Kontextfaktoren unterscheiden, um Studien nach dem „most-different-system-design“ durchzuführen. Nicht zuletzt sollten Langzeitstudien die Veränderungen der visuellen Wahlkampfkommunikation aufgreifen, denn es ist zu erwarten, dass visuelle Vermittlungs- und Präsentationsstrategien auch in Zukunft unter den Rahmenbedingungen moderner Wahlkampfführung eine wichtige Rolle einnehmen werden.