Mittlerweile gehören telefonische Befragungen international zum Standard der Gesundheitsforschung [1]. Auch in Deutschland liegen inzwischen zumeist regional oder thematisch begrenzte Erfahrungen mit telefonischen Befragungen vor [2, 3, 4].

Zu den Vorteilen telefonischer Befragungen zählt u. a., dass sie es ermöglichen, aktuelle bevölkerungsrepräsentative Daten über Veränderungen in gesundheitsrelevanten Bereichen zeitnäher und mit geringerem Kostenaufwand zu gewinnen als mit anderen Erhebungsverfahren. Mit dem Gabler-Häder-Design steht für die Bundesrepublik Deutschland ein nationaler Auswahlrahmen zur Verfügung, der auch regionalisierte Analysen erlaubt [5]. Telefonische Befragungen sind darüber hinaus in der Felddurchführung effizienter, weil nur selten zu Hause anzutreffende Bevölkerungsgruppen mit geringerem Aufwand mehrfach kontaktiert werden können. Die Unterbringung der Interviewer in einem zentralen Telefonstudio ermöglicht zudem eine wirksamere Kontrolle der Interviewdurchführung und verbessert damit die Datenqualität, vor allem gegenüber schriftlichen oder Face-to-face-Erhebungsformen.

Den genannten Vorteilen telefonischer Befragungen stehen aber auch Nachteile gegenüber. So eignen sich nicht alle Inhalte oder Operationalisierungen aus schriftlichen Befragungen gleichermaßen für den Einsatz im Telefoninterview, denn Letzteres basiert ausschließlich auf einem akustischen Kontakt zwischen Interviewer und Proband. Dies stellt hohe Anforderungen an die Entwicklung des Fragebogens mit einer häufig notwendigen Anpassung etablierter Instrumente an diese Erhebungsform. Darüber hinaus stellen Telefonbefragungen besondere Ansprüche an das Erhebungspersonal, da neben den inhaltlichen Gesichtspunkten auch die Auswahl und Ermittlung der Zielpersonen sowie die stichprobengerechte Dokumentation der Anwahlergebnisse in der Eröffnungsphase des Interviews souverän beherrscht werden müssen und ein hohes Abstraktionsvermögen verlangt wird, um die Perzeption der Befragtensituation adäquat berücksichtigen zu können. Entsprechend sind u. a. eine intensive Schulung der Erhebungskräfte und die kontinuierliche Überprüfung während des Erhebungsprozesses erforderlich. Weiterhin können spezifische Bevölkerungsgruppen (z. B. Migranten, soziale Randgruppen, junge hochmobile Erwachsene oder Personen, die nur noch über Handys verfügen) über das Telefon im Festnetz nur unzureichend erreicht werden.

Diese Aspekte sind bei der Konzeption, Durchführung und Interpretation der Ergebnisse telefonischer Befragungen zu berücksichtigen. Welche Vorkehrungen und Maßnahmen getroffen wurden, um den ersten bundesweiten telefonischen Gesundheitssurvey des Robert Koch-Instituts (RKI) gemäß den gewohnten Qualitätsansprüchen umzusetzen, wird im Folgenden in den wesentlichen Grundzügen dargestellt.

Methodische Aspekte der Fragebogenentwicklung

Die Qualität des Erhebungsinstrumentes ist für das Gelingen nicht nur von Telefonsurveys von entscheidender Bedeutung. Die Auswahl der in den GSTel03 einbezogenen Themen und Dimensionen war inhaltlich und strategisch begründet, wie bei Ziese [6] und Ziese et al. [7] dargestellt. Daneben bedurfte die Entwicklung des Fragebogens der Berücksichtigung verschiedener Aspekte, die mit dem Erhebungsmodus zusammenhängen. Denn Telefoninterviews stellen teilweise andere Anforderungen an das Erhebungsinstrument als postalische Befragungen oder Face-to-face-Interviews. Diese betreffen den Aufbau und die Struktur des Fragebogens (sog. Dramaturgie) sowie die einzelnen Fragen und deren Antwortkategorien. Zum Beispiel lassen sich einige Operationalisierungen nicht ohne Anpassung bzw. Modifikation aus einer Erhebungsmethode in eine andere übertragen. Die hohe Relevanz der methodischen Aspekte der Instrumentenentwicklung für die Datenqualität, Item-Nonresponse und Ausschöpfung verlangte ihre adäquate Berücksichtigung bei der Entwicklung des CATI- (Computer Aided Telefone Interviewing-)Fragebogens [8, 9, 10, 11, 12, 13].

Entsprechend wurde für den GSTel03 eine Reihe spezieller Maßnahmen, angefangen bei der Fragebogendramaturgie bis hin zu Administrationsanweisungen, umgesetzt. Hierzu ein Beispiel: Um vergleichsweise komplexe Frageformulierungen aus schriftlichen Fragebögen früherer Studien, insbesondere aus dem Bundes-Gesundheitssurvey 1998, fortschreiben zu können, wurden sie für den GSTel03 in einfachere Fragen zerlegt. Lange Antwortlisten aus schriftlichen Bögen wurden aufgespalten. Eine ausführliche Darstellung der bei der Fragebogenentwicklung berücksichtigten methodischen Aspekte findet sich bei Rieck et al. [13]. Zu den programmierten Plausibilitätskontrollen vgl. Borch/Rieck [14].

Feldarbeit

Neben einem gelungenen Erhebungsinstrument entscheidet die Qualität der Feldarbeit über den Erfolg einer Studie. Sie setzt eine adäquate Schulung der Mitarbeiter und eine kontinuierliche Qualitätssicherung voraus.

Im Anschluss an 2 ausführliche Pretests begann am 2. September 2002 die Feldzeit des GSTel03, die am 14. März 2003 endete. An 112 Tagen wurden von insgesamt 81 InterviewernFootnote 1 mit 45.000 Telefonnummern des Basissamples über 165.000 Anwahlvorgänge durchgeführt. Insgesamt wurden dabei 8362 Frauen und Männer befragt, 8318 Interviews waren verwertbar.

Die durchschnittliche Länge der Interviews im GSTel03 betrug zirka 21 Minuten. Die Dauer variierte jedoch für einzelne Befragtengruppen erheblich: Sie lag zwischen ca. 18 Minuten (18- bis 20-Jährige) bis 30 Minuten (über 80-Jährige) und je nach Geschlecht zwischen ca. 20 Minuten (Männer) und 22 Minuten (Frauen). Bei Vorliegen spezifischer Erkrankungen stieg die durchschnittliche Interviewdauer erheblich, da in diesem Fall filterbedingt mehr Fragen zu beantworten waren [13].

Die Datenerhebung erfolgte im neu geschaffenen CATI-Labor des RKI, das 19 Interviewerarbeitsplätze und einen Supervisorenarbeitsplatz umfasst. Die Anrufe wurden wochentags zwischen 16 und 20 Uhr durchgeführt. Zusätzlich fanden einige Vormittags- und Samstagseinsätze statt, um die Responserate für die in den oben genannten Zeiten schlecht erreichbaren Personen zu erhöhen.

Die Telefoninterviews wurden mittels der CATI-Software Interviewer Suite 4.3 durchgeführt. Die Grundlage bildete ein programmierter Fragebogen, der vergleichbar mit computergestützten Interviews sowohl eine Datenkontrolle während der Befragung als auch die Ablaufsteuerung mittels programmierter Filter übernimmt. Die CATI-Software steuert und verwaltet auch die An- und Rückrufe, d. h. so genannte call backs. Dies sind Anrufe mit einem noch offenen abschließenden Kontakt mit einer Zielperson im Haushalt, die entsprechend programmierter Regeln automatisch durch das Programm angewählt wurden (auto dialing). Anwahlfehler sind damit nahezu ausgeschlossen, was eine saubere Stichprobenrealisierung gewährleistet [13, 14, 15].

Für die Betreuung und Qualitätssicherung der Datenerhebung waren an jedem Feldtag 2 Supervisoren und ein Mitglied der wissenschaftlichen Feldleitung zuständig. Die Aufgaben der studentischen Supervisoren bestanden vor allem in der Anleitung der Interviewer während der Datenerhebung, in der Qualitätssicherung der Interviewführung sowie in der Planung des Interviewereinsatzes. Die wissenschaftliche Feldleitung war insbesondere verantwortlich für die Optimierung des Erhebungsinstrumentes, die Stichprobenkonzeption, die Schulung der Interviewer und Supervisoren sowie für die Qualitätssicherung und Koordination der Feldarbeit [14].

Mitarbeiterschulung und Qualitätssicherung

Das Verhalten der Interviewer und Supervisoren beeinflusst die Datenqualität, die Ausschöpfung und die Item-Nonresponse [10, 17]. Daher wurden beide Personengruppen intensiv auf ihre Aufgaben vorbereitet [14]. In 3-tägigen Eingangsschulungen mit einem Umfang von 15 Stunden, in denen sich Theorie- und Praxisblöcke abwechselten, wurden die Interviewer bezüglich des technischen Umgangs mit der CATI-Software, der Einhaltung des Datenschutzes, des Verhaltens in der Kontaktphase und im weiteren Verlauf des Interviews sowie der inhaltlichen Handhabung des Erhebungsinstrumentes unterwiesen. Die studentischen Supervisoren wurden frühzeitig, bereits während der Planungsphase in das Projekt einbezogen, da die Mitarbeit bei den Feldvorbereitungen auch eine implizite Schulungsfunktion erfüllt. Die konkreten Tätigkeiten im Kontext der Supervision wurden während des Pretestes und bei der Vorbereitung des Hauptfeldes als „training on the job“ erlernt [14].

Um die Qualität über die gesamte Dauer der Feldzeit sichern zu können, bedarf es neben der Vermittlung entsprechender Standards in den Eingangsschulungen einer kontinuierlichen Qualitätssicherung. Grundlage dafür war das Operationshandbuch [16]. Es stellt die Anleitung zum standardisierten Vorgehen bei der Studiendurchführung dar und dient als Schulungsmaterial und Nachschlagewerk. Für die Qualitätssicherung war auch die kontinuierliche Dokumentation durch die Supervisoren, z. B. in einem Logbuch, wichtig. Außerdem verlangt die Optimierung der Feldarbeit die kontinuierliche und systematische Reflexion des Vorgehens. In diesem Kontext hat sich auch der Austausch zwischen Supervisoren und Feldleitung in wöchentlichen Teamsitzungen bewährt. Eine ausführliche Beschreibung der qualitätssichernden Maßnahmen für den GSTel03 findet sich bei Borch/Rieck [14].

Stichprobendesign und Anrufmanagement

Die Stichprobenkonzeption des GSTel03 soll repräsentative Aussagen über die volljährige, deutschsprachige Wohnbevölkerung in Privathaushalten der Bundesrepublik Deutschland ermöglichen. Vom Zentrum für Umfragen, Methoden und Analysen (ZUMA) in Mannheim wurde für diesen Zweck das Gabler-Häder-Design [5] entwickelt, das einen nationalen Auswahlrahmen für Telefonbefragung zur Verfügung stellt. Es liefert auch die Basis für das ADM-Mastersample (ADM: Arbeitskreis Deutscher Marktforschungsinstitute) und bildet damit die Grundlage fast aller bundesweit repräsentativen Telefonbefragungen.

Das Gabler-Häder-Verfahren beruht darauf, aus dem Pool öffentlich zugänglicher Nummernverzeichnisse eine Bestandsliste sämtlicher in der BRD vorhandenen Festnetzanschlüsse zu erstellen. Aus diesem um Sondernummern und offensichtliche gewerbliche Anschlüsse bereinigten Nummernpool werden die letzten beiden Ziffern abgeschnitten, wodurch so genannte Nummernblöcke entstehen. Diese werden abschließend wieder durch die Ziffernfolgen „00“ bis „99“ ergänzt und bilden den Auswahlrahmen für bevölkerungsrepräsentative Telefonstichproben in der Bundesrepublik Deutschland. Aus dieser hypothetischen GrundgesamtheitFootnote 2 wird dann uneingeschränkt zufällig die erforderliche Anzahl von Anwahlnummern gezogen. Die Repräsentativität auf Personenebene wird durch eine zweite Auswahlstufe erreicht, in der die Zielperson in Mehrpersonenhaushalten nach einem Zufallsverfahren ermittelt wird.

Das für den GSTel03 gewählte stichprobentheoretische Konzept bestimmt auch maßgeblich das Vorgehen während der Feldarbeit. Als Ergebnis der Stichprobenziehung liegen im GSTel03 45.000 zu kontaktierende Rufnummern vor, von denen zunächst nicht bekannt ist, ob sie tatsächlich existieren bzw. welche davon Anschlüsse von Privathaushalten sind. Nach Klärung des Letzteren wurde mit der zufällig angetroffenen Person die Zielperson im Haushalt gemäß der Next-Birthday-Methode ermittelt und ggf. ein Interview durchgeführt. Selbstverständlich gelingt dies nur selten beim ersten Anwahlversuch. In der Regel sind mehrmalige Kontaktversuche erforderlich.

Die Verwaltung der Rufnummern mit dem jeweils von den Interviewern zu protokollierenden Anwahlergebnis in den so genannten disposition codes übernimmt das Anruf- und Rückrufmanagement, das den jeweiligen Anforderungen entsprechend konzipiert und programmiert werden muss. Dies geschieht in einem eigenen Modul der CATI-Software. Hier werden jedem Ergebniscode Regeln zugeordnet, die festlegen, wann die jeweilige Rufnummer zur Wiedervorlage kommt. Diese Call-back-Regeln bestimmen u. a., zu welchem Zeitpunkt (nach 10 Minuten, einem Tag, mehreren Tagen etc.) eine mit einem Call-back-Status versehene Telefonnummer wieder in den Pool anzurufender Datensätze eingespielt wird.

Anders als in den USA liegen im deutschsprachigen Raum bisher keine einheitlichen Standards für die Entwicklung des Rückrufmanagements und der anzuwendenden disposition codes vor [19, 20]. Sie mussten daher eigens für den GSTel03 entwickelt werden. Die Dokumentation der Anwahlvorgänge in der call history dient v. a. der Ermittlung der Ausschöpfungsquote, erfüllt aber noch andere Zwecke im Rahmen der feldbegleitenden Qualitätssicherung. So lässt sich z. B. aus ungewöhnlichen Häufungen bestimmter Anwahlergebnisse ein Nachschulungsbedarf für einzelne Interviewer erkennen.

Ausschöpfung und Response

Gegenüber registerbasierten Auswahlverfahren ermöglichen zufallsgenerierte Nummernsamples keine Bestimmung einer Rücklaufquote im herkömmlichen Sinn, da sich die Stichprobenbasis — Personen in Privathaushalten — erst im Vollzug der Feldarbeit realisiert. In der Literatur über Telefonsurveys wird daher statt vom Rücklauf auch von Kooperationsraten oder Ausschöpfungsquoten gesprochen.

Bei der Aufbereitung und Verdichtung der Anwahlergebnisse in der call history zur Bestimmung der Ausschöpfungsquote ist die Unterscheidung zwischen verlaufs- und ergebnisbezogener Betrachtung wichtig. So spiegelt der Endzustand der disposition codes in der call history möglicherweise nicht den tatsächlichen Zustand bei der Zuordnung der generierten Anwahlnummern nach dem Kriterium „Element der Grundgesamtheit“ wider. Das ist z. B. der Fall, wenn bei einem Anruf ein Termin mit der Zielperson vereinbart werden konnte, dieser aber nicht eingehalten wurde und in der Folge unter der Telefonnummer nur noch ein Fax angetroffen wird. Bei ausschließlicher Berücksichtigung des Endzustandes würde in diesem Fall eine falsche Zuordnung zu den stichprobenneutralen Ausfällen vorgenommen. Daher sind vor der Ermittlung der Ausschöpfungsquote die letzten Anwahlergebnisse unter Berücksichtigung des gesamten Feldverlaufs in einen Endzustand zu überführen [21]. In Übereinstimmung mit den Regeln der American Association for Public Opinion Research (AAPOR) wurden im GSTel03 die Ergebnisse der call history nach folgenden Gesichtspunkten verdichtet, wenn kein Abbruch vorlag oder kein Interview realisiert wurde:

  • Endresultate durch das letzte Anrufergebnis mit einer Zielperson im Haushalt ersetzen, sonst

  • letztes Ergebnis ersetzen durch letzten Kontakt mit einer beliebigen Kontaktperson eines Privathaushalts.

Als Ergebnis liegen nun bereinigte call results vor, die eine exaktere Bestimmung der Ausschöpfungs- und Responsequoten ermöglichen.

Werden die 9426 durchgeführten Interviews auf die 15.918 Zielpersonenkontakte bezogen, ergibt sich mit etwas über 59% eine bei vergleichbaren Telefonbefragungen im deutschsprachigen Raum übliche Kooperationsrate (Tabelle 1). Die Ausschöpfungsquote liegt mit knapp 53% ebenfalls im üblichen Bereich. Der Gesundheitsmonitor München [2] berichtet eine Ausschöpfungsquote von 52%, das Münchener Lebensstilpanel [3] kommt — bei einem aufwändigeren Rekrutierungsverfahren mit vorherigem Anschreiben der Probanden — auf eine Quote von 67,2%, und das Landesinstitut für den Öffentlichen Gesundheitsdienst NRW berichtet über Ausschöpfungsquoten zwischen 50 und 60% [4].

Tabelle 1 Ausschöpfung des Nummernsamples im GSTel03 — Endzustand der call results

Datenaufbereitung und Gewichtung

Die Rohdaten des GSTel03 wurden nach Abschluss der Feldarbeit einer umfangreichen Plausibilitätsprüfung unterzogen und nach Bereinigung an die Verteilung der Grundgesamtheit der erwachsenen Bevölkerung in Privathaushalten angeglichen. Vor dieser Anpassungsgewichtung muss jedoch zunächst eine Kompensation der designbedingten Verzerrungen vorgenommen werden.

Aus der Anlage des Stichprobendesigns des Gabler-Häder-Verfahrens als implizite Haushaltsstichprobe, das in der ersten Auswahlstufe zufallsgesteuert einen Haushalt auswählt und in der zweiten Stufe innerhalb dieses Haushaltes die jeweilige Befragungsperson nach der Next-birthday-Methode ermittelt, ergibt sich ein Anpassungsbedarf an die daraus folgende unterschiedliche Auswahlwahrscheinlichkeit der Zielperson in Mehrpersonenhaushalten.

In Verbindung mit der Zunahme der ISDN-Anschlüsse haben Haushalte mit mehreren Privatnummern eine höhere Wahrscheinlichkeit, befragt zu werden. Diese erhöhte Auswahlwahrscheinlichkeit war daher durch den Kehrwert der „Anzahl der privat genutzten Festnetzanschlüsse im Haushalt“ zu kompensieren. Das Designgewicht ergibt sich damit als Kehrwert der unterschiedlichen Auswahlwahrscheinlichkeiten oder als Quotient aus der Anzahl der erwachsenen Haushaltsmitglieder und der Anzahl der privat genutzten Festnetzanschlüsse im Haushalt.

Auf Basis der Designgewichtung wurde in der zweiten Gewichtungsstufe eine Anpassung an die Ergebnisse der amtlichen Statistik mit Stand vom 31.12.2001 vorgenommen. Die Grundlage dafür bilden tief gestaffelte Tabellen der Alters- und Geschlechtsverteilung pro Bundesland. Sie wurden vom Statistischen Bundesamt zur Verfügung gestellt und ermöglichen die Aufbereitung der Referenzdaten in einer den Anforderungen des Datensatzes entsprechenden Weise. Das Redressmentgewicht konnte daher als einfache Soll-durch-Ist-Gewichtung der 72 aus Altersgruppen, Geschlecht und Region gebildeten Gewichtungszellen vorgenommen werden. Eine ausführlichere Darstellung zur Gewichtung findet sich bei Kohler 2005 [15].

Non-Response und Samplenutzung

Merkmale von Non-Respondern

Die Ausschöpfungsquote sagt, unabhängig von ihrer Höhe, noch nichts über das Ausmaß möglicher Selektivität aus [22]. Daher stellt sich die Frage: Was wissen wir über die Non-Responder und welche Quellen zur Beantwortung stehen zur Verfügung? Erste Hinweise auf systematische Selektionseffekte ergeben sich aus der Dokumentation der Anwahlergebnisse, die sich in den disposition codes (Tabelle 1) wieder finden. So konnte mit 252 kontaktierten Zielpersonen wegen sprachlicher Probleme kein Interview durchgeführt werden. Weitere 361 Zielpersonen sahen sich aus gesundheitlichen Gründen nicht in der Lage, an der Befragung teilzunehmen. Über diese Personen liegen keine weiteren Angaben vor.

Die wichtigste Quelle für die Gründe der Nichtteilnahme bildet jedoch der im programmierten Fragebogen enthaltene Kurzfragebogen. Bei jeder Kontaktaufnahme mit einer Zielperson, die kein Interview durchführen wollte, und bei jedem Abbruch während eines Interviews wurde automatisch vor Beendigung des Gesprächs um dessen Beantwortung gebeten. Neben den Gründen, die zum Abbruch oder zur Nichtteilnahme führten, werden im Kurzfragebogen noch zentrale soziodemographische Merkmale sowie einige gesundheitsbezogene Daten erhoben.

Insgesamt gaben 1166 Probanden im Kurzfragebogen Auskunft über ihre Gründe zur Nichtteilnahme. Wie zu erwarten, stehen dabei zeitliche Gründe an erster Stelle. Mit deutlichem Abstand folgt die grundsätzliche Ablehnung von Befragungen. Erfreulicherweise liegen gesundheitliche Probleme an letzter Stelle, sodass ein gesundheitlicher Bias in der realisierten Stichprobe des GSTel03 zunächst eher ausgeschlossen scheint. Non-Responder — also Personen, die den Hauptfragebogen nicht beantwortet haben — unterscheiden sich durch höheres Alter und einen leicht erhöhten Frauenanteil von den Befragungsteilnehmern. Erwartungsgemäß liegt auch der Ausländeranteil bei den Non-Respondern etwas höher, wofür v. a. sprachliche Probleme ausschlaggebend sein dürften. Demgegenüber waren weniger Gesunde und durch mindestens eine chronische Erkrankung betroffene Personen eher bereit, an der Befragung teilzunehmen (Details vgl. Kohler [15]).

Einschränkend ist an dieser Stelle noch anzumerken, dass die hier skizzierten Ergebnisse nur erste Hinweise auf eine gruppenspezifische Non-Response geben können, da über den größeren Teil der nicht Teilnahmewilligen keine zusätzlichen Informationen vorliegen.

Intensität der Samplenutzung

Selektivität bei (telefonischen) Befragungen kann auch aus der systematisch besseren Erreichbarkeit bestimmter Bevölkerungsgruppen resultieren. In diesem Zusammenhang sind insbesondere die Intensität der Sampleausschöpfung und die Kontakthäufigkeit einer Telefonnummer von Bedeutung. Letztere wurde im GSTel03 aus Qualitätsgründen auf maximal 15 Kontakte festgesetzt. Diese Zahl geht damit deutlich über das übliche Maß hinaus [5, 23].

Die intensivere Sampleausnutzung im GSTel03 verändert die soziodemografische Zusammensetzung der Befragten in Richtung jüngerer, männlicher Teilnehmer und führt zu einer leichten Zunahme des Anteils der Migranten. Die Anzahl an mittleren und höheren Bildungsgraden steigt ebenfalls mit der Zahl der Kontaktversuche und führt in der Folge zu einer Zunahme des Anteils der höheren Sozialschicht und der privat Versicherten. Darüber hinaus ist ein Anstieg der Zahl der Vollzeiterwerbstätigen mit zunehmender Kontakthäufigkeit festzustellen. Offensichtlich handelt es sich also bei den schwerer Erreichbaren um Jüngere, höher Gebildete und überwiegend Vollzeit erwerbstätige Personen, denen eine durchschnittlich bessere Gesundheit unterstellt werden kann. Dies bestätigt sich bei der Betrachtung gesundheitsbezogener Merkmale dieser Teilgruppe, die einen höheren Anteil normalgewichtiger und gesünderer Probanden mit weniger gesundheitlichen Einschränkungen oder chronischen Erkrankungen aufweist.

Zusammenfassende Betrachtung zu Non-Response und Samplenutzung

Die Ergebnisse der Non-Responderanalyse lassen tendenziell eine größere Teilnahmebereitschaft der durch Krankheit betroffenen Bevölkerung am GSTel03 erkennen. Die intensive Feldarbeit mit einer über das übliche Maß hinausgehenden Sampleausnutzung kompensiert diesen Effekt jedoch zum Teil. Diese Ergebnisse decken sich mit Resultaten von Voigt et al. [24]. Demnach resultieren aus intensiveren Anstrengungen bei der Kontaktanbahnung deutlich bessere Schätzer der bevölkerungsbezogenen Merkmale, die in epidemiologischen Studien von Interesse sind.

Andererseits ergeben sich hinsichtlich der demografischen Zusammensetzung überlagernde Effekte aus der geringeren Teilnahmebereitschaft von Personen mit niedriger Schulbildung und deren Kompensation durch höher Gebildete der Mittel- und Oberschicht aufgrund einer intensiveren Sampleausschöpfung. Dies trägt auch zur Erklärung der bereits anderenorts festgestellten höheren Beteiligungsbereitschaft der mittleren und oberen Sozialschichten an telefonischen Befragungen bei [12, 25].

Fazit

Die eingangs genannten Vorteile telefonischer Studien kommen nur zum Tragen, wenn alle methodischen Aspekte dieser Erhebungsmethode angemessen berücksichtigt werden. Beispielsweise wird eine bessere Feldkontrolle in der Praxis nur erreicht, wenn die Interviewer die sorgfältig konzipierten disposition codes in der Schulung adäquat vermittelt bekommen und ihre Anwendung eine kontinuierliche qualitätssichernde Begleitung erfährt. Viele der genannten Nachteile von Telefonsurveys können durch geeignete Maßnahmen neutralisiert bzw. zumindest abgemildert werden. Wird beispielsweise die Erhebungsmethode bei der Entwicklung des Fragebogens angemessen berücksichtigt, lassen sich die allermeisten Themen sehr gut per Telefon präsentieren.

Die Vorteile telefonischer Interviews kommen erst durch Computerunterstützung (CATI) richtig zum Tragen. Die damit einhergehende Technisierung stellt ihrerseits eigene Anforderungen an das Feldteam und die gesamte technische Infrastruktur. Die unzureichende Berücksichtigung von Teilaspekten kann erhebliche Implikationen für das Ergebnis der Feldarbeit haben. Die Qualität der Feldarbeit ist damit nicht nur von den im engeren Sinn wissenschaftlichen Vorarbeiten und den begleitenden Qualitätssicherungsmaßnahmen abhängig, sondern auch auf kooperative Unterstützung zahlreicher Personen angewiesen, deren „tägliches Geschäft“ anderen Dingen gewidmet ist.

Die gründliche Vorbereitung und gewissenhafte Durchführung der Befragung haben zum Erfolg des GSTel03 beigetragen. Dieser Erfolg, der im vorliegenden sowie im darauffolgenden Schwerpunktheft des Bundesgesundheitsblattes in den einzelnen Beiträgen dokumentiert wird, ist letztlich auch vom kontinuierlichen Engagement aller Beteiligten abhängig. Ihnen gebührt deshalb an dieser Stelle besonderer Dank.