In einer 2008 veröffentlichten Studie zur Mitgliederstruktur von Krankenversicherungen wurde gezeigt, dass sich die Sozialstruktur, Geschlechterverhältnisse sowie die Morbiditäten zwischen unterschiedlichen Versicherungen deutlich voneinander unterscheiden [1, 2]. Die Versicherten der Allgemeinen Ortskrankenkassen (AOK) und der Betriebskrankenkassen (BKK) wiesen in diesem Vergleich am häufigsten Gesundheitsbeeinträchtigungen auf. Grundlage der Analysen waren Surveydaten aus dem Bertelsmann-Gesundheitsmonitor 2007. Unter Verwendung der gleichen Datenquelle wurden Untersuchungen zur Prävalenz von Diabetes je nach Krankenversicherungszugehörigkeit durchgeführt [3]. Wie oben [1, 2] für allgemeine Krankheitsindikatoren berichtet, unterschieden sich die diesbezüglichen Prävalenzraten bei den Versicherten der unterschiedlichen Kassen deutlich; wiederum wiesen die BKK- und die AOK-Versicherten die höchsten Raten auf. Bei Versicherten von Ersatzkassen waren die Prävalenzen für Diabetes hingegen um mehr als die Hälfte niedriger, die bei privat Versicherten lagen dazwischen. Insbesondere das letztgenannte Ergebnis ist überraschend, da Erkrankungsrisiken im Allgemeinen mit steigendem Einkommen, zunehmender Qualifikation und steigender beruflicher Position sinken [4].

Beiden Studien ist gemeinsam, dass sie nur Unterschiede zwischen den Versicherten unterschiedlicher Kassen untersuchten, dennoch zieht Schnee [1] daraus den Schluss: „… die Allgemeinen Ortskrankenkassen versichern einkommensschwache und bildungsferne Schichten und haben damit eine völlig andere Klientel als beispielsweise die Techniker Krankenkasse“ (S. 100). Aus dieser Aussage könnte der Eindruck entstehen, dass Analysen mit GKV-Daten grundsätzlich zu verzerrten Ergebnissen führen. Tatsächlich wurde aber in beiden Studien die Frage nach der Übereinstimmung der Verteilung relevanter Merkmale zwischen den Kassenversicherten und der Gesamtbevölkerung nicht behandelt. Es bleibt deshalb offen, ob und in welchem Ausmaß sich die unterschiedlichen Versichertenpopulationen von der Allgemeinbevölkerung unterscheiden. Die Qualität von GKV-Daten wird bisher – außer in wenigen Studien – zu selten oder zu wenig differenziert diskutiert. Die Verwendung von GKV-Daten als Basis für wissenschaftliche Analysen wird häufig wegen fehlender Kenntnisse ihrer konkreten Möglichkeiten und Grenzen abgelehnt [5] oder wegen ihres als begrenzt unterstellten Geltungsanspruchs kritisiert [6]. Andererseits werden aber auch Studien unter der Annahme durchgeführt, dass GKV-Daten für die Beantwortung einer breiten Variation von Fragestellungen verwendbar sind [7, 8].

Eine Beurteilung der wissenschaftlichen Brauchbarkeit von GKV-Daten ist jedoch notwendig, da ihre Verwendung weit verbreitet ist und zukünftig noch weiter zunehmen wird [9, 10, 11]. Auch der Bericht des Sachverständigenrats für das Gesundheitswesen aus dem Jahr 2007 [12] empfiehlt eine stärkere Nutzung von Routinedaten für die Gesundheitsforschung, da sie es ermöglichen, auch seltene Erkrankungen in ihren Verläufen und sozialstrukturellen Verteilungen auf der Basis großer Fallzahlen zu untersuchen.

Vor diesem Hintergrund soll im vorliegenden Beitrag untersucht werden, ob die Verteilung zentraler sozialstruktureller Merkmale in GKV-Daten von der in der allgemeinen Bevölkerung abweicht, und wenn ja, wie groß diese Unterschiede sind.

Diese beiden Fragen werden in den folgenden Analysen aufgenommen und für einen Datensatz empirisch untersucht. Es werden Zahlen der statistischen Ämter verwendet, um Variablen aus einem aktuellen GKV-Datenbestand mit den gleichen Variablen auf der Ebene eines Bundeslands (Niedersachsen) sowie für Deutschland insgesamt zu vergleichen. Als vorteilhaft erweist es sich, dass die Qualifikationen und Berufe der sozialversicherungspflichtig Beschäftigten in den GKV-Daten und in den Daten der Statistischen Ämter des Bundes sowie der Länder in gleicher Weise kodiert [13]. Diese Klassifikationen basieren auf dem „Schlüsselverzeichnis für Angaben zur Tätigkeit in den Meldungen zur Sozialversicherung“ [14]. Im vorliegenden Fall werden die Daten der AOK Niedersachsen aus den Jahren 2004 und 2009 mit den entsprechenden Informationen für Niedersachsen und für die Bundesrepublik verglichen.

Material und Methoden

Datengrundlage

Zur Beantwortung der aufgestellten Frage wurde ein pseudonymisierter Datensatz der AOK Niedersachsen für die Jahre 2004 und 2009 verwendet. Er enthält Angaben zum Geschlecht, Geburtsmonat und -jahr, zum Wohnort und zum Versicherungsverlauf. Insgesamt liegen Daten für über 3,3 Mio. Versicherte vor.

Als Vergleichsbasis wurden Daten der Statistischen Ämter des Bundes und der Länder herangezogen [13]. Für die allgemeinen Bevölkerungsvergleiche wurden die Geschlechter- und Altersangaben (15 Kategorien) für die Einwohner Niedersachsens und der Bundesrepublik verwendet. Aus dem AOK-Datenbestand wurden alle Versicherten entfernt, deren Wohnort außerhalb Niedersachsens liegt (ca. 6,5% der Versicherten). Für diesen Bereinigungsschritt wurden die Wohnortsangaben als zweistellige Postleitzahlangaben genutzt. Die personenbezogenen Daten liegen nicht als Prozessdaten, sondern als Querschnittsdaten zum 31.12.2010 vor. Die Unschärfen einer zweistelligen Postleitzahlzuordnung zum Bundesland Niedersachsen und auch des Querschnittscharakters der Wohnortdaten wurden mangels genauerer Informationen in Kauf genommen.

Des Weiteren werden AOK-Versicherte mit der Bevölkerung Niedersachsens und der Bundesrepublik hinsichtlich ihrer Qualifikation und der ausgeübten Tätigkeiten (Berufe) verglichen. Entsprechende Informationen werden vom Arbeitgeber im Rahmen der sog. Jahresmeldung (§ 28a des SGB V) an die Krankenkasse übermittelt, die diese Daten entsprechend der Datenerfassungs- und -übermittlungsverordnung [15] an die Sozialversicherungsträger weiterleitet. Der Natur dieser Daten entsprechend können in diese Vergleiche nur Personen einbezogen werden, die am Stichtag sozialversicherungspflichtig beschäftigt sind.

Aus den Daten der Statistischen Ämter des Bundes und der Länder konnte eine entsprechende Datenquelle herangezogen werden, die nur Daten zu sozialversicherungspflichtig Beschäftigten enthält, die in Niedersachsen bzw. in der Bundesrepublik wohnhaft sind. Ein Vergleich anhand der in den Daten der Statistischen Ämter des Bundes und der Länder ansonsten üblichen Gliederung nach Arbeitsortprinzip (Daten für Beschäftigte in Unternehmen, die im jeweiligen Bundesland ihren Hauptsitz haben) war nicht möglich, da die AOK-Daten keine entsprechenden Informationen enthalten.

In den Vergleichen verwendete Variablen

Neben den oben genannten demografischen Informationen ist für die AOK-Versicherten auch die Versichertenart verfügbar, die eine Identifikation der sozialversicherungspflichtig Beschäftigten ermöglicht. Für eine eindeutige Identifikation der Versichertenart wurde die Expertise von AOK-Fachexperten eingeholt.

In den Verlaufsdaten sind für sozialversicherungspflichtig Beschäftigte der amtliche dreistellige Tätigkeitsschlüssel mit Angaben zum Beruf sowie die nach 8 Kategorien gegliederte amtliche Kategorisierung zur Stellung im Beruf und zur Berufsausbildung nach 7 Kategorien verfügbar. In den amtlichen Statistiken über sozialversicherungspflichtig Beschäftigte werden die Daten zur beruflichen Tätigkeit in zusammengefasster Form berichtet: Qualifikation wird in 3 Kategorien dargestellt (mit/ohne Berufsausbildung und mit Hochschulabschluss), und aus den ursprünglich dreistelligen detaillierten Berufsbezeichnungen wurden für die amtlichen Berichte 10 Berufsgruppen gebildet (s. dazu Tab. 5). Die AOK-Daten ließen sich nach einer gründlichen Plausibilitätsprüfung in gleicher Weise wie in den statistischen Daten zusammenfassen.

Ergebnisse

Geschlecht

Die Geschlechterverteilung der Versicherten der AOK Niedersachsen weist für das Jahr 2004 mit 53,2% einen etwas höheren Frauenanteil auf; im Land Niedersachsen ist der Frauenanteil mit 51% geringfügig niedriger, das Gleiche gilt für die Bundesrepublik (Frauenanteil 51,1%). Im Jahr 2009 sinkt der Frauenanteil unter den AOK-Versicherten auf 52,6%, in Niedersachsen beträgt er 50,9% und in der Bundesrepublik 51% (Tab. 1).

Tab. 1 Geschlechterverteilung unter den Versicherten der AOK Niedersachsen sowie in der Bevölkerung Niedersachsens und der Bundesrepublik in den Jahren 2004 und 2009

Alter

Die Altersverteilungen der AOK-Versicherten, der Bevölkerung Niedersachsens sowie der Bundesrepublik gleichen sich in den Jahren 2004 und 2009 (Abb. 1, Abb. 2); diese Verteilungen nähern sich zwischen 2004 und 2009 weiter an. Die mittleren Altersgruppen sind unter den AOK-Versicherten etwas schwächer vertreten als in der Bevölkerung Niedersachsens und der Bundesrepublik. Diese Unterschiede sind jedoch gering und überschreiten bei Personen unterhalb des 65. Lebensjahrs in keinem Fall 2 Prozentpunkte der jeweiligen Gesamtgruppe; dabei zeigen sich bei den männlichen Versicherten geringere Unterschiede als bei den Frauen (die Geschlechterunterschiede sind nicht in der Grafik dargestellt). Keine Unterschiede zeigen sich für die Altersgruppen unterhalb des 20. Lebensjahrs sowie zwischen dem 50. und dem 65. Lebensjahr; in den darüber liegenden Altersgruppen unterscheiden sich die Verteilungen wiederum nur gering.

Abb. 1
figure 1

Altersverteilung für Versicherte der AOK Niedersachsen zum 31.12.2004 im Vergleich zu Bevölkerungsdaten zum 31.12.2004

Abb. 2
figure 2

Altersverteilung für Versicherte der AOK Niedersachsen zum 31.12.2009 im Vergleich zu Bevölkerungsdaten zum 31.12.2009

Erwerbstätigkeit

Der Anteil an sozialversicherungspflichtig beschäftigten Männern unter den AOK-Versicherten lag im Jahr 2004 bei 35,1%, bei Frauen bei 21,7%. Beim Vergleich mit den Bevölkerungsdaten fällt der gleiche Anteil sozialversicherungspflichtig beschäftigter Männer in Niedersachsen im Jahr 2004 auf, aber auch die geringe Differenz zu den Relationen in der gesamten Bundesrepublik (Tab. 2). Bei Frauen lagen die Unterschiede bei ca. 5–7%, damit sind sozialversicherungspflichtig beschäftigte Frauen unter den AOK-Versicherten unterrepräsentiert.

Tab. 2 Anteile der sozialversicherungspflichtig Beschäftigten unter den Versicherten der AOK Niedersachsen bzw. in der Gesamtbevölkerung Niedersachsens und der Bundesrepublik nach Geschlecht in den Jahren 2004 und 2009

Im Jahr 2009 steigt der Anteil an sozialversicherungspflichtig Beschäftigten unter den AOK-Versicherten auf 23,2% (Frauen) bzw. auf 35,8% (Männer), was die zunehmende Zahl von Personen in bezahlten Tätigkeiten und die abnehmende Arbeitslosigkeit abbildet. Unter der Bevölkerung Niedersachsens (28,1% bzw. 36,2%) bzw. in der Bundesrepublik (30% bzw. 36,8%) steigen diese Anteile noch etwas deutlicher als unter den AOK-Versicherten.

Wird der Anteil der Erwerbstätigen nach Altersgruppen betrachtet, zeigen sich zwischen den 3 miteinander verglichenen Populationen geringe Unterschiede; die größten finden sich in den mittleren Altersgruppen (Tab. 3).

Tab. 3 Anteil der sozialversicherungspflichtig Beschäftigten unter den Versicherten der AOK Niedersachsen bzw. in der Gesamtbevölkerung Niedersachsens und der Bundesrepublik nach Altersgruppen in den Jahren 2004 und 2009

Qualifikation der sozialversicherungspflichtig Beschäftigten

Bei Betrachtung der Qualifikation der Beschäftigten zeigen sich – anders als bei den bisher dargelegten Merkmalen – zwischen AOK-Versicherten und den diesbezüglichen landes- bzw. bundesweiten Daten deutliche Unterschiede (Tab. 4). Für 2004 ist der Anteil der Beschäftigten ohne Berufsausbildung unter den AOK-Versicherten mit 31,5% deutlich höher als in der Bevölkerung Niedersachsens (18%) bzw. der bundesweiten Bevölkerung (18,8%). Ähnlich ungleichgewichtig ist der Anteil der Beschäftigten mit Berufsausbildung (66,8% bei den AOK-Versicherten vs. 73,4% in Niedersachsen bzw. 70,5% in der Bundesrepublik). Der Anteil an Hochschulabsolventinnen und -absolventen unter den AOK-Versicherten ist mit 1,7% nochmals geringer als unter der Bevölkerung Niedersachsens (8,7%) und der gesamten Bundesrepublik (10,7%). Bei einer getrennten Betrachtung nach Geschlechtern zeigt sich, dass diese Ungleichgewichte bei Männern stärker ausgeprägt sind als bei Frauen, was sich aus den geringeren Durchschnittseinkommen bei Frauen erklären könnte.

Tab. 4 Anteile der sozialversicherungspflichtig Beschäftigten unter den Versicherten der AOK Niedersachsen bzw. in der Gesamtbevölkerung Niedersachsens und der Bundesrepublik nach Berufsausbildung in den Jahren 2004 und 2009

Für 2009 reproduzieren sich diese Relationen mit leicht veränderten Anteilen und Zahlen. Die Anteile an Hochschulabsolventen steigen insgesamt zwischen 2004 bis 2009 sowohl in Niedersachsen als auch in Deutschland an; diese Entwicklung zeigt sich aber unter den AOK-Versicherten noch deutlicher.

Berufsgruppen

Unter den Versicherten der AOK finden sich als häufigste Berufsgruppen die Kategorien der Fertigungsberufe und der Dienstleistungsbereich (Tab. 5). Entsprechendes gilt, wenn man die Bevölkerung Niedersachsens bzw. der Bundesrepublik betrachtet. Allerdings sind die Fertigungsberufe in der AOK im Vergleich überrepräsentiert, während der Dienstleistungsbereich einen wesentlich kleineren Anteil einnimmt. Diese Unterschiede sind deutlich und insbesondere vor dem Hintergrund der Verteilung in der Bevölkerung Niedersachsens auffällig, da die betrachteten AOK-Versicherten eine Untergruppe dieser Population sind.

Tab. 5 Anteile und Anzahl der sozialversicherungspflichtig Beschäftigten unter den Versicherten der AOK Niedersachsen bzw. in der Gesamtbevölkerung Niedersachsens und der Bundesrepublik nach Berufsgruppen in den Jahren 2004 und 2009

Wird der Dienstleistungsbereich weiter ausdifferenziert, zeigt sich, dass die Bereiche „Verkehr“ und „allgemeine Dienstleistung“ unter den AOK-Versicherten stärker vertreten sind als erwartet.

Diskussion

Die Untersuchungen haben gezeigt, dass sich die Geschlechterverteilung unter den AOK-Versicherten kaum von der in der Bevölkerung Niedersachsens und der gesamten Bundesrepublik unterscheidet. Auch bei der Altersverteilung finden sich zwischen den AOK-Versicherten und den beiden anderen Populationen nur geringe Unterschiede. Entsprechende Differenzen werden erst in den mittleren Altersgruppen deutlich; sie überschreiten nur bei über 65-Jährigen 2 Prozentpunkte.

Unter den AOK-Versicherten ist der Anteil der Beschäftigten bei den Männern in etwa gleich groß, bei den Frauen aber geringer als in Niedersachsen bzw. in Deutschland insgesamt. Ein höherer Anteil AOK-Versicherter findet sich in den geringer qualifizierten Positionen, ohne dass die höheren Qualifikationsgruppen fehlen. Deren Anteil steigt über die Jahre insbesondere bei den Frauen an, und es sind in allen Kategorien ausreichend große Fallzahlen vorhanden, um statistische Analysen durchführen zu können. Bei den Berufsgruppen sind unter den AOK-Versicherten im Vergleich zur Bevölkerung in Niedersachsen und im Bund Fertigungsberufe überrepräsentiert, der Dienstleistungsbereich ist hingegen schwächer vertreten. Bei den Dienstleistungsberufen findet sich wiederum ein Übergewicht der einfacheren Tätigkeiten.

Vor diesem Hintergrund lässt sich die eingangs formulierte Forschungsfrage wie folgt beantworten: Im untersuchten GKV-Datensatz liegen fast alle Qualifikations- und Berufsgruppen vor, die auch in den Daten der statistischen Ämter enthalten sind. Es finden sich im Vergleich der 3 Populationen zwar diesbezüglich leichte Verschiebungen, aber nicht so stark, dass der Schluss gerechtfertigt ist, dass es sich bei den AOK-Versicherten nur oder auch überwiegend um einkommensschwache und bildungsferne soziale Gruppen handelt. Anhand der vorliegenden Daten können zwar keine Aussagen über die Gesamtbevölkerung gemacht werden, aber es können Zusammenhänge zwischen sozialstrukturellen, demografischen Merkmalen und Erkrankungen bzw. Mustern der Inanspruchnahme untersucht werden. Dies gilt auch für Versicherte mit einem hohen Qualifikationsniveau oder mit technischen Berufen, da sie unter den Versicherten der AOK Niedersachsen in ausreichend großer Zahl vertreten sind. Damit eignen sich diese Daten, um eine Vielzahl von Fragen der Gesundheitsberichterstattung zu behandeln, insbesondere zu sozialen Unterschieden bei Morbiditäten oder zur Versorgung mit medizinischen Leistungen.

Der vorliegende Aufsatz argumentiert, dass die Aussagekraft von GKV-Daten nicht primär auf deren Repräsentativität beruht, sondern vielmehr, dass die relevanten Merkmale ausreichend häufig in diesen Daten vertreten sein müssen, um eine Stratifizierung vornehmen zu können. Dieses Argument gilt jedoch nicht uneingeschränkt. So liegen sozialstrukturelle Informationen nur für berufstätige Versicherte vor, d. h., die für gesundheitsbezogene Fragestellungen sehr relevante Gruppe der über 65-Jährigen ist in GKV-Daten sozialstrukturell nicht klassifiziert. Ein weiteres Problem ergibt sich aus den Prävalenzen unterschiedlicher Erkrankungen: Während relativ häufige Krankheitsbilder nach Stratifizierung statistisch untersucht werden können, kommt man bei eher seltenen Erkrankungen schnell an eine Grenze.

Eine Generalisierung der obigen Schlussfolgerung auf Datensätze anderer Krankenversicherungen ist nicht zulässig, weil dazu für jeden einzelnen Datensatz Informationen zur Größe der Versichertenschaft sowie zu ihrer sozialstrukturellen Zusammensetzung erforderlich sind [3]. Die Chancen, krankheits- und sozialstrukturbezogene Analysen durchführen zu können, steigen mit zunehmender Heterogenität und Größe der Versichertenpopulation. Es sollte daher nicht gefragt werden, ob eine Versichertengruppe im Hinblick auf definierte Merkmale repräsentativ ist, sondern ob die interessierenden Merkmale bzw. Merkmalskombinationen ausreichend häufig vertreten sind, um die interessierenden Zusammenhänge statistisch sichtbar werden zu lassen. Trotzdem werden in den Daten der gesetzlichen Krankenversicherungen bestimmte Personengruppen nicht oder zu selten vertreten sein. Dies bezieht sich z. B. auf typischerweise in der PKV versicherte Personen, insbesondere Beamte, Pensionäre und Selbstständige [16].

Der folgende Punkt betrifft die Verwendbarkeit der Daten; der Vollständigkeit halber muss darauf hingewiesen werden, dass sie auch mit Blick auf ihre Validität untersucht werden müssen. Validierungsstudien wurden unter anderem für ambulante und stationäre Diagnosen [17] sowie für auf Krankenscheinen angegebene psychiatrische Diagnosen [18] durchgeführt. Es liegen damit Informationen zur Brauchbarkeit und Verwendbarkeit der Daten vor. Bei den hier verwendeten sozialstrukturellen Merkmalen betrifft dies die Korrektheit der Jahresmeldungen zur Qualifikation sowie die Berufsgruppenzugehörigkeit, die im Falle der GKV-Zugehörigkeit jährlich vom Arbeitgeber an die Krankenversicherung erfolgen muss [19]. Auch wenn erste eigene Untersuchungen diesbezüglich auf eine recht hohe Validität schließen lassen, steht eine systematische Untersuchung aus. Mit den hier präsentierten Ergebnissen wurde aber ein Anfang gemacht, und der verwendete Datensatz hat sich als tauglich erwiesen, um soziale Differenzierungen im Hinblick auf Erkrankungen und Inanspruchnahmen zu untersuchen. Die hier praktizierte Verfahrensweise sollte auch auf andere GKV-Datensätze übertragen werden können, weil die erforderlichen statistischen Daten auf Landes- und Bundesebene allgemein verfügbar sind.