Noch fehlt es an einer Übereinkunft, wie das Ergebnis des Fragebogens zur stimmbezogenen Lebensqualität („Voice-Related Quality of Life“, VRQOL) zu bewerten ist. Dies ist möglicherweise ein Grund dafür, dass er – ähnlich wie andere Verfahren mit derselben Zielsetzung – bisher noch nicht klinisch „breit“ eingesetzt wird. Die Frage „Was sagen uns die Werte des VRQOL“ ist bisher nicht beantwortet. Ein Schritt zum Schließen dieser diagnostischen Lücke sollte in dieser Studie gemacht werden.

Die „European Laryngological Society“ (ELS) empfiehlt für die Diagnostik von Stimmstörungen ein mehrdimensionales Vorgehen mit der Untersuchung des die Stimme produzierenden Kehlkopfes, der Stimmfunktion und der Erhebung der subjektiven Betroffenheit des Patienten. In der Klinik können daraus individuelle Indikations- und Endpunktparameter hergeleitet werden [7, 19]. Unter methodischen Gesichtspunkten sind die Kehlkopfuntersuchung [8] und die Messung der Stimmfunktion [35] unstrittig. Für die Parametrisierung der „subjektiven Seite der Dysphonie“ [25] gilt im internationalen Schrifttum der Fragebogen „Voice-Handicap-Index“ (VHI; [14]) als „Goldstandard“ bzw. als „Referenzverfahren“ [2]. Er liegt auch in deutscher Fassung vor, u. a. in einer Version der berichtenden Arbeitsgruppe [21, 33].

Dieser in seiner Originalfassung 30 Items umfassende Fragebogen wurde mittlerweile in eine verkürzte Form gebracht [26]. In einer früheren Arbeit der berichtenden Gruppe [11] wurde beim Vergleich mit der 30-Fragen-Version des VHI die inhaltliche Gleichwertigkeit des nur 10 Items beinhaltenden Fragebogens zur stimmbezogenen Lebensqualität („Voice-Related-Quality-of-Life-Index“, VRQOL; [13]) bewiesen. Der VRQOL lädt faktorenanalytisch auf nur einen Gesamtwert [29]: Damit steht mit dem VRQOL ein klinisch praktikables Instrument (10 Items, ein Gesamtwert) zur Messung der subjektiven Betroffenheit durch eine Dysphonie zur Verfügung.

Mit dem VRQOL steht ein klinisch praktikables Instrument zur Messung der subjektiven Betroffenheit durch Dysphonie zur Verfügung

Trotz der zahlreichen Bemühungen zur Verankerung der subjektiven Betroffenheit als einer neben dem Organ- und dem Stimmbefund prinzipiell gleichwertigen klinischen Zielgröße ist bisher nicht definiert, welcher VRQOL-Wert unabhängig von der Behandlungsbedürftigkeit des Organ- und des Stimmbefundes eine wie auch immer geartete therapeutische Intervention begründet. Dies mag an dem breit streuenden Wertebereich des VRQOL (Prozentwerte) liegen. Denn für klinische Zwecke sind einfachere, übersichtliche Kategorien „handlicher“. In einer früheren Publikation der berichtenden Arbeitsgruppe war der VHI (möglicher Wertebereich 0–120 Punkte) anhand des Außenkriteriums der gesundheitsbezogenen Lebensqualität (LQ) in 4 Wertebereiche aufgeteilt worden [10]. Eine solche Einteilung sollte in dieser Studie für die VRQOL-Werte erreicht werden:

Konkret sollte der Teilaspekt der LQ, der bei Patienten mit einer Stimmstörung signifikant beeinträchtigt ist und der eine signifikante Korrelation zum Ergebnis des VRQOL zeigt, die externe Bezugsgröße des VRQOL-Ergebnisses sein.

Probanden und Methoden

Nach Information über Inhalt und wissenschaftlichen Hintergrund der Untersuchung nahmen alle 105 um die Mitarbeit gebetenen Patienten (56 Frauen, 49 Männer) im Alter zwischen 16 und 83 Jahren (49,4±16,1) an der Studie teil. Alle Patienten hatten sich konsekutiv wegen einer in Rede stehenden Dysphonie erstmals zur Untersuchung und Behandlung in der berichtenden Abteilung vorgestellt. Bei 50% wurde eine organische und bei 37% eine funktionelle Stimmstörung festgestellt (Frauen: 46% vs. 41%, Männer: 53% vs. 33%). Bei 13% der Probanden (Frauen: 13%, Männer: 14%) lag keine Stimmstörung vor, es konnte jeweils kein organisches oder funktionelles Korrelat der „Stimmbeschwerden“ gefunden werden.

Die Studie wurde als schriftliche Befragung mit standardisierten Instrumenten durchgeführt. Erhebungsinstrument für die stimmbezogene Lebensqualität war die früher von der berichtenden Arbeitsgruppe vorgestellte deutsche Version des VRQOL [11]. Die gesundheitsbezogene Lebensqualität wurde mit dem SF-36 Fragebogen [5] gemessen. Für die Auswertung standen komplette Datensätze aller Probanden zur Verfügung. Die Datenanalyse erfolgte in der bereits früher dargelegten Weise, beschrieben u. a. bei [10].

Maßstab zur Graduierung des VRQOL war das Außenkriterium „gesundheitsbezogene LQ“, gemessen mit dem SF-36. Zwischen dem VRQOL-Summenwert und der allgemeinen, d. h. nicht störungsspezifischen, gesundheitsbezogenen LQ des SF-36 ist ein positiv linearer Zusammenhang anzunehmen: Je besser die stimmbezogene LQ ist, also je größer der VRQOL-Wert ist, desto besser ist auch die allgemeine LQ, d. h. um so größer sind die Werte der SF-36-Skalen.

Maßstab zur Graduierung des VRQOL war das Außenkriterium „gesundheitsbezogene LQ“

Um eine klinisch bedeutsame Stufeneinteilung des VRQOL-Werts im Sinne von Wertebereichen mit empirisch nachgewiesener Übereinstimmung mit Parametern der gesundheitsbezogenen LQ vornehmen zu können, gilt es zu definieren, was „klinisch auffällig“ bedeutet. Hier wurde die „90%-Regel“ angewendet: Der untere Wertebereich des VRQOL, beginnend mit dem Wert 0, in dem 90% der Patienten eine unterdurchschnittliche gesundheitsbezogene LQ aufweisen – also Werte im 1.–49. Perzentil verglichen mit den Normwerten der Allgemeinbevölkerung – wird als „klinisch auffällige“ stimmbezogene LQ festgelegt.

In der Allgemeinbevölkerung dagegen ist die gesundheitsbezogene LQ „gleich verteilt“, d. h. die Anzahl derjenigen Personen, die eine durchschnittliche oder überdurchschnittlich gute LQ (50.–100. Perzentil) aufweisen, ist gleich groß beim Vergleich mit denjenigen mit unterdurchschnittlicher LQ (1.–49. Perzentil). Anhand dieses Validitätskriteriums ist die stimmbezogene LQ in dem Wertebereich klinisch nicht bedeutsam beeinträchtigt, in dem die gesundheitsbezogene LQ gleich verteilt ist oder sogar ein Überwiegen der Personen mit durchschnittlicher oder überdurchschnittlicher LQ festzustellen ist.

Alle statistischen Analysen wurden mit dem Programm „Statistical Package for Social Sciences“ (SPSS 16.0®) berechnet. Für den VRQOL-Summenwert und die SF-36-Skalen wurde unter Verwendung des Kolmogorow-Smirnow-Anpassungstests geprüft, ob die beobachteten Werteverteilungen signifikant von der Normalverteilung abweichen.

Wegen beobachteter Abweichungen von der Normalverteilung wurden für alle weiteren Analysen verteilungsfreie Verfahren verwendet. Medianunterschiede des VRQOL-Summenwerts zwischen 2 Teilstichproben wurden mit Hilfe des Mann-Whitney-Tests überprüft. Für korrelative Zusammenhänge zwischen 2 metrischen Variablen, insbesondere zwischen dem VRQOL-Summenwert und den SF-36-Skalen, wurde der Spearman-Rangkorrelationskoeffizient berechnet. Die Überprüfung, ob 2 Häufigkeiten gleich groß sind (Nullhypothese) oder eine signifikante Abweichung von der Gleichverteilung zu beobachten ist, wurde anhand der Werte der F-Verteilung vorgenommen [27]. Das Signifikanzniveau unter Verwendung zweiseitiger Fragestellungen wurde auf p=0,05 festgelegt.

Ergebnisse

Die Summenwerte des Voice-Related-Quality-of-Life-Index (SVRQOL) erstreckten sich bei den 105 Patienten über den Bereich von 2,5–100 und deckten damit nahezu die gesamte Spannweite von 0–100 Prozentpunkten ab (Abb. 1). Bei einem Mittelwert von 58,4 und einer Standardabweichung von 31,6 resultierte eine zweigipflige Werteverteilung und damit eine signifikante Abweichung von der Normalverteilung (p=0,023). Die 1. Häufung von Fällen liegt beim Wertebereich zwischen 20 und 25 und damit bei sehr eingeschränkter stimmbezogener LQ, während die 2. Häufung bei Werten zwischen 95 und 100 und damit bei maximal guter stimmbezogener LQ zu beobachten ist.

Der SVRQOL hat keinen signifikanten Zusammenhang mit dem Geschlecht des Patienten (p=0,122), keinen mit dem Alter (p=0,235) und auch keinen mit der Genese der Stimmstörung (funktionell vs. organisch, p=0,630). Deshalb wurden bei der weiteren Datenanalyse keine Subgruppen berücksichtigt, sondern es wurde immer von der gesamten Patientenstichprobe ausgegangen. Beim Vergleich der Patientengruppe „keine Stimmstörung“ mit den beiden anderen Gruppen (Patienten mit organischer bzw. funktioneller Dysphonie) besteht jeweils ein signifikanter Unterschied des SVRQOL mit p<0,001.

Abb. 1
figure 1

Verteilung der Werte des VRQOL-Fragebogens (in %) im Kollektiv von 105 Patienten mit einer Dysphonie

Alle Zusammenhänge zwischen SVRQOL und den Skalen des SF-36 sind positiv linear. Dieser Zusammenhang ist mit den Skalen „allgemeine Gesundheit“, „körperliche Funktionsfähigkeit“ und „emotionale Rollenfunktion“ jedoch nur sehr gering ausgeprägt (Korrelationskoeffizient <0,20) und statistisch nicht signifikant (Tab. 1). Weitere 6 SF-36-Skalen weisen niedrige (rS≤0,30), jedoch signifikante Zusammenhänge mit dem SVRQOL auf: körperlicher Summenwert, körperliche Schmerzen, psychisches Wohlbefinden, psychischer Summenwert, Vitalität und körperliche Rollenfunktion. Einzig mit der Skala „soziale Funktionsfähigkeit“ besteht ein moderat starker (rS=0,40) und hochsignifikanter (p<0,001) Zusammenhang. Deshalb wird die Graduierung des SVRQOL anhand dieser Subskala durchgeführt (Tab. 2):

  • SVRQOL-Werte zwischen 0 und unter 40:

    • Hier haben knapp 90% (89%) der Patienten eine eingeschränkte, unter dem Durchschnitt liegende LQ im Bereich „sozialer Funktionsfähigkeit“. Dieser Wertebereich des SVRQOL ist also sicher „klinisch auffällig“ im Sinne einer beeinträchtigten stimmbezogenen LQ (Tab. 2).

Tab. 1 Gesundheitsbezogene Lebensqualität (SF-36) bei 105 Patienten und deren Zusammenhang mit dem Summenwert des Voice-Related-Quality-of-Life-Index (VRQOL)
Tab. 2 Verteilung alters- und geschlechtsnormierter SF-36-Werte (soziale Funktionsfähigkeit, psychische und körperliche Summenskala) in 3 Intervallen des VRQOL-Summenwerts

Die SVRQOL-Werte ab 40 sind gemessen an der sozialen Funktionsfähigkeit nicht mehr „klinisch auffällig“, da in diesem Bereich nur noch weniger als die Hälfte der Patienten (40%) unterdurchschnittliche Werte für soziale Funktionsfähigkeit aufweisen. Dieser Wertebereich lässt sich in 2 Intervalle unterteilen:

  • SVRQOL-Werte zwischen 40 und 80:

    • In diesem Wertebereich des VRQOL ist die soziale Funktionsfähigkeit annähernd verteilt wie in der Allgemeinbevölkerung – mit 47% ist kein Überwiegen der unterdurchschnittlichen LQ mehr festzustellen. In diesem Wertebereich liegt somit „keine klinisch bedeutsame Einschränkung der stimmbezogenen LQ“ mehr vor.

  • SVRQOL-Werte zwischen über 80 und 100:

    • Hier besteht ein statistisch signifikantes (p<0,05; einseitig) Überwiegen der Patienten mit durchschnittlicher oder überdurchschnittlich guter sozialer Funktionsfähigkeit im Vergleich zu unterdurchschnittlicher sozialer Funktionsfähigkeit (67% zu 33%). Die VRQOL-Werte zeigen eine „normale, unbeeinträchtigte st immbezogene LQ“ an.

Diskussion

Der Durchdringungsgrad des international an sich respektierten ELS-Vorschlags zum ärztlichen Vorgehen bei Dysphonien [7] ist selbst bei den Autoren dieser Empfehlungen gering [9]. Möglicherweise ist dies bedingt durch bisher nur methodisch mangelhafte Empfehlungen, wie denn das – gleich, mit welcher Methode gemessene – subjektive Erleben [20, 30, 32] das individuelle therapeutische Vorgehen leiten soll. So gibt es gibt es keine randomisierten Verlaufsstudien mit dem Selbsterleben oder auch der Patientenzufriedenheit als Indikations- und Endpunktparametern, die z. B. beim Vorliegen eines Stimmlippenpolypen die Überlegenheit einer Operation gegenüber einer die Stimmfunktion anpassend behandelnden logopädischen Therapie belegen könnte.

Eine zu differenzierte Maßzahl ist weniger aussagekräftig als eine anschaulichere Einteilung

Nach einer Grundannahme der Autoren ist eine zu differenzierte Maßzahl für den Praktiker weniger aussagekräftig als eine anschaulichere und einfachere Einteilung. Im Zusammenhang mit dem VRQOL ist das also ein Prozentwert, der weniger aussagekräftig ist als Begriffe wie „leicht“, „mittel“ oder „schwer“ beeinträchtigte stimmbezogene Lebensqualität. Diese Annahme gründet in der allgemein beobachteten Tatsache, dass eine Kategorisierung mit mehr als 5 oder 6 (Vergleich: Schulnoten!) Untergruppen im letzten nur pseudogenau und die Trennschärfe der einzelnen Werte gering ist [6]. Vor diesem Hintergrund wurde in dieser Studie die Graduierung des VRQOL-Werts versucht.

Die Frage nach der konkreten therapeutischen Implikation der Graduierung war kein konkreter Studieninhalt, sie wird in Zukunft zu beantworten sein. Nicht für klinische, aber für gutachterliche Zwecke mag eine differenziertere Beschreibung auf der Basis der Prozentwerte hilfreich sein; dabei könnte man sich also weiterhin auf die konkreten Messwerte beziehen.

Methodisch kann eine solche Graduierung auf zweierlei Weise geschehen [17], nämlich einerseits über die interindividuelle Variabilität (Mittelwert, Standardabweichung) oder andererseits durch die Gegenüberstellung eines klinisch relevanten Außenkriteriums. Bei der 2. Vorgehensweise ist der Messwert wahrscheinlich mit einer patientenrelevanten Auswirkung verknüpft, und das klinische Gewicht des Messwerts steigt gegenüber dem 1. genannten Verfahren. Deshalb wurde hier wie in einer früheren Arbeit zur Graduierung des VHI diese Vorgehensweise gewählt [10]. In Anlehnung an die umfassende WHO-Definition von Gesundheit, zitiert nach [25], wurde das VRQOL-Ergebnis der sowohl national [4] als auch international [1] gebräuchlichen Messung der gesundheitsbezogenen Lebensqualität LQ gegenübergestellt („Außenkriterium“; [17]).

Der SF-36-Fragebogen ist international derartig weit verbreitet, dass er getrost als Goldstandard zur Messung der Lebensqualität bezeichnet werden darf. Er wurde also in Übereinstimmung mit dem bewährten früheren Vorgehen auch in der aktuellen Studie angewendet [10]. Anders als in der früheren Arbeit wurde das methodische Vorgehen der Graduierung hier aber streng durchgehalten, also keine Abgrenzung zu einem „stimmgesunden“ Kontrollkollektiv vorgenommen – solche Personen suchen keinen ärztlichen Rat wegen einer in Rede stehenden Stimmstörung. Unabhängig davon wurde auch bei einem Teil der hier beschriebenen Patienten keine Stimmstörung diagnostiziert, bei im Einzelfall durchaus bestehendem Leiden an der Stimme – das Selbsterleben eines Patienten und die dazu erhobenen ärztlichen Befunde sind prinzipiell voneinander unabhängige Größen [31].

Das Selbsterleben eines Patienten und die ärztlichen Befunde sind voneinander unabhängige Größen

Nach den Daten, die auf der Basis eines der langjährigen Inanspruchnahmepopulation der berichtenden Abteilung entsprechenden Studienkollektivs (Alter, Geschlecht, Diagnoseverteilung) ermittelt wurden, ist das VRQOL-Ergebnis vom Geschlecht und von der Genese der Stimmstörung (funktionell, organisch) unabhängig. Dies bestätigt frühere Beobachtungen der berichtenden Arbeitsgruppe [11, 24, 29]. Der VRQOL kann also sowohl bei Frauen als auch bei Männern und bei jedweder (benignen) Dysphonie eingesetzt werden. Er ist „für den klinischen Routinegebrauch geeignet“, zumindest in Einrichtungen mit ähnlichem Versorgungsauftrag bzw. vergleichbarer Patientenzusammensetzung wie in der berichtenden Abteilung.

Keine Aussage kann derzeit gemacht werden, ob denn die Graduierung bei Patienten mit einem Larynxkarzinom bzw. nach partiellen oder kompletten Laryngektomien mit gleich welchem Ersatzstimmmodus Gültigkeit hat [12, 28] – bei kleinen Glottiskarzinomen könnte bei einem besonders schlechten VRQOL-Wert die stimmfunktionell möglicherweise günstigere Bestrahlung einer Operation vorgezogen werden [3, 22]. Auch die Anwendung im Umfeld der Prävention oder der Rehabilitation [18] muss erst noch bewertet werden. Dass auch eine Veränderung des Patientenspektrums als Folge des gesundheitspolitisch herbeigeführten, de facto drohenden Sterbens von Facharztpraxen auch die Ergebnisse einer späteren Wiederholungsstudie beeinflussen kann, ist durchaus anzunehmen:

In einer Studie zur gesundheitsbezogenen Lebensqualität dysphoner Patienten wurden nämlich ein für ein Gesundheitssystem spezifischer Zuweisungsmodus und ein kulturell oder gesundheitspolitisch herbeigeführtes anderes Inanspruchnahmeverhalten als mögliche Ursachen für eine im „transkulturellen“ Vergleich andere Werteverteilung diskutiert [16, 34]. Für diese Annahme könnte auch die gegenüber eigenen Voruntersuchungen [11, 24, 29] veränderte Verteilung der VRQOL-Werte mit einem jetzt von der Normalverteilung abweichenden zweigipfligen Spektrum sprechen – angesichts einer genügend großen Studienpopulation und der quasi identischen Geschlechts- und Diagnoseverteilung lassen sich zumindest diese Gesichtspunkte als mögliche Ursache der anderen Werteverteilung ausschließen.

Zur Identifikation eines möglicherweise gewandelten Zuweisungsmodus – nahezu alle Patienten kamen und kommen auf HNO-ärztliche Überweisung – kann vor dem Hintergrund eines systematischen Qualitätsmanagements eine Befragung der niedergelassenen Kollegen dazu weitere Informationen liefern. Möglicherweise selektieren diese „andere“ Patienten zur Vorstellung in der universitären Facheinrichtung, nämlich v. a. solche, bei denen – wie auch immer durch den niedergelassenen HNO-Arzt operationalisiert – der Verdacht auf eine durch die Dysphonie hervor gerufene besonders relevante Beeinträchtigung der sozialen Funktionsfähigkeit aufkommt und bei denen jenseits der HNO-ärztlichen Grundkompetenz zu Stimmstörungen die besondere fachärztlich phoniatrisch-pädaudiologische Einschätzung gewünscht wird. Dies würde auch erklären, warum – anders als in der früheren VHI-Graduierungsstudie [10] – nunmehr die Subskala „soziale Funktionsfähigkeit“ des SF-36 als geeigneter externer Parameter der VRQOL-Graduierung identifiziert wurde. Im Letzten bildet nämlich diese Subskala dem Inhalt nach deutlich besser als andere Aspekte des SF-36 die fürs gesamte Selbsterleben relevante Folge einer Dysphonie und der stimmbezogenen Lebensqualität ab.

Fazit für die Praxis

Die sich auch im aktuellen Schrifttum abbildende gesteigerte Akzeptanz des Voice-Related-Quality-of-Life- (VRQOL-)Fragebogens (so z. B. bei [15, 23]) kann sich für die Anwendung der deutschen Version auf folgende, z.T. auch methodenkritisch relevante Eckdaten stützen: Der Zusammenhang des VRQOL mit dem früheren Goldstandard VHI ist sehr hoch [11]. Dabei ist die Zahl der Items mit 10 deutlich geringer als im Referenzverfahren (30 Fragen); der VRQOL bildet die stimmbezogene Lebensqualität in einem einzigen Wert ab [29]: Beide Gesichtspunkte steigern die Anwenderfreundlichkeit. Die Graduierung anhand der sozialen Funktionsfähigkeit belegt die inhaltliche Validität des VRQOL-Fragebogens – er misst eine für den Betroffenen relevante Dimension seines gesamten Selbsterlebens. Ob und inwieweit das graduierte VRQOL-Ergebnis das individuelle ärztliche Vorgehen leitet, wird sich im klinisch-praktischen Umfeld und v. a. nach Anwendungsstudien erweisen müssen. Auch die Nutzbarkeit des VRQOL-Fragebogens in der Onkologie, in Prävention und Rehabilitation muss vor einem abschließenden Urteil zunächst erprobt werden. Deshalb und vor dem Hintergrund des sich rasant verändernden Gesundheitssystems können die Ergebnisse der Studie somit allenfalls als „vorläufig abschließend“ angesehen werden.