Im Zuge stetiger technischer Verbesserungen bei der Diagnostik der Stimme kann heute eine standardisierte und differenzierte Stimmanalyse durchgeführt werden. Im Jahre 2001 wurde von der European Laryngological Society (ELS) hierfür ein Protokoll erstellt, welches die Stimmdiagnostik auf 3 wesentliche Säulen stellt: die Selbsteinschätzung des Patienten, die akustische Einschätzung durch den Behandler sowie die apparative Diagnostik [2]. In der apparativen Diagnostik kommen visuelle Verfahren wie die Laryngostroboskopie, akustische Verfahren zur Messung von Perturbationsparametern und Signal-Rausch-Analysen sowie aerodynamische Verfahren wie die Spirometrie zur Anwendung (Tab. 1).

Tab. 1 Protokoll der Europäischen Laryngologischen Gesellschaft (ELS; [2]), Umsetzung am Freiburger Institut für Musikermedizin

Vergleichbare Untersuchungsprotokolle, in denen die Diagnostik in verschiedenen Ebenen durchgeführt wird, sind auch aus der Audiologie bekannt, in der sowohl Verfahren, die eine aktive Mitarbeit des Patienten erfordern, wie die Ton- und Sprachaudiometrie, als auch objektive Verfahren, wie die Messung otoakustischer Emissionen oder evozierter Hirnstammpotentiale, durchgeführt werden.

In der Literatur finden sich einige Untersuchungen zur Evaluation des ELS-Protokolls bei klinischen Stichproben. So konnten Dejonckere et al. [3] und Friedrich et al. [4] zeigen, dass sich insbesondere zur Evaluation phonochirurgischer Eingriffe der multivariate Ansatz des Protokolls als sinnvoll erweist. Auch bei Patienten mit hyperfunktioneller Dysphonie ließen sich schlechtere Einzelwerte im ELS-Protokoll gegenüber stimmgesunden Patienten erfassen [3].

Derzeitig liegen noch keine Daten zur Evaluation der Stimmen professioneller Sänger im Bereich der klassischen Gesangsausübung mit dem ELS-Protokoll vor. Bei dieser Patientengruppe mit spezifischen stimmlichen Leistungsanforderungen stellt sich die Frage, wie sich stimmliche Veränderungen in einer multivariaten Analyse wie dem ELS-Protokoll abbilden und wie das ELS-Protokoll sinnvoll für Diagnostik und Therapieindikationen bei professionellen Sängern eingesetzt werden kann.

Material und Methoden

In der vorliegenden Untersuchung wurden 17 professionelle, klassisches Repertoire singende Sopranistinnen (Alter: 21–49 Jahre, Mittelwert 29,9 Jahre) untersucht. Bei allen Sängerinnen wurde der Stimmbefund nach dem Protokoll der ELS erhoben [2].

Hierzu wurde an unserem Institut das ELS-Protokoll wie folgt standardisiert umgesetzt (vgl. Tab. 1): Die Bildgebung erfolgte mit dem Mediastroboscope der Fa. Atmos, Lenzkirch. Sowohl das Sprechstimmfeld als auch das Singstimmfeld wurde mit der Software Ling Waves der Fa. LingCom, Forchheim, erhoben. Hierzu wurde bei jeder Sängerin ein Abstand zum Schalldruckpegelmesser von 30 cm eingehalten. Die Bestimmung der maximalen Tonhaltedauer wurde mit dem Vokal /a/ im Modalregister durchgeführt. Hierbei wurde in einer für die jeweilige Probandin angenehmen Tonlautstärke und mittlerer Tonhöhe phoniert. Aus diesen Maßzahlen wurde unter Einbeziehung der unten genannten Jitterbestimmungen der Dysphonia-Severity-Index (DSI) nach Wuyts et al. errechnet [15].

Die erste Bestimmung des Jitters (Angaben in %) mit Bestimmung des Shimmers sowie der Harmonic-to-Noise-Ratio (HNR) erfolgte aus kombinierter Ableitung von elektroglottographischem und akustischem Signal mit dem Laryngographen (Fa. Laryngograph, London) nach den Angaben des Herstellers. Die Phonation erfolgte hierbei auf dem Vokal /a/ in angenehmer Tonlautstärke und mittlerer Tonhöhe im Modalregister.

Zur weiteren Jitterbestimmung wurde auch ein Göttinger Heiserkeitsdiagramm angefertigt [5]. In diesem Diagramm können Jitter, Shimmer und die Glottal-to-Noise-Excitation-Ratio (GNE) in verschiedenen Vokal- und Frequenzkonditionen auch graphisch dargestellt werden.

Die doppelte Bestimmung des Jitters erfolgte zum einen wegen unterschiedlicher Bestimmungsmethoden (akustisch und elektroglottographisch), zum anderen konnte durch die Arbeitsgruppe von Smits et al. gezeigt werden, dass Jitterbestimmungen durch unterschiedliche Systeme nicht gut miteinander vergleichbar waren [13]. Für die Analyse des Heiserkeitsdiagramms wie auch für die Analyse mit dem Laryngographen wurde mittels eines Headsets ein Mikrophonabstand zum Mund von 3 cm am Mundwinkel eingehalten, um den Einfluss von Turbulenzen auf das Signal zu minimieren.

Die Bestimmung der mittleren Sprechstimmlage erfolgte durch elektroglottographische Analyse der Grundfrequenz beim Lesen eines normierten Textes („Der Nordwind und die Sonne“). Zur Berechnung der Vitalkapazität und der Ein-Sekunden-Ausatemkapazität wurde eine Spirometrie mit dem ZAN-100-Gerät der Fa. ZAN, Oberthulba, durchgeführt.

Zur subjektiven Einschätzung der eigenen Stimme wurde eine Bestimmung nach dem Voice-Handicap-Index (VHI) in der validierten deutschen Adaptation von Nawka durchgeführt [9]. In diesem Index werden 30 Fragen zur Befindlichkeit hinsichtlich der Stimmfunktion mit einer Skalierung von 0 (gute Befindlichkeit) bis 4 (maximale Einschränkung) durch den Patienten bewertet, sodass ein Maximalwert von 120 Punkten bei maximaler Einschränkung der Stimmfunktion erreichbar ist.

Eine perzeptive Einschätzung der Stimme durch den Untersucher erfolgte durch das Schema der Rauigkeit, Behauchtheit und Heiserkeit (RBH; [8, 11]) anhand der Singstimme in angenehmer Lautstärke und mittlerer Stimmlage.

Die statistische Auswertung der Daten erfolgte multivariat mit dem MANOVA-Test (allgemeines lineares Modell). Die univariate Varianzanalyse wurde mit dem ANOVA-Test bzw. Student-t-Test durchgeführt. Das Signifikanzniveau wurde auf 95% angesetzt.

Ergebnisse

Die diagnostischen Befunde des ELS-Protokolls sowie die Therapie bei den 17 untersuchten Sängerinnen sind in Tab. 2 dargestellt. Hier sind die Werte der Selbsteinschätzung der Sängerinnen (VHI), die Bewertung der Untersucher (RBH-Schema) sowie die Untersuchungsbefunde der Laryngostroboskopie zusammengefasst.

Tab. 2 Aufstellung der Sängerinnen mit ihren jeweiligen Befunden

Veränderungen der Stimmlippen in der Stroboskopie wiesen 6 Sängerinnen auf, ohne dass eine subjektiv evaluierbare Heiserkeit in der Singstimme mittels Perzeption (H-Wert) oder eine verschlechterte subjektive Selbsteinschätzung im VHI nachweisbar waren. Interessanterweise fand sich bei 4 dieser 6 Sängerinnen ohne Erhöhung des H-Wertes in der Singstimme eine diskret belegte Stimme in der Sprechstimmfunktion.

Ein typischer Stimmlippenbefund einer Sängerin (Probandin 13) mit Phonationsverdickungen ohne subjektive oder perzeptiv nachweisbare Stimmprobleme ist in Abb. 1 dargestellt. Bei dieser Sängerin rollte sich der breitbasige Befund vollständig in der Phonation ab und strich sich in Respirationsstellung wieder aus, ein Befund, welcher nach Seidner u. Wendler als „funktionelle Phonationsverdickung“ bezeichnet wird [12]. Sehr ähnliche stroboskopische Befunde zeigten sich auch bei den Sängerinnen 14, 15 und 16 (Tab. 2).

Abb. 1
figure 1

Indirekte Laryngostroboskopie. Beidseitig breitbasige funktionelle Phonationsverdickungen in Phonationsstellung der Stimmlippen bei Beginn der Schlussphase (Probandin 13)

Hinsichtlich sichtbarer Stimmlippenveränderungen in der Stroboskopie waren zwar Unterschiede in den Messwerten des ELS-Protokolls vorhanden, jedoch erreichten diese Unterschiede weder eine statistische Signifikanz noch eine statistische Tendenz in der univariaten Auswertung (p-Wert ≤0,05 bzw. ≤0,1; Tab. 3). Sängerinnen mit einer funktionellen Phonationsverdickung zeigten geringere Werte im VHI und RBH-Schema (Tab. 2). Für eine sinnvolle statistische Unterscheidung der Gruppen von Probandinnen mit funktionellen gegenüber nichtfunktionellen Phonationsverdickungen war zum jetzigen Zeitpunkt jedoch das Kollektiv (n=6 bzw. n=4) zu klein.

Tab. 3 Mittelwerte und Standardabweichungen der gemessenen Parameter bei Sängerinnen mit und ohne stroboskopisch sichtbare Veränderungen

Vergleicht man die Übereinstimmung der Befunde zwischen Selbsteinschätzung, Untersuchereinschätzung und apparativ begründeten Messwerten, zeigen sich hierbei die in Tab. 4 aufgezeigten Unterschiede. So war bei Patienten mit einem VHI ≥ 15 Punkten eine signifikante Erniedrigung der maximalen Phonationszeit (p=0,042) wie auch des DSI (p=0,044) mit Einbeziehung des Jitter aus der elektroglottographischen Messung nachweisbar. Eine statistische Tendenz zeigte sich auch für eine Einschränkung in der Singstimmdynamik (p=0,077).

Tab. 4 Mittelwerte der apparativ gemessenen Parameter des ELS-Protokolls hinsichtlich bestehender Einschränkungen im VHI und Gesamtheiserkeit

Ähnliche Unterschiede waren auch hinsichtlich der akustischen Beurteilung der Stimmfunktion durch den Untersucher sichtbar. Hier fanden sich statistisch signifikante Einschränkungen des Frequenzspektrums der Singstimme (p=0,019) und des DSI (p=0,003) bei den Sängerinnen mit einem H-Wert von ≥1, wobei eine statistische Tendenz auch hinsichtlich einer Verkürzung der Tonhaltedauer nachweisbar war (p=0,059; Tab. 4).

Im Falle einer Sängerin (Probandin 17) fand sich in der Stroboskopie der Befund einer Stimmlippenzyste (Abb. 2 a) bei gleichzeitiger Erhöhung der Rauigkeit in der Untersuchung durch den Behandler (RBH-Schema, Tab. 2). In der Selbsteinschätzung im VHI schlug sich diese Stimmeinschränkung trotz von der Patientin wahrgenommener Symptomatik interessanterweise jedoch nicht nieder (VHI=0). Aufgrund der vorliegenden Befunde wurde die Patientin operiert. Der positive postoperative Verlauf (Abb. 2 b) bestätigte die Richtigkeit des diagnostischen und therapeutischen Vorgehens. Sowohl der DSI (3,8 vs. 5,9), der Jitter (0,95 vs. 0,35) als auch die Werte des RBH-Systems (1-0-1 vs. 0-0-0) zeigten bei der Patientin postoperativ deutlich verbesserte Werte.

Abb. 2
figure 2

Indirekte Laryngostroboskopie. a Präoperativer Befund mit Stimmlippenzyste, b postoperativer Befund 14 Tage nach dem mikrochirurgischen Eingriff

Diskussion

In der vorliegenden Arbeit zeigen wir erstmalig die Anwendung des Protokolls der ELS bei professionellen Sängerinnen. Besonderes Interesse lag hierbei auf der Frage, inwiefern sich sichtbare Veränderungen in der Stroboskopie in der subjektiven Einschätzung durch die Sängerinnen und in der akustischen Beurteilung durch den Untersucher niederschlagen. Die vorliegende Arbeit verdeutlicht hierbei, dass ein auffälliger Befund in der Stroboskopie nicht notwendigerweise mit stimmlichen Beschwerden einhergehen muss.

Gleichzeitig zeigen unsere Untersuchungen, dass apparativ erhobene Parameter des ELS-Protokolls wie der DSI oder die Tonhaltedauer sehr gut mit Verschlechterungen der Stimmfunktion in der Wahrnehmung der Sängerinnen bzw. der akustischen Beurteilung durch den Untersucher übereinstimmen. Dies spricht dafür, dass professionelle Sängerinnen eine hohe und valide Selbsteinschätzung ihrer stimmlichen Leistungsfähigkeit besitzen, welche auch der Beurteilung des sängerisch erfahrenen HNO-Arztes sowie der standardisierten Stimmfunktionsuntersuchung entspricht.

Bei professionellen Sängerinnen handelt es sich um Patientinnen, die ähnlich Hochleistungssportlern hohen Anforderungen genügen müssen. Kleinste Einschränkungen der stimmlichen Leistungsfähigkeit können in Arbeitsunfähigkeit münden. Die tägliche professionelle Belastung der Phonationsorgane führt häufig zu Zeichen einer Beanspruchung der Stimmlippen, die nicht zwingend zu einer Minderung der gesanglichen Leistungsfähigkeit führen müssen. Ähnlich einem Hochleistungssportler, dessen muskuloskelettaler Apparat im Regelfall im Laufe seiner Karriere nicht ohne morphologische Veränderungen bleibt, sehen wir bei professionellen Sängerinnen häufig in der Stroboskopie morphologische Veränderungen im Kehlkopf.

Wichtig in der Beurteilung dieser Befunde scheint daher die Feststellung, ob solche Veränderungen zur Stimmverschlechterung bzw. Einschränkung der subjektiven stimmlichen Leistungsfähigkeit führen. Die vorliegenden Daten bei den von uns untersuchten professionellen Sängerinnen zeigen, dass sich die Ergebnisse funktioneller Messungen im ELS-Protokoll hinsichtlich des Vorliegens einer sichtbaren Veränderung in der Stroboskopie nicht signifikant unterscheiden.

Statistische Aussagekraft

Die Fallzahl von 17 Patientinnen ist recht klein, sodass hinsichtlich möglicher Unterschiede nur eine begrenzte statistisch nachweisbare Aussagekraft zu erwarten war. Deswegen muss auf metrisch begründete Limitationen unserer Ergebnisse hingewiesen werden. Es handelt sich um eine zufällig ausgewählte klinische Stichprobe, sodass merkmalsbezogene Gruppenbildungen nur eingeschränkt möglich waren. Gerade die Frage, ob sich die Untergruppen von Probandinnen mit funktionellen und nichtfunktionellen Phonationsverdickungen in den Werten des ELS-Protokolls unterscheiden, musste anhand der vorliegenden Fallzahlgröße derzeitig unbeantwortet bleiben.

In der statistischen Betrachtung der Ergebnisse wurde generell davon ausgegangen, dass kleine bis maximal mittlere Effekte zu beobachten sind. Für eine multivariate Auswertung, die probatorisch keine signifikanten Unterschiede zeigte und bei der keine Cluster zu differenzieren waren, war die Stichprobengröße in der vorliegenden Untersuchung zu klein. Nach Poweranalyse hätte es einer Fallzahl von etwa 100 Patienten bedurft, welche bei der differenzierten Fragestellung und dem besonderen Patientenkollektiv in einem angemessenen Zeitintervall nur schwer zu erreichen wäre. Deswegen wurde eine univariate Auswertung durchgeführt, der insofern Bedeutung zukommt, als dass diese zwar mit gebotener Vorsicht zu interpretieren ist (α-Fehler-Inflationierung), signifikante Ergebnisse und Tendenzen jedoch angesichts kleiner Effekte von Aussagekraft sein können.

Bei einzelnen Parametern des ELS-Protokolls kam es zu größeren individuellen Unterschieden unabhängig vom stroboskopischen Befund. Dieses unterstreicht, dass die Beurteilung der Stimmfunktion individuell zu erfolgen hat und dass gerade bei professionellen Stimmbenutzern eine möglichst multivariate Diagnostik, wie sie das ELS-Protokoll vorsieht, erforderlich ist, um die Bandbreite stimmlicher Funktionsaspekte zu erfassen. Eine rein visuelle Stimmdiagnostik anhand der Untersuchung durch Stroboskopie oder Echtzeitkamera würde gerade bei professionellen Sängern nicht ausreichen und zu Fehlinterpretationen mit der Gefahr falscher Therapieindikationen führen.

Selbsteinschätzung

Die wichtige Erfassung der subjektiven Einschätzung ermöglicht als standardisiertes Messinstrument der VHI, welcher auch in deutschsprachiger validierter Adaptation durch Nawka vorliegt [9]. Insgesamt zeigt der VHI in unserer Untersuchung eine gute Anwendbarkeit. Patientinnen mit erhöhten Werten im VHI zeigten auch erhöhte Werte im DSI. Trotz guter Ergebnisse bei dem Großteil der Patientinnen zeigte der VHI allerdings in unserem hochspezialisierten Patientenkollektiv auch Limitationen.

Die Tatsache, dass Stimmbeschwerden lediglich in Hochleistungssituationen auf der Bühne auftraten, führte bei einer Patientin mit einer Stimmlippenzyste zu Normwerten im VHI, obwohl ihre stimmliche Einschränkung so groß war, dass sie ihren Beruf als Opernsängerin nicht ausüben konnte. Bei anderen Sängerinnen scheint die Besorgnis um die Stimme bei vollständig normalem Schwingungsablauf in der Stroboskopie und trotz einer normalen Einschätzung der Stimme durch den Untersucher derartig ausgeprägt, dass sehr hohe Werte im VHI angekreuzt wurden (vgl. Patientin 4 und 5, Tab. 2). Zwar liegt mittlerweile mit dem SVHI eine Adaptation des VHI an die Gesangsstimme im Englischen und Französischen vor, eine Validierung im deutschen Sprachraum steht jedoch noch aus. Für die Zukunft könnte dieses Messinstrumentarium nach erfolgter Validierung jedoch gerade bei diesem hochspezialisierten Patientengut Anwendung finden [1, 7].

Fremdeinschätzung

Neben der Selbsteinschätzung der Patienten scheint die Einschätzung durch den Untersucher wichtig. Im mitteleuropäischen Raum hat sich hierzu die Anwendung des RBH-Schemas durchgesetzt [8, 11]. Unsere Daten zeigen, dass eine Erhöhung der Gesamtheiserkeit im RBH-Index auch mit signifikanten Änderungen hinsichtlich des DSI verbunden war. Dieser Wert wird aus den Werten der maximalen Tonhaltedauer, der minimalen Intensität, der maximalen Frequenz sowie dem Jitter berechnet und konnte in mehreren Studien in befriedigendem Maße die Güte des Heiserkeitsmaßes reflektieren [6, 14, 15]. Gleichwohl zeigte sich aber auch, dass es durchaus bei einem H-Wert von 0 in der Singstimme zu einer belegten Sprechstimme kommen kann. Vermutlich können gerade professionelle Sängerinnen durch Resonanzstrategien oder laryngeale Koordination die Belegtheit der Sprechstimme in der Gesangsstimme ausgleichen. Es ist daher in der Praxis wichtig, beide Stimmfunktionen, die Sing- und die Sprechstimmfunktion, in die Diagnostik mit einzubeziehen.

Objektive Befunde

Durch die weitere apparative Diagnostik sollen objektivierbare Ergebnisse durch Bestimmungen der Perturbationsparameter Jitter und Shimmer gewonnen werden. Untersuchungen anderer Arbeitsgruppen zeigten eine Korrelation dieser Werte mit der Rauigkeit einer Stimme [10]. Unsere Daten jedoch konnten weder hinsichtlich sichtbarer Stimmlippenveränderungen oder einer Erhöhung des VHI-Wertes noch einer nachweisbaren Heiserkeit im RBH-Schema signifikante Änderungen der Werte nachweisen, die die Perturbation des akustischen Signals messen. Sicherlich ist jedoch zum Nachweis signifikanter Änderungen des R-Wertes des RBH-Schemas unser Kollektiv (n=3 für R≥1) zu klein. Hier sind Untersuchungen an größeren Kollektiven wünschenswert. Gleiches gilt auch für Werte wie HNR oder GNE, die verschiedene Relationen zwischen Signal und Rauschen widerspiegeln.

Therapiebedarf

Die Tatsache, dass viele der untersuchten Patientinnen in der Stroboskopie optisch auffällige Befunde hatten, schafft unserer Auffassung nach noch keine Therapienotwendigkeit. Lediglich bei gleichzeitigem Vorliegen eines Funktionsdefizits oder bei längerfristigen Leistungseinbußen kann von einer Notwendigkeit zur Therapie ausgegangen werden. Neben operativen Verfahren stehen hierbei pharmakotherapeutische, gesangspädagogische, logopädische, physiotherapeutische oder auch psychotherapeutische Verfahren zur Verfügung.

Eine Therapie, unabhängig davon ob mono- oder multifaktoriell, sollte – v. a. bei professionellen Stimmbenutzern – den Beschwerden der Patienten angepasst werden. Hierbei ist eine engmaschige Kontrolle der Patienten für die Therapieplanung und Therapiekontrolle von großer Bedeutung. Nicht selten zeigen auch ausgeprägte Befunde eine hohe Variabilität und Veränderbarkeit im zeitlichen Verlauf. So können sich insbesondere Epithelverdickungen auch unter konservativen Maßnahmen und einer Optimierung der Phonationstechnik rasch zurückbilden.

Fazit für die Praxis

Bei der Betreuung von professionellen Sängerinnen sollte aufgrund der Komplexität stimmlicher Anforderungen eine multivariate Stimmdiagnostik erfolgen. Das ELS-Protokoll scheint nach unserer Auffassung durch die Evaluation der Selbsteinschätzung, der Einschätzung des Untersuchers und apparativer Diagnostik inklusive Stroboskopie, akustischer Analysen und aerodynamischer Parameter hierfür sehr gut geeignet. Hierdurch kann die Therapieindikation auf eine sichere Basis gestellt werden. Phonationsverdickungen müssen nicht notwendigerweise den Phonationsablauf dergestalt stören, dass die betroffenen Sängerinnen Beschwerden haben oder in ihren messbaren Stimmleistungsparametern eingeschränkt sind. Für eine Entscheidung, ob eine operative Therapie notwendig ist, sollte also in keinem Fall der stroboskopische Befund allein ausschlaggebend sein. Vielmehr sollten immer auch Stimmgüteparameter wie perzeptive und aparative Befunde sowie die Selbsteinschätzung der Patientinnen für eine solche Entscheidung herangezogen werden.