Nach der Definition der Union Europäischer Phoniater ist „die Heiserkeit [...] eine ausschließlich durch anatomische Veränderungen der Stimmlippen, durch Ungleichmäßigkeiten der Stimmlippenränder, durch die Irregularität der Stimmlippenschwingungen oder durch Insuffizienz des Stimmritzenschlusses zustande gekommene pathologische Klangveränderung der Stimme, die im akustischen Bild durch Aperiodizität der Grundfrequenz und der harmonischen Obertöne bzw. durch Turbulenzgeräusche charakterisiert ist“ (zit. n. [25]).

Zu dieser Definition ist anzumerken, dass anatomische Veränderungen der Stimmlippen und Ungleichmäßigkeiten der Stimmlippenränder als ursächliche, ätiologische Kriterien aufzufassen sind, und Irregularitäten der Stimmlippenschwingungen und Insuffizienzen des Stimmritzenschlusses die Pathogenese sowohl organischer als auch funktioneller Ursachen der Heiserkeit kennzeichnen.

Kriterien der Stimmqualität

Unabhängig von einer solchen Diskussion ist „Heiserkeit“ ein Merkmal für die Stimmqualität. Sie ist relativ einfach auditiv wahrnehmbar und klassifizierbar [1]. Von Isshiki u. Takeuchi [17] wurde vorgeschlagen, zwischen den auditiv unterscheidbaren Komponenten der Heiserkeit, nämlich Rauigkeit, Behauchtheit, Asthenie und Grad der Heiserkeit, zu unterscheiden. Takahashi u. Koike [36] kamen dagegen aufgrund ihrer Untersuchungen zu dem Schluss, dass die Begriffe „rau“, „behaucht“, „asthenisch“ und „Grad der Heiserkeit“ willkürlich gewählt und irreführend seien.

In Japan und im US-amerikanischen Raum hat sich trotzdem die GRBAS-Skala [8, 12, 13, 14, 15, 16] durchgesetzt: G: „overall grade or degree“ (Grad der Heiserkeit), R: „rough“ (Rauigkeit), B: „breathy“ (Behauchtheit), A: „asthenic“ (Asthenie), S: „strained quality“ (Spannung).

In einer Untersuchung von Nawka, in der eine Hörergruppe normale und gestörte Stimmen nach der GRBAS-Skala zu beurteilen hatte, stellte sich vor allem die Qualität asthenisch (A) in der praktischen Verwendung als problematisch heraus. Sie korrelierte in hohem Maße mit dem Eindruck der Behauchtheit (B), sodass sie nicht als autonome Beurteilungsdimension angesehen werden konnte; ebenso streuten die Hörerurteile zur „Spannung“ im Gegensatz zu denen der übrigen 3 Qualitäten stark [27].

Für die auditive Einschätzung der Heiserkeit hat sich die Beschränkung auf 3 Qualitäten als praktikabel erwiesen [1]: R: Rauigkeit; B: Behauchtheit; H: Heiserkeit. Die Ausprägung dieser Merkmale wurde auf 4 Grade von 0–3 verteilt. Dabei steht der Wert 0 für normal, 1 für geringgradig, 2 für mittelgradig und 3 für hochgradig. Auf diese Weise wurden sehr gut übereinstimmende Hörerurteile gewonnen, die auch nach langen Zeiträumen gut reproduzierbar waren.

Eine Studie, in der 11 Gruppen aus 3 Ländern mit unterschiedlicher professioneller Erfahrung in der Stimmbeurteilung den Grad der Heiserkeit (G, im Deutschen mit H für Heiserkeitsgrad oder Gesamtheiserkeitsgrad benannt) zu bewerten hatten, zeigte sich eine weitgehende Übereinstimmung der Urteile von professionell geschulten Hörern und Laien sowie Beurteilern unterschiedlicher Nationalität [40].

Zur Problematik von Stimmaufnahmen

Typischerweise wird die Heiserkeit einer Stimme während fortlaufender Sprache bestimmt. Darin sind die Vokale erheblich kürzer (50–300 ms) und durch Transienten eingefasst. Die auditive Beurteilung ist bei einer Unterteilung in 4 Grade ausreichend differenziert, um Unterschiede zu erfassen, die durch externe Kriterien (z. B. vor und nach Therapie) definiert werden. Untersuchungen der Sprechstimme vor und nach stimmverbessernden Operationen haben gezeigt, dass statistisch eine hochsignifikante Verbesserung des Stimmklangs postoperativ erzielt wurde, wenn als Bewertung die auditive Heiserkeitsklassifizierung zugrunde lag. Die akustischen Analysen von Jitter und Shimmer der Grundfrequenz der Sprechstimme wiesen dagegen eine weit weniger deutliche Verringerung als erwartet auf [28].

Die Stimmproben der gehaltenen Phonation von Vokalen eignen sich bei ausreichender Dauer (mindestens 2–3 s) sehr gut für Periodizitätsanalysen, die Bewertung der Heiserkeit ist aber besonders vom Anlaut geprägt. Die auditive Einschätzung der Heiserkeit von Sprechstimme und Vokal wird deshalb nur vergleichbar, wenn der gesamte Vokal mit Anlaut bewertet wird [33, 34]. Die fortlaufende Sprache eignet sich somit besser zur Heiserkeitsbeurteilung [11].

In der phoniatrischen Routine werden typischerweise zur auditiven Stimmeinschätzung phonetisch ausbalancierte Standardtexte verwendet, die laut gelesen und aufgenommen werden.

Der hier verwendete Text „Der Nordwind und die Sonne“(ÄsopFootnote 1-Fabel) ist als Standardtext — auf der Grundlage von Empfehlungen der Arbeitsgruppe Akustik in der Union der Europäischen Phoniater (UEP) — in der phoniatrischen Praxis allgemein bekannt und akzeptiert [4]. Es handelt sich um eine Kurzgeschichte mit 109 Wörtern. Sie erfordert eine durchschnittliche Lesezeit von etwa 45 s.

Ziele der Arbeit/Hypothesen

Ziel der Arbeit war es, die Zuverlässigkeit im Sinne der Interrater-Reliabilität der auditiven Einschätzung der Stimmqualität durch die 3 Kategorien Rauigkeit, Behauchtheit und Gesamtheiserkeit (RBH-Skala) an Stimmproben mit fortlaufender Sprache zu überprüfen. Nicht überprüft werden sollte die Intrarater-Reliabilität oder die Validität.

Es wurde, im Gegensatz zu anderen Studien, bei denen gehaltene Vokale untersucht wurden (z. B. [19, 22]), bewusst eine Leseprobe gewählt, um eine hohe Realitätsnähe zu den alltagsrelevanten Stimmanforderungen zu gewährleisten.

In dieser Studie wurde anhand der Textaufnahmen von 78 Patienten die Reliabilität der RBH-Bewertung durch 19 Beurteiler berechnet.

Es wurde angenommen, dass trotz fehlender quantitativer Definitionen die Heiserkeit ein Merkmal der Stimme ist, das auditiv übereinstimmend wahrgenommen und ordinal skalierbar eingeschätzt werden kann.

Es sollte überprüft werden, ob es Einzelbeurteilungen gibt, die vom gemittelten Wert aller anderen Bewertungen so abweichen, dass sie als „Ausreißer“ gewertet werden müssen.

Material und Methoden

Studientyp

Experimentelle Reliabilitätsstudie; verblindete Bewertung von aufgezeichneten Stimmproben; Berechnung des gemittelten Gruppenurteils; Berechnung des α-Koeffizienten, Berechnung der Reliabilitäts-Gesamt-Item-Statistik.

Stichprobe

Für die Untersuchung wurden Stimmproben von Patienten, die sich in der Zeit von Januar 2004–März 2004 in der Abteilung Phoniatrie/Pädaudiologie vorstellten, verwendet. Die Stimmen wurden im Rahmen von Routineuntersuchungen für die Diagnostik aufgezeichnet. Kam ein Patient mehrfach während dieses Zeitraums zur Untersuchung, wurde jeweils nur die erste Stimmprobe verwendet.

Es handelt sich um 21 männliche und 57 weibliche Patienten im Alter von 12,2–89,2 Jahren (Altersverteilung s. Abb. 1).

Abb. 1
figure 1

Altersverteilung der untersuchten Patienten

Die Auswahl der Stimmproben sollte möglichst realitätsnah sein, deshalb wurde bewusst eine querschnittliche Auswahl über einen definierten Zeitraum gewählt und keine weitere Selektion vorgenommen. Somit wurden einerseits gestörte Stimmen, andererseits auch „normale“ Stimmen (z. B. Nachuntersuchungen nach erfolgreich abgeschlossener Therapie) inkludiert.

Folgende klinische Diagnosen wurden gestellt:

Ödeme::

Reinkeödem bds. 3×

Randkantenödem 1×

Paresen::

Rekurrensparese links 8×

Rekurrensparese rechts 15×

Rekurrensparese beidseits 2×

Gutartige Tumoren, Pseudotumoren::

Raumforderung der Stimmlippe rechts 1×

Stimmlippenpolyp 6×

Stimmlippenzyste 1×

Stimmlippenknötchen 3×

Stimmlippengranulom 1×

Papillomatose 1×

Entzündungen::

Laryngitis 7×

Zentrale Bewegungsstörungen::

Spasmodische Dysphonie 2×

Balbuties 3×

Sonstige zentrale laryngeale Bewegungsstörung 1×

Funktionelle Dysphonie::

Dysphonie ohne erkennbares morphologisches Korrelat 23×

Datenmaterial/Aufzeichnung

Für die Off-line-Untersuchung wurde nur die aufgezeichnete Leseprobe „Der Nordwind und die Sonne“ verwendet.

Die Aufzeichnungen erfolgten mit dem Laryngograph-System bzw. dessen Systemkomponenten. Insbesondere wurde das mit dem Laryngograph-System mitgelieferte Headset-Mikrophon verwendet und generell auf einen Mund-Mikrophon-Abstand von 10 cm eingestellt. Auf die Verwendung eines höherwertigen Mikrophons wurde bewusst verzichtet, um bei den Auswertungen möglichst praxisnahe Bedingungen zu haben.

Auditive Stimmbewertung

Die auditive Beurteilung der nicht verwürfelten Stimmproben erfolgte durch 19 Studenten des Studiengangs Logopädie der Europa-Fachhochschule Fresenius in Idstein. Die Studenten wurden im Rahmen des regulären Unterrichts im Fach Stimme mit den theoretischen Hintergründen und dem veröffentlichen Audiomaterial des RBH-Systems [26] vertraut gemacht. An einem separaten, späteren Termin wurden die zu beurteilenden Stimmproben im Unterrichtsraum durch eine hochwertige Audioanlage dargeboten. Die Studenten hatten ihre Beurteilungen in einem Antwortbogen einzutragen. Sie wurden instruiert, jeweils alle 3 Stimmqualitäten gemäß ihrem auditiven Eindruck auf einer Skala von 0–3 zu beurteilen.

Obwohl den Studenten die RBH-Konvention, nach der die Heiserkeit nicht geringer bewertet werden soll als die Rauigkeit oder Behauchtheit, aus dem Unterricht bekannt war, wurde diese Konvention zum Zeitpunkt der Untersuchung nicht wiederholt, sondern stattdessen betont, dass die Beurteilung ohne weiteres Nachdenken rein auf Grundlage des Wahrnehmungseindruckes zu erfolgen hatte. Ein vergleichbares Verfahren, bei dem die rein auditive Beurteilung ohne bewusstes Beachten der RBH-Konvention zugrunde lag, wurde bereits in einer Reihe von Stimmuntersuchungen am Institut für Phonetik und Phonologie der Universität des Saarlandes verwendet [18, 30, 31]. Die Studenten wurden nicht über die Diagnosen bzw. den klinischen Status informiert.

Statistik

Für die auditiven Bewertungen wurde die Interrater-Realiabilität nach Cronbach-α geprüft. Dann wurde die Korrelation (Rangkorrelationskoeffizient nach Spearman) zwischen den Subskalen ermittelt und die Gesamt-Item-Statistik berechnet.

Die Auswertung erfolgte durch das Statistikprogramm SPSS (Statistical Package for Social Sciences, Version 12.0).

Datenschutz

Die durchgeführte Untersuchung orientiert sich hinsichtlich des Datenschutzes an den rechtlichen Grundsätzen und Empfehlungen, die vom Berliner Datenschutzbeauftragten für den Bereich „Bildung und Wissen“, insbesondere empirisch-medizinische Sozialforschung und epidemiologische Studien im universitären Bereich, ausgearbeitet wurden (vgl. zur aktuellen Fassung: DatenSchutzWebIndex, über: http://www.datenschutz-berlin.de).

Ergebnisse

Interrater-Reliabilität

Die Interrater-Reliabilität für den Rauigkeits-, den Behauchtheits- sowie für den Gesamtheiserkeitsgrad ergab ein Cronbach-α von 0,938 für die R-Werte, von 0,961 für die B-Werte und von 0,924 für die H-Werte.

Die Gesamt-Item-Statistik (Tabelle 1) zeigte eine hohe Übereinstimmung der verschiedenen Urteile. Lediglich bei der Heiserkeitsbewertung ergaben sich 2 “Ausreißer“, H6 und H10. Würde man diese Urteile nicht berücksichtigen, hätte sich Cronbach-α noch verbessert.

Tabelle 1 Korrelationen zwischen den gemittelten Werten der auditiven Bewertung von Rauigkeit R, Behauchtheit B und Heiserkeit H

Korrelationsanalysen

Bei der Berechnung des Korrelationskoeffizienten Spearman-ρ ergaben sich signifikante Zusammenhänge zwischen allen gemessenen Variablen (gemittelte Werte, s. Tabelle 1). Hierbei lagen die Korrelationskoeffizienten für den gemittelten B-Wert mit dem gemittelten H-Wert relativ hoch (ρ=0,708). Rauigkeit und Behauchtheit korrelierten nur schwach (ρ=0,252).

RBH-Verteilung

Die Beurteiler haben die Urteile in den 3 Dimensionen nicht homogen abgegeben. Diesen Sachverhalt demonstrieren Abb. 2, Abb. 3 und Abb. 4. Je „höher“ die einzelnen Balken sind, desto „uneinheitlicher“ fielen die Urteile aus: So waren sich die Beurteiler für Patient Nr. 19 z. B. hinsichtlich der Rauigkeit sehr einig, während für Patient Nr. 17. offensichtlich die Meinungen zur Rauigkeit sehr unterschiedlich waren.

Abb. 2
figure 2

Darstellung der Mittelwerte der Rauigkeitsbeurteilungen ± Standardabweichung (durch die „-“ Abtragung ergeben sich auch die Werte kleiner 0). Je größer die Standardabweichung, desto weniger „einig“ waren sich die Beurteiler

Abb. 3
figure 3

Darstellung der Mittelwerte der Behauchtheitsbeurteilungen ± Standardabweichung

Abb. 4
figure 4

Darstellung der Mittelwerte der Heiserkeitsbeurteilungen ± Standardabweichung

Diskussion

Die auditive Stimmbewertung hat sich in der phoniatrischen Praxis als subjektives diagnostisches Verfahren seit Jahren international bewährt (z. B. [2, 5, 6, 29, 37, 39, 41]). Von verschiedenen Gruppen wurde die Zuverlässigkeit der Rauigkeits-, Behauchtheits- und der globalen Heiserkeitsbewertung betont (Tabelle 2, 3, 4). Eine Differenzialdiagnose, d. h. ein Rückschluss auf zugrunde liegende Erkrankungen wie z. B. die Unterscheidung zwischen entzündlichen und neoplastischen Veränderungen, war nicht möglich.

Tabelle 2 Gesamt-Item-Statistik für die Rauigkeitsbewertung
Tabelle 3 Gesamt-Item-Statistik für die Behauchtheitsbewertung. Das Gesamt-Cronbach-α lag bei 0,961
Tabelle 4 Gesamt-Item-Statistik für die Heiserkeitsbewertung. Das Gesamt-Cronbach-α lag bei 0,924

Reliabilitätsanalysen zeigten eine hohe Übereinstimmung zwischen verschiedenen Bewertungen, die von professionellen, aber auch von nichtprofessionellen Stimmbeurteilern abgegeben wurden. Allerdings muss eine 4-stufige Bewertung vorgenommen werden [39]. Auch die Übereinstimmung zwischen den Urteilen von professionellen versus nichtprofessionellen Stimmbeurteilern kann als zufriedenstellend bis sehr gut bezeichnet werden [3].

Visuelle Analogskalen

Eine stufenlose Unterteilung des Ausprägungsgrades wird auf visuellen Analogskalen (VAS) vorgenommen. Auch für diese Art der Stimmbeurteilung wurden sehr hohe Reliabilitätswerte gefunden. In einer Studie aus 3 Ländern (England, Dänemark, Deutschland) und 4 Zentren beurteilten 11 Personen den gleichen deutschen Text „Der Nordwind und die Sonne“ bei 156 Aufnahmen mit 142 verschiedenen Stimmen von deutschen Muttersprachlern. Cronbach-α lag bei 0,96 [7]. Interessant an dieser Arbeit ist, dass die dänischen und englischen Hörer die Heiserkeit in der für sie fremden deutschen Sprache genauso empfinden wie die deutschen. Trotz der hohen Übereinstimmung in dieser Untersuchung mit der VAS ist die einfachere Klassifikation in 4 Schweregrade vorzuziehen, weil sie besser mitteilbar ist.

Sehr viel kritischer sehen Kreiman u. Garratt die Reliabilität [9, 10, 19, 21, 22, 23, 24, 32] und sehen durch eine schlechte Reliabilität sogar die Validität gefährdet [20].

Die hier vorgestellten Daten bestätigen die hohe Interrater-Reliabilität: sie lag sowohl für die Rauigkeits-, Behauchtheits- wie die gesamte Heiserkeitsbewertung sehr hoch, obwohl bei einigen Stimmproben deutlich unterschiedliche Beurteilungen abgegeben wurden.

Dieser scheinbare Widerspruch liegt darin begründet, dass die Interrater-Reliabilität als Schätzwert für den unbekannten wahren Wert der Merkmale R, B und H den Mittelwert von allen Urteilen verwendet. Weiterhin ist für Cronbach-α charakteristisch, dass es ein adjustiertes Reliabilitätsmaß ist. Damit werden die unterschiedlichen Mittelwertstendenzen der einzelnen Beurteiler eliminiert [38].

Vergleicht man die hier vorgestellten Ergebnisse mit den Ergebnissen von Koreman et al. [18], die die Interrater-Reliabilität bei gehaltenen Vokalen untersuchten, kann geschlossen werden, dass die Beurteilungen von fortlaufender Sprache stärker als die von gehaltenen Vokalen übereinstimmen. Das stützt das Vorgehen von Nawka et al. [26, 27].

Hierbei trug jede Beurteilerin zu der hohen Reliabilität bei, d. h. es konnten lediglich bei der Heiserkeitsbeurteilung 2 “Ausreißer“ identifiziert werden.

Bewertung der Heiserkeit

Die Analyse der Einzeldaten zeigt allerdings auch, dass durch das hier eingesetzte methodische Vorgehen „Heiserkeit“ als eine eigene und den beiden anderen Stimmqualitäten gleichwertige perzeptuelle Kategorie und keine übergeordnete oder „kognitiv errechnete“ Kategorie erachtet wurde.

Ähnlich hierzu meinen Pützer et al. [31], dass Stimmen durchaus den auditiven Eindruck des Behauchtseins erwecken können, ohne zwangsläufig als heiser charakterisiert werden zu müssen. Sie diskutieren, dass die Dimension Heiserkeit nicht notwendigerweise als ein den beiden anderen Dimensionen „übergeordnetes Urteil“ und die beiden anderen Dimensionen als „untergeordnete Faktoren“ bei der Bewertung des Stimmklangs allgemein betrachtet werden müssen.

Die geringe Korrelation zwischen R und B weist darauf hin, dass es sich um unabhängig wahrnehmbare Komponenten der Heiserkeit handelt. Zu ähnlichen Ergebnisse kamen Koreman et al. [18]. Die hohe Korrelation der H-Werte mit den B-Werten deutet an, dass sich die Beurteiler bei der Bewertung des Gesamtheiserkeitsgrades am Behauchtheitsgrad orientiert haben. Für H wurde auch in dieser Studie kein Argument für eine unabhängige gleichrangige Bewertung erbracht. Die übergeordnete Kategorie Gesamteindruck der Heiserkeit H behält ihre Berechtigung.

Wie erwähnt, stehen die guten Reliabilitätswerte im Gegensatz zu den Ergebnissen von Kreiman u. Garrat (s. oben). Als Erklärung hierfür bieten sich einerseits an, dass Kreiman u. Garrat überwiegend die Phonation gehaltener Vokale untersuchten. Außerdem sahen auch wir das von dieser Arbeitsgruppe angesprochene Phänomen der offensichtlich sehr schwierig zu kategorisierenden Stimmen. Auch die Verwendung der statistischen Methode war unterschiedlich. Kreiman u. Gerrat bestimmten den Intraklassenkorrelationskoeffizient für mehrere Beurteiler über eine zweifaktorielle Varianzanalyse [35]. Dieser unjustierte Wert registriert intraindividuell verschobene Maßstäbe (ein Beurteiler urteilt regelmäßig strenger als der andere) als Zeichen für fehlende Übereinstimmung.

Bei Betrachtung der Werte fällt auf, dass deutlich die Hälfte der Mittelwerte unter dem Wert 1 und nur sehr wenige Mittelwerte über dem Wert 2 liegen. Dies ist deshalb überraschend, weil es sich um Stimmproben von Patienten handelte, bei denen auch stärkere Heiserkeitsgrade vorliegen können. Eine Erklärung ist, dass „naive“ Beurteiler eher zu „konservativen“ Bewertungen mit Mittentendenz neigen. Unabhängig von der absoluten Einstufung in die Grade 0, 1, 2 oder 3, zeigt jedoch die hohe Interrater-Reliabilität, dass die Schweregrade der Heiserkeit und ihrer beiden bewerteten Komponenten differenziert werden konnten.

Stichprobenauswahl

Zu den hier vorgelegten Daten kann kritisch angemerkt werden, dass es sich nicht um Stimmproben handelte, die über alle „Schweregrade“ von R, B und H gleichmäßig verteilt waren, also für jede Kategorie von R, B und H je 20 Stimmproben. Eine solche Stichprobe auszuwählen, ist allerdings unrealistisch, weil es kein Außenkriterium gibt — und somit auch keine Verifizierung möglich ist, dass „richtig“ ausgewählt wurde. Alternativ hätte man eine Stichprobe nehmen können, bei der als „Außenkriterium“ für die „Richtigkeit“ der Einstufung eine allgemein akzeptierte subjektive Beurteilung vorliegt. Dies hätte allerdings durch die Selektion an sich kaum den klinischen Alltag widergespiegelt.

Weiterhin könnte kritisch angemerkt werden, dass die Stimmproben nicht verwürfelt dargeboten wurden und somit ein Sukzessivkontrast nicht ausgeschlossen werden kann. Hierzu kann allerdings entgegnet werden, dass die Stimmproben chronologisch nach Besuchstermin in der Klinik „geordnet“ waren, also keinesfalls nach Stimmqualitätskriterien. Der zweifellos vorhandene Sukzessivkontrast führt zu einem systematischen Fehler, der allerdings die Interrater-Realiabilität nicht beeinflusst.

Die „anchor stimuli“, wie von Gerrat u. Kreiman beschrieben, können die Streuung der Urteile im Bereich mittlerer Störungsgrade vermindern. In unserer Studie wurde aber die Reliabilität der Gruppenurteile, also der Mittelwerte aus allen Bewertungen, untersucht und nicht eine absolute (wahre, unbekannte) Klassifizierung postuliert. Das erklärt die gefundenen hohen Werte.

In der hier vorgelegten Studie wurde nur die Interrater-Reliabilität überprüft. Für weitere Studien ist es wünschenswert, auch andere Maße der Reliabilität wie die Intrarater-Reliabilität oder die Test-Retest-Reliabilität zu überprüfen.

Fazit für die Praxis

Die hier vorgelegten Daten belegen, dass sich die RBH-Skala zur auditiven Bewertung der Heiserkeit mit ihren Teilaspekten Rauigkeit und Behauchtheit prinzipiell gut eignet. Allerdings besteht das Problem der „schwierigen Stimmen“, d. h. einzelner Stimmen, bei denen verschiedene Beurteiler zu unterschiedlichen Ergebnissen kommen und bei denen somit die Interrater-Reliabilität gering ist. Für die Praxis ist es wichtig zu bedenken, dass die aktuell zu beurteilende Stimme tatsächlich eine solche „schwierige Stimme“ sein könnte. Leider gibt es noch kein Kriterium, dies im Voraus abzuschätzen. Außerdem werden Aspekte der Stimmqualität wie Durchdringungsfähigkeit, Brillanz, Schönheit etc. mit dieser Skala nicht erfasst.