Zunächst soll auf eine besondere Problematik in der Medizin des Bewegungssystems hingewiesen werden.

Die Motivation für die folgende Untersuchung entstand aus einem medizinischen Dilemma heraus, das im Wesentlichen auf der Basis zweier Fehleinschätzungen entsteht:

  1. 1.

    Die hohe Sensitivität der apparativen Diagnostik wird gleichbedeutend mit einer hohen Spezifität interpretiert und zur Erklärung von Schmerzen im Bewegungssystem herangezogen.

  2. 2.

    Für die klinischen Untersuchungstechniken zur Spezifizierung von Befunden des Bewegungssystems wird eine hohe Sensitivität (bei fehlendem Goldstandard ausgedrückt durch die Reliabilität) vorausgesetzt.

Beide Annahmen dürfen inzwischen als wissenschaftlich widerlegt gelten.

Wie konnten Generationen von Ärzten und Therapeuten hierzu verleitet werden?

Die erste Fehleinschätzung ist wahrscheinlich durch eine der wichtigsten medizinischen Fortschritte entstanden. Die Mediziner des ausgehenden 19. Jahrhunderts waren durch die unglaubliche Erfindung von Prof. Röntgen in der Lage, Veränderungen an Knochen und Gelenken genau zu beschreiben. Ein Großteil der ärztlichen Diagnosen wird bis heute von der hohen Sensitivität der bildgebenden Verfahren geprägt und der apparativen im Vergleich zur klinischen Diagnostik eine höhere Wertigkeit eingeräumt.

Das medizinische Dilemma wird am Beispiel Kreuzschmerz offensichtlich. Trotz intensiver wissenschaftlicher Auseinandersetzung mit dem Thema gelten bis heute ca. 80% dieser Beschwerden als „unspezifisch“ [11]. In 80% der Fälle korrelieren die Beschwerden der Patienten nicht mit der hoch sensitiven apparativen Diagnostik, d. h. ihnen fehlt die Spezifität [19]. Trotz dieser Diskrepanz werden therapeutische Entscheidungen weiter auf dieser Basis getroffen.

An dieser Stelle sei angemerkt, dass der enorme Fortschritt, den die Medizin durch die medizinisch-technische Diagnostik zur Beurteilung von Strukturerkrankungen vor allem in der Notfallmedizin und zur genauen Behandlungsplanung von operativen Eingriffen genommen hat, in keiner Weise infrage gestellt werden soll.

Durch die mangelnde Spezifität der apparativen Diagnostik zur Beurteilung der Beschwerden der Patienten kommt der differenzierten klinischen Untersuchung eine große Bedeutung zu. Hier wird die zweite Fehleinschätzung Teil des Dilemmas. Von der Internationalen Gesellschaft für Manuelle Medizin, der FIMM, wurde 2002 festgestellt: „Die Untersuchungstechniken der manuellen Medizin sind nicht reliabel“ [4].

Diese Aussage muss jedoch etwas präziser formuliert werden. Untersuchungstechniken der manuellen Medizin, welche in der Lage wären, Schmerzen im Bewegungssystem zu differenzieren, z. B. die segmentalen Untersuchungstechniken an der Wirbelsäule, können in wissenschaftlichen Untersuchungen keine reliablen Ergebnisse erzielenFootnote 1. Auch in einer kürzlich erschienenen Literaturrecherche wird auf die nicht ausreichende wissenschaftliche Datenlage zu den Testgütekriterien der manuellen Medizin hingewiesen und eine qualitativ hochwertige Auseinandersetzung mit diesem Thema gefordert [2].

Die FIMM verlangt ebenfalls seit Jahren die Überprüfung der Reliabilität der verschiedenen Untersuchungstechniken der manuellen Medizin, um die Grundlage für eine fundierte „spezifische“ klinische Einschätzung der Patienten auf der Basis einer wissenschaftlichen Aussagefähigkeit zu erarbeiten.

Diese Forderung wird berechtigterweise ausgesprochen, da sie die Grundlage für zielgerichtetes ärztliches und therapeutisches Handeln darstellt. Nur durch reliable Untersuchungstechniken können Störungen im Bewegungssystem klar beschrieben und spezifische Therapien eingeleitet werden.

Die mangelnde Fähigkeit, Beschwerden im Bewegungssystem durch apparative oder klinische Diagnostik zu spezifizieren, dürfte wahrscheinlich auch der Grund für die schlechten Studienergebnisse bei der Überprüfung der verschiedenen therapeutischen Optionen zur Behandlung z. B. von (Kreuz)Schmerzen sein.

Unspezifisch diagnostizierte Beschwerden können in der Regel mangels besseren Wissens auch nur einer unspezifischen Therapie zugeführt werden [20]. Über Effizienz und Aufwand verschiedener, zum Teil multimodaler Therapiekonzepte soll an dieser Stelle jedoch nicht diskutiert werden.

Inzwischen existiert eine große Anzahl methodisch hervorragender Studien zur Effizienzüberprüfung einzelner therapeutischer Maßnahmen besonders bei (Kreuz)Schmerzen mit mäßigen und schlechten Ergebnissen. Vor dem Hintergrund der beschriebenen mangelnden Fähigkeit zur Spezifizierung lassen sie jedoch grundsätzliche Zweifel an der Qualität der inhaltlichen Studienelemente aufkommen.

In den letzten Jahren wird dem dynamischen Anteil des Bewegungssystems, der Muskulatur, bei der Entstehung und Aufrechterhaltung von Schmerzen zunehmende Aufmerksamkeit geschenkt [3, 7, 9, 10, 16, 17]. Travell u. Simons definieren in einer Reihe von Veröffentlichungen über 50 Jahre hinweg das myofasziale Schmerzsyndrom und dessen klinisches Merkmal, den myofaszialen Triggerpunkt [17]. Myofasziale Triggerpunkte (MTrP) werden immer häufiger für die Entstehung und Aufrechterhaltung von Schmerzen im Bewegungssystem verantwortlich gemacht. Die Muskulatur ist der klinischen Untersuchung gut zugänglich und die manuelle Untersuchungstechnik erfordert weniger komplexe Anforderungen an Untersucher und Patient als beispielsweise die Untersuchung segmentaler Funktionsstörungen der Wirbelsäule.

In der vorliegenden Arbeit wurde der Frage nachgegangen, ob zwei in der Untersuchung und Behandlung von MTrP erfahrene Untersucher präzise, d. h. reliabel, in der Lage sind, bei derselben Person zwischen An- und Abwesenheit eines MTrP zu unterscheiden.

Wissenschaftliche Untersuchungen zur Reliabilität der klinischen Untersuchung von MTrP werden seit einigen Jahren mit heterogenen Ergebnissen durchgeführt. Eine Pilotstudie zu diesem Thema führten Gerwin et al. [5] im Jahr 1997 mit gutem Resultat für die Schultergürtel und Nackenmuskulatur durch. Die Ergebnisse dieser Pilotstudie werden in unserer Untersuchung an deutlich mehr Probanden in einer anderen Körperregion überprüft und bestätigt.

Studiendesign und Untersuchungsmethoden

Um kleinere methodische Fehler vorangegangener Untersuchungen zu vermeiden, wurden in der vorliegenden Studie die von der FIMM formulierten methodischen Anforderungen und Empfehlungen beachtet [4].

Hypothese

Zwei in der Diagnostik und Therapie myofaszialer Triggerpunkte erfahrene Untersucher können nach Identifizierung und klinischer Untersuchung, wie von Travell u. Simons im Handbuch der Muskeltriggerpunkte beschrieben, in vier ausgewählten Muskelpaaren der Rumpf- und Gesäßregion die An- und Abwesenheit eines MTrP reproduzierbar (präzise) feststellen.

Versuchsaufbau und -ablauf

Die Studien über die Reliabilität der klinischen Untersuchung von MTrP waren in der Vergangenheit immer wieder an der mangelnden Erfahrung der Untersucher und der fehlenden Abstimmung eines standardisierten Untersuchungsprozedere gescheitert. Sie erzielten teilweise nur mäßige Ergebnisse [6, 12, 13].

In der vorliegenden Studie untersuchten ein Arzt und ein Physiotherapeut, die mehrjährige Erfahrung in der klinischen Untersuchung und Behandlung myofaszialer Triggerpunkte haben. Beide sind Triggerpunkttherapeuten nach IMTT-Standard, einem 15-tägigen Ausbildungscurriculum der Interessengemeinschaft für myofasziale Triggerpunkt-Therapie, und seit Jahren selbst als Instruktoren tätig.

Während einer Trainingsphase, die wenige Stunden Zeit in Anspruch nahm, wurde der standardisierte Untersuchungsablauf abgestimmt.

Die 38 Probanden wurden aus Teilnehmern an Fortbildungskursen zur Diagnostik und Therapie von myofaszialen Triggerpunkten rekrutiert. Davon waren 30 Personen weiblich und 8 männlich; das Alter betrug im Durchschnitt 38 (23–58) Jahre.

Ein Untersucher führte einen standardisierten Untersuchungsgang für 16 Muskeln an einem Probanden in einem Zeitraum von ca. 10 min durch. Direkt im Anschluss nahm ein zweiter Untersucher unabhängig vom ersten den gleichen Untersuchungsgang an demselben Probanden vor. Die Ergebnisse wurden von einer helfenden Person auf Zuruf in ein Protokoll eingetragen.

Es wurden der M. rectus abdominis in der Triggerpunktregion 2, der M. quadratus lumborum in der Triggerpunktregion 2, der M. glutaeus medius in der Triggerpunktregion 3 und der M. longissimus thoracis in der Triggerpunktregion L1 jeweils auf der rechten und linken Seite untersucht [17]. In Abb. 1 sind die Muskeln grafisch dargestellt. Jeder Proband wurde also in 16 Triggerpunktregionen untersucht. Damit konnte eine Gesamtzahl von 304 Muskeln in die Auswertung übernommen werden.

Abb. 1
figure 1

Übertragungsschmerzmuster und Triggerpunktregionen des a M. quadratus lumborum, b M. glutaeus medius, c M. longissimus thoracis, d M. rectus abdominis

Die Untersuchung der Triggerpunktregionen erfolgte unter Berücksichtigung nachstehender Diagnosekriterien für einen MTrP [17]:

  • Hartspannstrang in der Muskulatur,

  • Schmerzpunkt entlang des Hartspannstranges,

  • Wiedererkennung des Schmerzes durch den Probanden,

  • Knötchenstruktur entlang des Hartspannstranges,

  • Übertragungsschmerz,

  • lokale Zuckungsreaktion,

  • autonome Reaktion.

Nach diesen Kriterien musste sich der Untersucher festlegen, ob in der untersuchten Region ein MTrP vorhanden ist oder nicht. Die Minimalkriterien waren Hartspannstrang und Schmerzpunkt entlang des Hartspannstranges. Führt die diagnostische Palpation zu einem Wiedererkennen des Schmerzes als einen Schmerz, der einer aktuellen Beschwerdesymptomatik zuzuordnen ist, ist das Kriterium für einen aktiven MTrP erfüllt. Die übrigen Kriterien wurden als bestätigende Merkmale gewertet.

Die Untersuchungsanordnung ist in Abb. 2 dargestellt.

Abb. 2
figure 2

Untersuchung des a M. rectus abdominis, b M. longissimus thoracis, c M. quadratus lumborum, d M. glutaeus medius

Statistik

Die wissenschaftliche Qualität eines klinischen Tests wird durch seine Reliabilität (Zuverlässigkeit) bestimmt. Statistisch wird die Reliabilität eines klinischen Tests, welcher nicht an einem Goldstandard gemessen werden kann, in seiner Reproduzierbarkeit oder Präzision ausgedrückt [14]. Die Güte der Reproduzierbarkeit kann mit der Kappa-Statistik berechnet werden, wobei die zufällige Übereinstimmung der Untersucher herausgerechnet wird [1]. Für die Präsentation wird die Vierfeldertafel empfohlen, um die Ergebnisse transparent zu machen.

Ergebnisse

Die Ergebnisse werden mithilfe einer Vierfeldertafel in Tab. 1, Tab. 2, Tab. 3 und Tab. 4 präsentiert.

Tab. 1 Musculus rectus abdominis
Tab. 2 Musculus quadratus lumborum
Tab. 3 Musculus glutaeus medius
Tab. 4 Musculus longissimus thoracis

Diskussion

Bei den Ergebnissen finden sich für die rechte und linke Seite eines Muskels keine Abweichungen. Für die Überprüfung der aufgestellten Hypothese spielt die Differenzierung von linker und rechter Seite keine Rolle. Deshalb werden die Ergebnisse in der Diskussion zusammengefasst dargestellt.

Durch die statistische Analyse mit prozentualer Übereinstimmung und Kappa-Statistik für alle vier ausgewählten Muskelpaare konnte unsere Hypothese bestätigt werden. Die beiden erfahrenen Untersucher waren in der Lage, mit großer Präzision in allen acht Muskeln zwischen An- und Abwesenheit eines myofaszialen Triggerpunktes zu differenzieren.

Für den M. rectus abdominis und den M. quadratus lumborum wurde ein Kappa-Wert von 0,82 berechnet, was nach Cohen einer hervorragenden Reliabilität entspricht [1]. Für den M. longissimus thoracis ergab sich ein Wert von 0,71, was einer sehr guten Reliabilität entspricht. Lediglich für den M. glutaeus medius ließ sich nach der Kappa-Statistik nur eine gute Reliabilität erzielen. Hier betrug der Wert 0,51. Dies erklärt sich durch die sehr hohe Prävalenz der latenten myofaszialen Triggerpunkte in diesem Muskel. Die zufällige Übereinstimmung wird größer und der Kappa-Wert fällt dementsprechend ab. Bei sehr hoher oder niedriger Prävalenz verliert die Kappa-Statistik an Aussagekraft [4]. In diesen Fällen sollte die prozentuale Übereinstimmung zur Beurteilung der Reliabilität stärker beachtet werden. Für den M. glutaeus medius fanden wir eine prozentuale Übereinstimmung von 86,84% bei einer Prävalenz von 84,21%. Unter Berücksichtigung dieser Umstände muss auch hier von einer sehr guten Reliabilität ausgegangen werden.

Der Erfolg unserer Untersuchung stützt sich auf drei Säulen:

  1. 1.

    Klare Definitionen der klinischen Untersuchung von MTrP durch Travell u. Simons,

  2. 2.

    Qualität und Erfahrung der Untersucher und

  3. 3.

    Standardisierung und Abstimmung des Untersuchungsprozedere.

Um reliable Untersuchungsergebnisse zu erzielen, sind klare Definitionen und Handlungsanweisungen notwendig [8]. Travell u. Simons ist mit dem „Handbuch der Muskeltriggerpunkte“ ein präzises Standardwerk gelungen, das jedem Interessierten klare Anweisungen und Definitionen mit auf den Weg gibt.

Aufgrund der Veröffentlichungen zum Thema MTrP in den vergangenen 50 Jahren geht es heute nicht mehr darum, auf diese aufmerksam zu machen, denn sie sind zunehmend in aller Munde, sondern um die Verbreitung der klinischen Diagnostik und Therapie in der Fort- und Weiterbildung.

Nach unserer Erkenntnis sind für die Diagnostik von MTrP erfahrene Untersucher die Grundvoraussetzung für eine gute Reliabilität. Auch Gerwin et al. [5] führten die schlechteren Ergebnisse der Studien von Wolfe 1992, Nice 1992 und Nijoo 1994 auf die mangelnde und ungleiche Erfahrung der einzelnen Untersucher zurück. Eine später durchgeführte Untersuchung von Hsieh [6] bestätigt diese Annahme.

Bei der Untersuchung der einzelnen Merkmale geben einige Autoren genau vor, mit welchem Druck untersucht werden soll [13]. Diese Vorgabe sollte nicht gemacht werden. Jeder Patient und jeder Muskel erfordern zur diagnostischen Erfassung der klinischen Merkmale eines MTrP unterschiedliche Druckintensitäten. Damit liegt die Qualität in den Händen des erfahrenen Untersuchers. Wird eine klare Vorgabe mit einer konstanten Druckintensität gemacht, wird der Beurteilung der jeweiligen Muskulatur viel an Qualität genommen.

Die Frage, wie viel Erfahrung notwendig ist, um einen MTrP präzise untersuchen zu können, muss an dieser Stelle noch unbeantwortet bleiben. Vieles spricht jedoch dafür, dass Triggerpunkttherapeuten erst nach einer adäquaten Ausbildung diese Fähigkeit erlangen können. Die beiden Untersucher der vorliegenden Studie haben ein umfangreiches Ausbildungscurriculum durchlaufen, sind selbst Lehrer innerhalb dieses Systems geworden und bilden Therapeuten sowie Ärzte aus.

Die IMTT, eine Gruppierung von Ärzten und Physiotherapeuten um Beat Dejung in der Schweiz, entwickelte ein 15 Kurstage umfassendes Curriculum, was ca. 90 Ausbildungsstunden entspricht [15]. Dieses Curriculum stellt sicher den derzeitigen Ausbildungsstandard zur Diagnostik und Therapie von myofaszialen Triggerpunkten dar.

Simons u. Travell [16] fordern sogar vor jeder Studie zur Wirksamkeit der Behandlung oder zur differenzialdiagnostischen Potenz von MTrP einen Fähigkeitsnachweis der Untersucher im Rahmen einer Reliabilitätsstudie.

Vor jeder Reliabilitätsstudie sollte unabhängig von der Erfahrung der Untersucher eine genaue Abstimmung der Definitionen und Handlungsanweisungen vorgenommen und ein standardisiertes Untersuchungsprozedere entwickelt werden. Nur so können annähernd gleiche Untersuchungsvoraussetzungen geschaffen werden.

Die Ergebnisse lassen sich klar ersichtlich in einer Vierfeldertafel darstellen. Diese wird als ideale Präsentationsform für Studien zur Reproduzierbarkeit bzw. Präzision von klinischen Tests empfohlen [14]. In Zukunft sollte sich diese Präsentationsform durchsetzen, um die Studien untereinander vergleichbar zu machen.

Man darf auf die ersten Studien zur Reliabilität der klinischen Untersuchung von myofaszialen Triggerpunkten bei Patienten gespannt sein.

Fazit für die Praxis

Die sehr guten Ergebnisse der vorliegenden Arbeit machen myofasziale Triggerpunkte nach Ansicht der Autoren zu einem wertvollen klinischen Parameter bei der Differenzierung von Schmerzen im Bewegungssystem. Sowohl bei der täglichen klinischen Arbeit als auch zur weiteren wissenschaftlichen Auseinandersetzung sind sie als objektiver Verlaufsparameter z. B. zur Erfolgs- und Ergebniskontrolle zu nutzen.

Eine Fortführung der wissenschaftlichen Diskussion zur Reliabilität klinischer Untersuchungstechniken der manuellen Medizin ist dringend notwendig.

Die gewonnenen Erkenntnisse verpflichten zu einer intensiven Auseinandersetzung mit MTrP und ihrer Bedeutung bei der Entstehung und Aufrechterhaltung von Schmerzen im Bewegungssystem.