Einleitung: Was ist Sozialtherapie und was Therapieerfolg?

Die Sozialtherapie im Justizvollzug kann in Deutschland als Königsweg des Behandlungsvollzugs betrachtet werden. Dabei herrscht einerseits Konsens darüber, was unter sozialtherapeutischer Behandlung zu verstehen ist. Der Arbeitskreis Sozialtherapie hat Leitlinien wirksamer Sozialtherapie vorgelegt, Prinzipien der integrativen Sozialtherapie und Empfehlungen für die Verlegung in eine sozialtherapeutische Einrichtung sowie Phasen der sozialtherapeutischen Behandlung formuliert [36, 43]. Integrative Sozialtherapie verbindet Maßnahmen im Bereich der Arbeit und (Aus-)Bildung, Sozialpädagogik, Freizeit- und Psychotherapie in einem milieutherapeutischen Setting, um die Strafgefangenen zu befähigen, künftig in sozialer Verantwortung ein Leben ohne Straftaten zu führen (vgl. beispielsweise Strafvollzugsgesetze der Länder Bayern, Hamburg, Hessen, Mecklenburg-Vorpommern, Niedersachsen). Die in den Leitlinien wirksamer Sozialtherapie formulierten Mindeststandards verlangen die Anwendung eines theoretisch und empirisch fundierten Behandlungskonzepts. Diese Forderung ruft förmlich nach Evaluation der Sozialtherapie, um aufgrund von Evaluationsergebnissen die empirische Basis zu garantieren. So wurde die Sozialtherapie seit ihren Anfängen von zahlreichen Evaluationsstudien begleitet (vgl. eine Übersicht über sozialtherapeutische Evaluationsstudien bei Schulz [38]).

Andererseits wird die Evaluation gerade dadurch erschwert, dass es „die“ Sozialtherapie trotz des impliziten Konsenses nicht gibt, eine Überprüfung der Wirksamkeit „der“ Sozialtherapie durch die Unschärfe des Begriffs also erschwert wird. Bussmann et al. [7] gehen sogar so weit zu behaupten, im deutschen Strafvollzug erhalte ein Gefangener einen „Therapiecocktail“. Je nach Anstalt und Zeitgeist werden also v. a. unterschiedliche psychotherapeutische und sozialpädagogische Maßnahmen „zusammengemixt“ [23, 45]. Auch Kaiser und Schöch [21] konstatieren, dass in den einzelnen Einrichtungen die Ausgestaltung der Sozialtherapie erheblich variiert. Konzepte werden zudem kontinuierlich zu optimieren versucht. Sie werden den gesetzlichen und professionellen Strömungen angepasst. So rückten in den letzten Jahren aufgrund gesetzlicher Veränderungen v. a. Sexualstraftäter in den Fokus der sozialtherapeutischen Behandlungsbemühungen,Footnote 1 eine ständige Anpassung der Interventionen an diese Zielgruppe ging vonstatten. Das alles erschwert die Messung des Therapieerfolgs „der“ Sozialtherapie. Es kann immer nur evaluiert werden, was in der jeweiligen sozialtherapeutischen Behandlung durchgeführt wird; Interpretationen für den Therapieerfolg „der“ Sozialtherapie an sich sollten vorsichtig erfolgen.

Der wissenschaftliche Diskurs zur Messung von Therapieerfolg in der Sozialtherapie bezieht sich dabei auf die Metaebene der Evaluation von sozialtherapeutischer Behandlung. Es geht also weniger um die auf Mikroebene, also bei den individuellen Insassen, erkennbaren Veränderungen, sondern vielmehr darum, ob sich ein Gesamteffekt der sozialtherapeutischen Intervention über eine gegebene Stichprobe zeigt. Dies steht im Mittelpunkt nachfolgender Betrachtungen. Meist werden zu diesem Zweck behandelte nichtbehandelten Probanden gegenübergestellt, um dann aus dem Vergleich dieser beiden Gruppen die Frage der Wirksamkeit der Straftäterbehandlung abzuleiten. Eine andere Möglichkeit besteht darin, die Veränderungen auf relevanten Merkmalsbereichen von behandelten Probanden über die Zeit, also nach der Behandlung (Posttest) im Vergleich zu vor der Behandlung (Prätest), zu untersuchen. Der Effekt der Sozialtherapie wie der Straftäterbehandlung allgemein bemisst sich in der Regel an der Rückfallreduzierung. Nationale und internationale Metaanalysen konnten zeigen, dass Straftäterbehandlung das Rückfallrisiko reduzieren kann. Die Rückfallrate für Sexualstraftäter, die auch andernorts in den kriminalpolitischen Fokus gerieten, sank gemäß der angloamerikanischen Metaanalyse von Hanson et al. [17] bei kognitiv-behavioral oder systemisch behandelten Sexualstraftätern auf rund 10 %. Im Vergleich dazu betrug die Rückfallquote bei nicht- bzw. inadäquat behandelten 17 %. Lösel [26, S. 17] kam in einer deutschen Metaanalyse zu dem Ergebnis, dass „Probanden aus der Sozialtherapie … durchschnittlich 11 % weniger rückfällig“ wurden als Regelvollzugsprobanden. In der Metaanalyse von Egg et al. [11, S. 342] waren die Sozialtherapieteilnehmer gemessen am Rückfall „12,3 % erfolgreicher … als die Kontrollgruppe“. Andere Studien mit geringeren Effekten vermittelten begrenzten Enthusiasmus (so beispielsweise Ortmann [33]: 5 %). Während manche Autoren aus Anlass solcher Bilanzen davon ausgehen, dass die Effektivität der Sozialtherapie als bestätigt gelten kann [9, 11], warnen andere davor, in einen „pauschalen Behandlungsoptimismus“ zu verfallen [26, S. 34]. Diese Skepsis ist sicherlich auch den Zeichen der Zeit geschuldet. Angesichts fehlender umfassender Sozialtherapiestudien wäre es allerdings ebenso verfehlt, Entwarnung zu geben.

Diese Wirksamkeitsstudien machen deutlich, dass sich der Erfolg sozialtherapeutischer Intervention in der Regel an der „Rückfallfreiheit“ bemisst, die Rückfallstudien mitunter Jahre nach der Behandlung in Zusammenhang mit der Sozialtherapie stellen. Gerade im Bereich der Sexualdelinquenz muss sich die Sozialtherapie am Maßstab des Rückfalls bzw. der Legalbewährung messen lassen, denn das ist es, was die Öffentlichkeit und die Politik von der Behandlung eines gefährlichen Straftäters erwarten: Er soll nicht mehr straffällig werden. Die Rückfallzahlen zeigen aber: Nicht alle (Sexual-)Straftäter, die behandelt wurden, bleiben rückfallfrei. Völlige Rückfallfreiheit kann ohnehin als utopisch betrachtet werden. Manche Sexualstraftäter werden trotz Behandlung rückfällig; andere bleiben auch ohne Behandlung rückfallfrei – es stellen sich also die Fragen, a) ob die Vorstellung von „erfolgreicher Behandlung“ (gemessen an Rückfallraten) nicht zu überdenken ist und b) es nicht an der Zeit ist, die Komplexität der Zusammenhänge mit entsprechenden Zugängen aufzuspüren [6].

Methodische Dilemmata bei der Feststellung des Sozialtherapieerfolgs

Quasiexperimentelle vs. experimentelle Studienanlagen

Plant man ein Studiendesign zur Evaluation des Sozialtherapieerfolgs, sind in der Planungs- und Durchführungsphase der Evaluationsstudie grundlegende Standards der Evaluationsforschung zu berücksichtigen [13]. Hierzu gehören Vorüberlegungen zur Möglichkeit der Kontrolle von Einflussgrößen, zu Effektgrößen, zu Konstrukt- sowie interner und externer Validität.

Will man, wie oben erwähnt, behandelte unbehandelten Straftätern gegenüberstellen, liegt ein zentrales Problem allerdings in der Machbarkeit: Ein experimentelles Design, also die zufällige Zuweisung von Strafgefangenen zur Gruppe der behandelten und zur Gruppe der im normalen Vollzug verbleibenden Probanden, kann nicht dort realisiert werden, wo die gesetzlichen Rahmenbedingungen dies unmöglich machen – und ein solches Unterfangen ohnehin ethisch bedenklich wäre. Diese fehlende Randomisierung wird bei quasiexperimentellen Studien häufig bemängelt. Es mangelt an interner Validität; die oben erwähnte Kontrolle von Einflussfaktoren ist nur über eine statistische Kontrolle möglich.

Wie Sampson [37] feststellte, fand in der kriminologischen Forschung ein „experimental turn“ statt, seitdem das experimentelle Studiendesign als „Goldstandard“ angesehen wird. In klinischen Studien werden Ergebnisse aus „randomized controlled trials“ (RCT) schon länger als die hochwertigsten Forschungsresultate angesehen: Evidenzbasierte Behandlung ist das Zauberwort; eine Entwicklung, die auch in der kriminologisch-forensischen Behandlungsforschung dazu geführt hat, solche Untersuchungsdesigns als das Nonplusultra zu betrachten. Doch auch experimentelle Untersuchungen garantieren gerade in der kriminologischen Behandlungsforschung in den seltensten Fällen „echte“ Randomisierung.

Effekte wie „treatment contamination“ [44, S. 921] müssen im Rahmen der Evaluation sozialtherapeutischer Behandlung diskutiert werden, wenn – was in der Regel der Fall sein wird – Sozialtherapie- und Regelvollzugsinsassen in anderen Bereichen wie beispielsweise dem vollzuglichen Arbeitswesen zusammenkommen. Sekundäreffekte der Zuweisung können versteckte Einflüsse auf den weiteren Verlauf oder die Antworttendenzen bei den Erhebungen hervorbringen, wie Unmut oder unehrliche Antworten. Aber nicht nur das, gerade in der kriminologischen Behandlung ist die „Compliance“ von Studienteilnehmern nicht unbedingt hoch, und dies kann sich auch in den Ergebnissen niederschlagen. Probanden antizipieren bzw. haben implizite Theorien darüber, ob die Intervention nützt oder nicht und beurteilen und verhalten sich entsprechend. Mehr noch: Insassen unterhalten sich über die Maßnahmen, auch das dürfte einen Effekt auf die ursprüngliche Randomisierung haben [37]. Wößner und Schwedler [47] zeigten jüngst in einer experimentell angelegten Evaluationsstudie zum Einsatz von elektronischer Aufsicht im Vollzug der Freiheitsstrafe, dass systematische Ausfälle sowohl in Kontroll- als auch Experimentalgruppe den Vergleich zwischen den beiden Gruppen kompromittieren können. Bei typischen RCT, wie man sie aus der Psychotherapieforschung kennt, werden meist nur solche Probanden in eine Studie aufgenommen, bei denen eine fest umschriebene Störung vorliegt und komorbide Störungen ausgeschlossen werden. Hiervon wird sich jede Studie in der Sozialtherapieforschung unterscheiden. Marshall und Marshall [28] gehen sogar so weit zu behaupten, RCT seien keine geeignete Methodik, um die Wirksamkeit von Sexualstraftäterbehandlung nachzuweisen. Denn neben der zufälligen Zuweisung, die charakteristisch für RCT ist, bedarf es bei randomisierten Studien auch der Sicherstellung der präzisen Realisierung der Behandlungsinhalte. Daher wird die Implementation der Interventionen bei typischen RCT auch meist manualgeleitet durchgeführt [8]. Zudem garantieren experimentelle Designs keineswegs, dass eine systematische Gruppenzusammensetzung vermieden werden kann. In einer Studie von Marques et al. [27] waren trotz der Zufallszuweisung zu Behandlungs- und Kontrollgruppe in der ersten Gruppe Sexualstraftäter mit einem höheren Risiko vorzufinden. Spätestens wenn die Stichprobenmortalität nicht mehr zu ignorieren sein wird, ist gerade in der Sozialtherapieevaluation von einer systematischen Ausdifferenzierung der Behandlungsabbrecher im Gegensatz zu den weiterhin Teilnehmenden auszugehen [46].

Proximale vs. distale Maße

Wie eingangs bereits dargestellt, ergaben Metaanalysen und Vergleichsstudien, dass Straftäterbehandlung das Rückfallrisiko senken kann. Weit weniger empirische Befunde liegen allerdings zu der Frage vor, ob die sozialtherapeutische bzw. Straftäterbehandlung auch tatsächlich zu solchen psychologischen Veränderungsprozessen führt, auf die die Behandlung abzielt. Es interessiert also ausschließlich der Rückfall als abhängige Variable, obwohl nicht einmal klar ist, ob im Laufe der Behandlung das direkte Kriterium des Interventionserfolgs, nämlich Veränderungen in den die Behandlungsziele der sozialtherapeutischen Maßnahme abbildenden Variablen, überhaupt erreicht wird. Der Bezug von Behandlung zu Rückfall erfolgt über die Ergebnisse von Rückfallstudien, die kriminogene Faktoren identifizierten. Behandlungsmodule zielen auf diese kriminogenen Faktoren ab, also scheint es intuitiv, von dem Zusammenhang „Behandlung – Bearbeitung der kriminogenen Faktoren – Rückfallbeeinflussung“ auszugehen.

Straftäterbehandlung, also auch die sozialtherapeutische Behandlung, kann freilich nur die sogenannten dynamischen kriminogenen Faktoren in den Fokus therapeutischer Bemühungen stellen. Allein diese sind bei der Messung von Therapieerfolg von Interesse, weil statische Risikofaktoren nicht veränderbar sind. Dysfunktionale Denkmuster und kognitive Verzerrungen sollen verändert sowie Impulskontrolle, Empathiefähigkeit und Problemlösefertigkeiten gestärkt werden. Falls es das Behandlungs-Setting erlaubt, stehen des Weiteren Rückfallvermeidung (Arbeiten am Deliktzyklus) und die Bearbeitung paraphiler Störungen im Behandlungsfokus.

Es liegen also etliche Evaluationsstudien vor, die anhand der abhängigen Variable „Rückfall“ den Erfolg der Sozialtherapie messen, aber weit weniger Befunde dazu, ob es im Laufe der Behandlung tatsächlich zu Veränderungen dieser kriminogenen Faktoren kommt und ob diese Veränderungen mit der Senkung des Rückfallrisikos einhergehen. Das Hauptaugenmerk liegt demnach meist auf einem Erfolgskriterium, das zeitlich weit weg von der Behandlung liegt und als distales Kriterium bezeichnet werden kann. Das proximale Erfolgskriterium, das sowohl zeitlich als auch inhaltlich dicht bei der Behandlung liegt, wäre eine tatsächlich aufgrund der Behandlung erfolgte Veränderung dynamischer Risikofaktoren, wie beispielsweise eine verbesserte Selbstkontrolle oder die Veränderung dysfunktionaler Überzeugungen.

Einige Ergebnisse zum proximalen Erfolgskriterium liegen v. a. aus dem englischsprachigen Bereich vor [vgl. 6]. In der Untersuchung von Seager et al. [40] wiesen Sexualstraftäter, die ein vollzugliches Behandlungsprogramm abschlossen, eine geringere Rückfallrate auf als Abbrecher oder Verweigerer. Allerdings stand das Rückfallverhalten in keinem Zusammenhang mit den therapeutischen Veränderungen. Auch in anderen Studien wiederholte sich dieses Muster: Ein Zusammenhang zwischen Behandlungseffekt im Sinne des „therapeutic change“, also der mit der Straftäterbehandlung einhergehenden Veränderung, und Rückfallverhalten ließ sich gar nicht oder nicht durchgängig nachweisen [2, 24, 25, 34]Footnote 2. Für die Evaluation der Behandlung von (Sexual-)Straftätern ist es allerdings unabdingbar, das proximale „treatment outcome“ mit dem längerfristigen, distalen Maß des Rückfalls in Verbindung zu setzen [6]. Damit würde die Forschung auch die von Obergfell-Fuchs und Wulf [31] geäußerte Kritik einer unkritischen Annahme von Kausalität zwischen Behandlung und Rückfall dort, wo es diese nicht gibt, aufgreifen. Auch wenn Hosser et al. [19, S. 130] zu dem Ergebnis kommen, dass „Veränderungen, die sich im Verlauf der deliktspezifischen Behandlung ergeben haben, … das wichtigste Beurteilungskriterium für die Wirksamkeit des Programms dar[stellen]“, darf doch bezweifelt werden, dass sich diese Erkenntnis durchsetzt, gemessen an den Erwartungen an die Wirksamkeit der Sozialtherapie im Sinne der Rückfallfreiheit.

Methoden zur Feststellung von Veränderung

Es stellt sich die Frage, wie der „therapeutic change“ gemessen werden kann. Den Veränderungswerten liegen in der Regel Testungen anhand psychometrischer Maße zugrunde, die bei den behandelten (bzw. nichtbehandelten) Probanden vor und nach der Intervention (bzw. zu äquivalenten Erhebungszeitpunkten) erhoben werden. Am eingängigsten ist die Verwendung eines einfachen Veränderungswerts („change score“). Hier wird die Differenz von Ausprägungen vor und nach der Behandlung bzw. zwischen einer Baseline und dem Wert nach einer Intervention gemessen [41]. Erfasst man beispielsweise das Merkmal Aggressivität mit der entsprechenden Skala des Freiburger Persönlichkeitsinventars, revidierte Fassung (FPI-R, [12]), einem in der kriminologischen Forschung häufig angewendeten Persönlichkeitsfragebogen, zieht man vom Skalenwert nach der Behandlung den Skalenwert vor der Behandlung ab (Posttest minus Prätest).

Es liegen einige Studien vor, die sich mit Veränderung von kriminogenen Persönlichkeitsmerkmalen durch sozialtherapeutische Interventionen beschäftigten und hierzu die Differenzwerte nutzten. In einer Studie von Egg [10] zeigten sich Behandlungseffekte, also Veränderungen zugunsten der Sozialtherapieprobanden, auf den Skalen Nervosität, Depressivität, Gehemmtheit und Neurotizismus. In der früheren Untersuchung von Ortmann [32] war kein Effekt bei den sozialtherapeutisch behandelten Probanden im Behandlungsverlauf auf den erfassten Merkmalen Gehemmtheit, Geselligkeit und Extraversion zu erkennen. Des Weiteren fanden Hosser et al. [19] vereinzelt deliktspezifische Veränderungen von jugendlichen und heranwachsenden Sexualstraftätern, die sozialtherapeutisch behandelt wurden.

Eine klinisch signifikante Veränderung („clinically significant change“) liegt vor, wenn eine Person eine derartige Veränderung zeigt, dass sie vor der Behandlung ein dysfunktionales Niveau auf einer bestimmten Skala und nach der Behandlung ein funktionales Niveau aufweist [beispielsweise 5]. Nach Jacobson et al. [20], die diese Methode 1984 einführten, liegt ein klinisch signifikanter Veränderungsprozess beispielsweise dann vor, wenn sich ein Proband mehr als 2 Standardabweichungen vom Mittel der „Problemgruppe“ entfernt hat oder sich nach der Behandlung innerhalb von 2 Standardabweichungen des Mittels der Normstichprobe bewegt. Fraglich ist bei diesem Vorgehen allerdings, was als normaler, also funktionaler, Mittelwert heranzuziehen ist und ob der Mittelwert der Untersuchungsgruppe (in deren Fall psychotherapeutisch behandelte Probanden) per se als dysfunktionales Kriterium zu betrachten ist.

Bei der Verwendung eines „reliable change score“ wird ermittelt, ob der Unterschied zwischen den Ausprägungen vor und nach einer Intervention tatsächlich statistisch reliabel ist. Jacobson et al. [20] schlagen hierfür vor, den Quotienten der Differenz von Posttest-/Prätest-Ausprägung und dem Standardfehler zu berechnen [4].

Schließlich kann man auch mit Regressionsresiduen die therapeutische Veränderung bestimmen. Dies ermöglicht die Berücksichtigung der Ausprägung des Ausgangswerts durch dessen statistische Kontrolle. Rasch und Kühl [35] verglichen mit dieser Methode sozialtherapeutisch behandelte und nichtbehandelte Probanden und konnten keinerlei Veränderungen auf mit dem FPIFootnote 3 erfassten Merkmalsbereichen feststellen. In einer eigenen Analyse von Zwischenergebnissen aus einem längerfristigen Evaluationsprojekt (s. Abschn. „Ergebnisse aus dem eigenen Evaluationsprojekt“) wurde die Regressionsanalyse angewendet, um festzustellen, ob sich Veränderungen auf psychometrischen Maßen am Ende der Haftphase durch die Vollzugsart erklären ließen (also ob sich ein Effekt der sozialtherapeutischen Behandlung feststellen ließ). Es zeigte sich, dass in der Regel zwischen 25 und 50 % (mitunter sogar 60 %) der Varianz des Werts zu t2 allein durch den Ausgangswert erklärt wurden und somit v. a. auf die individuelle Ausprägung zum Zeitpunkt t1 zurückzuführen waren [46]. Unter Hinzunahme des Prädiktors „Art des Vollzugs“ (Regelvollzug vs. Sozialtherapie vs. Sozialtherapieabbruch) ergab sich in der großen Mehrzahl der Veränderungswerte überhaupt kein Zuwachs an dieser Varianzaufklärung. Dies bedeutet, dass es bei der Sicht auf einzelne Skalen der untersuchten Faktoren unter Kontrolle der Ausgangswerte zu t1 in der Regel gleichgültig für die Ausprägung der Variablen zum Zeitpunkt t2 war, ob sich ein Proband in einer sozialtherapeutischen Behandlung befand oder nicht.

Interessanterweise können nicht unbedingt die hier dargestellten Veränderungswerte den Rückfall am besten vorhersagen. In einer Studie von Barnett et al. [3] etwa wurde Rückfall am besten durch eine Reihe von Prätest- bzw. Posttest-Ausprägungen vorhergesagt.

Programmnahe vs. Persönlichkeitsmaße

Eine weitere grundsätzliche Entscheidung bei der Evaluation von Effekten der Straftäterbehandlung liegt in der Klärung der Frage, ob man Veränderung mit programmnahen Maßen bzw. Fragebogen oder eher mit allgemeinen Persönlichkeitsmaßen bzw. -fragebogen erfassen soll. Generell werden in der Behandlungsforschung eher allgemeine psychometrische Maße eingesetzt, auch wenn manch englischsprachige Studie programmnahe Maße nutzt [14]. Auch das Behandlungsprogramm für Sexualstraftäter (BPS)Footnote 4 bedient sich solcher programmnaher Veränderungsmessung, die in Evaluationsstudien übernommen werden kann. Die erfolgreiche Absolvierung der einzelnen Programmmodule wie Gesprächsverhalten, Bearbeitung von kognitiven Verzerrungen oder Geschlechtsrollenstereotypen wird nach Beendigung des Programms mit programmnahen Items abgefragt („Welche Art von Fragen sind bei der Kontaktaufnahme zu anderen Menschen hilfreich?“ Antwortmöglichkeiten: geschlossene, offene, provozierende, verdeckte Fragen; „Frauen, die in kurzen Röcken oder engen Oberteilen herumlaufen, fordern den Ärger heraus.“; „Eigentlich genießen die meisten Kinder Sex mit einem Erwachsenen, solange der Mann ihnen nicht weh tut.“ Antwortmöglichkeiten Likert-Skala: stimme völlig zu bis stimme überhaupt nicht zu). Auch Habermann et al. [15] haben mithilfe von solchen Fragebogen ein Gruppentherapieprogramm evaluiert (n = 23). Diese Art der Therapieerfolgsmessung ist meist sehr deliktorientiert (deliktspezifische kognitive Verzerrungen, deliktbezogene Leugnungs- und Bagatellisierungstendenzen, Wissen über Sexualstraftaten, Erkennen von Risikosituationen) und legt die Vermutung nahe, dass sich gerade deshalb ein umfassenderer Behandlungseffekt feststellen ließe. Doch auch mit dieser Methode konnten Habermann et al. [15] nicht auf allen Skalen erwünschte Veränderungen feststellen.

Für den Einsatz von Persönlichkeitsfragebogen spricht die Überlegung, dass sich hiermit evtl. nachhaltigere Veränderungen besser abbilden lassen. Schließlich sind sie weniger durchschaubar als programmnahe Maße, bei denen leicht erkennbar ist, was man ankreuzen muss. Doch auch beim Einsatz von Persönlichkeitsfragebogen wird das Problem der sozial erwünschten Antworttendenzen zu diskutieren sein. Des Weiteren stellt sich die Frage, ob Personen überhaupt über die notwendige Reflexionsfähigkeit verfügen, um valide Einschätzungen abzugeben. Denkbar wäre auch eine akute Kontaminierung der Antwortschemata durch aktuelle Vorfälle oder implizite Theorien von Behandlungserfolg bzw. -misserfolg (s. Abschn. „Quasiexperimentelle vs. experimentelle Studienanlagen“). Schließlich könnten sich „schlechtere“ Selbsteinschätzungen zum Ende der Behandlung ergeben, weil sich erst durch die Behandlung selbst ein Problembewusstsein herausgebildet hat. Ein Gefangener wäre dann erst nach der Intervention in der Lage, z. B. ein Selbstkontrollproblem bei sich auszumachen, und hat demnach vielleicht bei der ersten Erhebung entsprechend unproblematischere Werte erreicht.

Alles in allem ist noch weitgehend unklar, inwiefern die eingesetzten Erhebungsinstrumente überhaupt vermögen, die relevanten dynamischen kriminogenen Faktoren valide und reliabel abzubilden [14]. Die Erfassung bleibt schwierig, denn: „Risk assessments for crime and violence are different from other forms of psychological assessment because the presenting problem is not directly observed. Therapists working with depression and anxiety routinely see clients who are visibly depressed and anxious. In contrast, therapists working with criminals may never see a crime“ [16, S. 172]; auch wenn Miller und Lynam [29] in einer Metaanalyse zeigen konnten, dass eine ganze Reihe von Konstrukten diverser Persönlichkeitsmodelle, speziell aus dem Bereich Verträglichkeit und Gewissenhaftigkeit, prinzipiell im Zusammenhang mit antisozialem Verhalten stand [29].

Erhöhung der α-Fehler-Wahrscheinlichkeit

Egal, für welches Veränderungsmaß man sich entscheidet: Dadurch, dass die Überprüfung des Behandlungseffekts in der Regel darauf basiert, dass mehrere verschiedene Skalenwerte verglichen werden, erhöht sich die Gefahr des α-FehlersFootnote 5. Fast allen Studien ist gemein, dass sie die Veränderung vieler Variablen testen: Impulskontrolle, Aggressivität, Neurotizismus, sexuelle Gewalt oder missbrauchsfördernde Einstellungen, Selbstwert, Opferempathie, allgemeine Empathie, Leugnung und Bagatellisierung, Depression, Angst – die Liste ist fast endlos fortzuführen. Die Wahrscheinlichkeit, signifikante Ergebnisse zu erzielen, steigt mit der Zahl der durchgeführten Tests. Von daher verwundert es auch nicht, wenn in den Studien berichtet wird, in der Mehrzahl der Testungen signifikante prosoziale Veränderungen festgestellt [1, 34] oder bei einer bestimmten Anzahl der getesteten Skalen signifikante oder tendenzielle Effekte gefunden zu haben [15]. Sind diese positiven Ergebnisse dann als Erfolg zu verbuchen, als Wirksamkeitsnachweis für die sozialtherapeutische bzw. Straftäterbehandlung oder im Rahmen der α-Fehler-InflationFootnote 6 zu interpretieren?

Ergebnisse aus dem eigenen Evaluationsprojekt

In dem Forschungsprojekt „Sexualstraftäter in sozialtherapeutischen Abteilungen des Freistaates Sachsen“ wurde untersucht, wie es sich mit den proximalen und den distalen Erfolgskriterien verhält. Hierfür wurden Daten der Untersuchungszeitpunkte t1 und t2 (Studie 1) sowie t1, t2 und t4.1 (Studie 2) herangezogen, die der Darstellung des Untersuchungsaufbaus in Abb. 1 zu entnehmen sind. Abbildung 1 gibt ferner einen groben Überblick über die Anlage und die Dauer der Studie sowie die Teilnehmerzahl.

Abb. 1
figure 1

Untersuchungsanlage der Evaluationsstudie „Sexualstraftäter in sozialtherapeutischen Abteilungen des Freistaates Sachsen“. FPI-R Freiburger Persönlichkeitsinventar, revidierte Fassung, [12]

In Studie 1 [39] wurde untersucht, ob sich positive Veränderungen kriminogener Merkmale im Verlauf der sozialtherapeutischen Behandlung ergaben und sich die behandelten Probanden hinsichtlich dieser Veränderungen von unbehandelten Probanden des Regelvollzugs unterschieden. Darüber hinaus wurde geprüft, inwiefern sich bei Sexualstraftätern andere Effekte ergaben als bei Gewaltstraftätern.

Hierzu lagen Daten aus der beschriebenen Stichprobe zu 89 sozialtherapeutisch behandelten Probanden sowie 64 Probanden des Regelvollzugs vor, die zwischen 2004 und 2012 wegen eines Sexual- oder Gewaltdelikts in einer Haftanstalt in Sachsen bzw. den dortigen sozialtherapeutischen Abteilungen untergebracht waren. Bei Verlegung in die sozialtherapeutische Abteilung bzw. zu Beginn der Haftphase sowie kurz vor Entlassung wurden mittels psychometrischer Fragebogen kriminogene Merkmale wie z. B. mangelnde Selbstkontrolle, Aggressivität, geringe Verträglichkeit und emotionale Labilität erfasst. Die Auswertungen zeigten einige prosoziale Veränderungen in der Gruppe der Sozialtherapieprobanden (u. a. verringerte Erregbarkeit, höhere Verträglichkeit, geringere emotionale Labilität). Diese Veränderungen unterschieden sich jedoch nicht von der Gruppe der unbehandelten Probanden. Hinsichtlich der Differenzierung zwischen Gewalt- und Sexualstraftätern deutete sich an, dass Gewaltstraftäter in den Bereichen Selbstkontrolle, Aggressivität und Neurotizismus stärker von der Behandlung profitierten als Sexualstraftäter. Allerdings war die Vergleichbarkeit der untersuchten Subgruppen durch die gesetzlich geregelte Verlegungspraxis in eine sozialtherapeutische Anstalt und dem damit verbundenen quasiexperimentellen Design eingeschränkt. So waren die Probanden der Sozialtherapie zum ersten Erhebungszeitpunkt signifikant jünger als die des Regelvollzugs [Mittelwert (M) = 31,8 vs. 33,6 Jahre]. Außerdem war die Zeit zwischen den beiden Erhebungszeitpunkten in der Gruppe der Sozialtherapieprobanden etwa doppelt so hoch (M = 27,9 vs. 14,8 Monate). Auch unterschieden sich die untersuchten Sexualstraftäter hinsichtlich dieser beiden Variablen signifikant von den Gewaltstraftätern. Bei der Interpretation der Ergebnisse ist also zu berücksichtigen, dass Unterschiede zwischen behandelten und unbehandelten Probanden nicht alleinig auf die Behandlung selbst, sondern ebenfalls auf Unterschiede des Rückfallrisikos oder der Zeiträume zwischen den Erhebungen zurückzuführen sein könnten.

In Studie 2 (Wößner und Schwedler, in Bearbeitung) wurde u. a. untersucht, ob im Laufe der Behandlung auftretende prosoziale Veränderungen einen Zusammenhang zum Legalverhalten nach Entlassung aufwiesen. Hierfür lagen für 185 Probanden der Sozialtherapie die in Studie 1 erwähnten psychometrischen Fragebogendaten vor. Offizielle Angaben zur Rückfälligkeit in Form von Auszügen aus dem Bundeszentralregister konnten für 92 Probanden abgefragt werden; der mittlere Katamnesezeitraum betrug M = 48,4 Monate [Standardabweichung (SD) ±17,7 Monate].

Auch in dieser Studie zeigten sich signifikante prosoziale Veränderungen im Laufe der Behandlung, deren Ausmaß sich je nach Straftätergruppe und Merkmal unterschied. So verbesserten sich Gewaltstraftäter v. a. in den Bereichen antisozialer Persönlichkeitsmerkmale (Selbstkontrolle, Verträglichkeit, Aggressivität etc.) und emotionaler Labilität/Ängstlichkeit. Vergewaltigungstäter sowie Missbrauchstäter berichteten hingegen hauptsächlich von Verbesserungen hinsichtlich kriminalitätsfördernder Einstellungen und Ängstlichkeit; antisoziale Persönlichkeitsmerkmale veränderten sich hier kaum.

Mittels Cox-Regressionen wurde schließlich versucht, allgemeine Rückfälligkeit sowie Rückfall mit Sexual- oder Gewaltdelikten anhand der Veränderungen kriminogener Merkmale vorherzusagen. Um mögliche Unterschiede im Prätest zu berücksichtigen, wurden durch Bildung von „composite scores“ für 4 Gruppen kriminogener Merkmale (kriminalitätsfördernde Einstellungen, antisoziale Persönlichkeitsmuster, Ängstlichkeit/Neurotizismus sowie Empathie) residualisierte Veränderungswerte (Regressionswerte) berechnet, die als unabhängige Variablen in die Cox-Regressionen eingegeben wurden. Die Analysen ergaben keinen Zusammenhang zwischen der Veränderung kriminogener Merkmale und der allgemeinen oder deliktspezifischen Rückfälligkeit.

Resümee

Der vorliegende Beitrag sollte aufzeigen, wie schwierig es ist, Sozialtherapieerfolg tatsächlich zu erfassen. Die Schwierigkeiten fangen schon bei grundlegenden Überlegungen dazu an, ob sich „die“ Sozialtherapie überhaupt evaluieren lässt. Dabei wird der Erfolg „der“ Sozialtherapie in der Regel daran festgemacht, ob sich bei den sozialtherapeutisch behandelten Probanden eine geringere Rückfallrate feststellen lässt als bei nicht sozialtherapeutisch behandelten – und das Jahre nach deren Entlassung. Bemessen an diesem distalen Erfolgskriterium ist die Sozialtherapie nur moderat wirksam. Doch selbst wenn man das proximale Erfolgskriterium der direkt aus der sozialtherapeutischen Intervention ableitbaren therapeutischen Veränderung heranzieht, sieht es nur leicht besser aus. Es lässt sich auch kein studienübergreifender Zusammenhang zwischen der therapeutischen Veränderung und der Rückfallvermeidung ausmachen; eine Beobachtung, die sich in der Straftäterbehandlung v. a. auch in internationalen Studien findet und die Legitimation der Behandlungsbemühungen infrage stellen könnte. Ist die Sozialtherapie also gar nicht wirksam? Sind die antizipierten therapeutischen Veränderungen also gar nicht vonstatten gegangen? Oder – wie man aufgrund der dargelegten Analysen vermuten könnte – können wir die sozialtherapeutisch indizierten Veränderungen vielleicht methodisch gar nicht feststellen?

Diese wenig enthusiastisch stimmenden Schlüsse könnten durch zweierlei erklärt werden: durch in der Behandlung selbst liegende Grenzen oder durch methodische Artefakte. Wie oben dargelegt, findet eine ständige Weiterentwicklung und Anpassung der sozialtherapeutischen Intervention statt. Diese inhaltliche Diskontinuität erschwert die valide Erfassung einer sozialtherapeutischen Intervention. Doch das eigentliche Problem in der praktischen Umsetzung liegt häufig in der fehlenden personellen Kontinuität. Personelle Fluktuationen können die therapeutische Beziehungsgestaltung erschweren oder dazu führen, dass einem Gefangenen von den verschiedenen Therapeuten auch verschiedene Techniken und Methoden oder gar „Ansichten“ vermittelt werden. Überhaupt zeigt die Sozialtherapie vielleicht nur begrenzte Wirksamkeit, weil sich ein Gefangener nicht noch mehr der institutionellen Übermacht ausliefern möchte, indem er seine Gedanken, Ängste, Wünsche und Schwächen preisgibt [22]. Oder umgekehrt: Er tut nur so, als ob es zu den erwünschten Veränderungen gekommen ist, letztlich weiß man ja irgendwann, was die Fachdienste hören wollen. So jedenfalls einige Rückmeldungen von Probanden aus dem eigenen Evaluationsprojekt. Schließlich ist davon auszugehen, dass die Sozialtherapie im Strafvollzug nicht überall das Niveau einer wirksamen, respektvollen, aufbauenden Arbeit mit Verurteilten erreicht, sondern vielmehr bei manchen Gefangenen als „institutionalisierte Strafpredigt“ wirkt [22]. Ergebnisse zum Zusammenhang von Therapieerfolg und Anstaltsklima deuten auf das Gewicht solcher Aspekte hin (Wößner und Schwedler, in Bearbeitung).

Bei der Durchführung von Evaluationsstudien steht man vor den dargestellten methodischen Dilemmata, die es sorgfältig zu reflektieren gilt. In der sozialtherapeutischen Evaluationsforschung wird man sich meist mit quasiexperimentellen Untersuchungsplänen zufrieden geben müssen, die die Identifizierung des Effekts der sozialtherapeutischen Behandlung erschweren. Denn die quasiexperimentelle Zuordnung bringt es mit sich, dass sich Gefangene, die in die Sozialtherapie verlegt werden, systematisch von Gefangenen unterscheiden können, die im Regelvollzug verbleiben. Gleichzeitig verspricht das experimentelle Design aber mehr, als es in der Realität der Evaluationsforschung halten kann. Unterschiedliche Maße (programmnahe oder Persönlichkeitsmaße) und Veränderungswerte schließlich können das Ergebnis beeinflussen. Generell ist fraglich, ob die Messung mit psychometrischen Maßen valide und reliabel ist. Manche Gefangene durchlaufen mehrfache Therapieversuche und stoßen dabei immer wieder auf dieselben diagnostischen Instrumente. Das wiederholte Ausfüllen dürfte nicht ohne Effekt bleiben. Die Verwendung von sogenannten impliziten Maßen oder Einschätzungen durch die Fachdienste selbst werden als zusätzliche hilfreiche Alternativen diskutiert [39]. Schließlich bleibt die Frage, wie viele Einzeleffekte vorhanden sein müssen, damit ein Therapieerfolg, ein Gesamteffekt der sozialtherapeutischen Behandlung konstatiert werden kann. Mit Blick auf die erhofften Zusammenhänge von Behandlung und Rückfallverhalten muss schließlich berücksichtigt werden, dass ein Proband zwischen Entlassung und Erhebung des Rückfalls „einer Fülle von Einflüssen ausgesetzt ist“ [31, S. 232], die sein Verhalten und Erleben mindestens ebenso prägen wie therapeutische Veränderungen, wenn es denn zu solchen gekommen ist.

Sozialtherapie hat also sicherlich ihre Grenzen, so auch die Forschungsmethoden, mit denen der Effekt der Sozialtherapie nachzuweisen versucht wird. Gleichzeitig ist die Evaluation sozialtherapeutischer Behandlung unabdingbar für die Fortentwicklung erfolgreicher Interventionsansätze. Der vorliegende Beitrag hat Eckpunkte für eine kritische Reflexion von Sozialtherapieevaluationsergebnissen aufgezeigt. Selbst wenn die Ergebnisse der Evaluationsstudien nicht den erhofften Erfolg aufzeigen, kann es immer nur um eine weitere Optimierung der Sozialtherapie und der Evaluationsforschung und nie um die prinzipielle Infragestellung des Behandlungsvollzugs gehen.

Danksagung

Die Autorin bedankt sich herzlich bei Andreas Schwedler für die hilfreichen Kommentare zu dieser Publikation.