Studien vs. anekdotische Evidenz

May 5

Mit der Entwicklung der GLP-1-Agonisten, Doppelagonisten und Tripelagonisten geriet der Fokus zunehmend auf eine vielversprechende, wenn auch nicht neue Substanzklasse von pharmakologischen Erzeugnissen: die sogenannten Peptide. Was vor einigen Jahren noch unmöglich schien, nämlich einen Gewichtsverlust von 20% des Körpergewichtes und mehr durch ein Medikament möglich zu machen, hat sich mit der Zulassung von Semaglutid, Tirzepatid und wahrscheinlich bald auch Retatrutid inzwischen als medizinisches Konzept etabliert. Mit diesem Durchbruch erhoffen sich viele mehr von dieser ansonsten noch eher wenig verwendeten Substanzklasse, auch wenn schon lange damit experimentiert wird - vor allem im Bereich des enhanced Bodybuilding. Dieser Sport, in dem der Gebrauch pharmakologischer Mittel zur Unterstützung von Muskelauf- und Fettabbau erlaubt ist, gilt allgemein als so etwas wie ein “Versuchskollektiv”, da viele Athleten bereit sind, auch noch wenig erforschte Substanzen mit potenziell positiven Effekten an sich auszuprobieren. Wahrscheinlich trägt auch dieser halblegale Gebrauch von “research chemicals”, also Pharmaka, die sich noch in der Testphase und Entwicklung befinden, dazu bei, dass es manche Medikamente auf den Markt schaffen, weil sie den ersten Menschenkontakt darstellen und ungefähr abgeschätzt werden kann, ob starke Nebenwirkungen auftreten, wie sie wirken, etc. Die Ergebnisse, die Bodybuilder berichten und an andere “Experimentierfreudige” weitergeben kann als “anekdotische Evidenz” bezeichnet werden. Anekdotisch deshalb, weil es zumeist Erfahrungen von Einzelpersonen sind, die nicht zwingend etwas über die allgemeine Wirksamkeit aussagen müssen, wofür klinische Studien vor der Zulassung noch notwendig sind. Doch auch diese haben ihre Limitationen und auch Medikamente, die es durch den Zulassungsprozess schaffen, sind nicht immer nebenwirkungsfrei oder haben bei jedem/r Anwender/in den gleichen Effekt. Wozu also dieser teure und aufwendige Prozess und warum verlässt man sich nicht auf die scheinbar oft nicht weniger aussagekräftige anekdotische Evidenz? Was unterscheidet diese beiden Vorgehensweisen voneinander und für was sind sie jeweils gut? Darauf möchte ich im folgenden Artikel eingehen.

Anekdotische Evidenz und der “reporting bias”

Wie bereits angesprochen zirkulieren in einschlägigen Kreisen derzeit mehrere Peptide, die noch nicht als Medikamente zugelassen sind, jedoch vielversprechende Wirkungen zeigen. Angefangen bei Retatrutid, einem ähnlich, aber noch stärker wirkenden Peptid wie die bereits zugelassenen GLP-1-Agonisten: dieses befindet sich auch bereits in klinischen Wirksamkeitsstudien und steht wohl kurz vor der Zulassung. Aber auch andere Substanzen wie SLU-PP 332, welches als “Sport in einer Pille” bezeichnet wird und ähnliche Effekte wie Bewegung auf zelluläre Prozesse haben soll, oder auch BPC-157, ein die Regeneration und Heilung unterstützendes Peptid, sind bei Bodybuildern in aller Munde. Zumeist haben diese “research chemicals” an Tierversuchen schon positive Ergebnisse erzielt und werden deshalb auf dem (Schwarz-)Markt angeboten, wo Athleten sie ausprobieren, um ihre Leistung zu steigern, besser zu regenerieren, Muskeln auf- und Fett abzubauen. Dies ist allerdings genau der Punkt, an dem anekdotische Evidenz zu einem Problem werden kann. Wirkt ein Peptid nämlich hervorragend, so kann das an der Substanz liegen oder aber auch nicht. Der Athlet nimmt das Präparat nämlich (oft auch polypharmazeutisch) nicht unter kontrollierten Bedingungen ein und es kann von außen oft nicht nachvollzogen werden, was nun wirklich zu dem positiven Effekt geführt hat. Außerdem werden Bodybuilder, die keinen Nutzen aus dem Präparat ziehen, es vermutlich einfach wieder absetzen, ohne dies groß in die Welt hinaus zu posaunen. Wirkt es jedoch gut, so ist dies natürlich ein Grund, es weiterzuempfehlen, in einer eingeschränkten Öffentlichkeit die Kenntnis über den Nutzen zu verbreiten und so die allgemeine Meinung zu etablieren, dass eine Substanz wirkt, auch wenn dies vielleicht lange nicht bei jedem so ist. Natürlich wird sich eher die mehrheitliche Erfahrung durchsetzen, und dennoch liefert die anekdotische Evidenz hier keine belastbaren Aussagen, wie sie in objektiven und randomisierten Studien erreicht werden können. Man spricht vom sogenannten “reporting bias”, also dass nur jene Personen sich aktiv zu Wort melden, die einen Nutzen gespürt haben, während sich die vielen anderen bedeckt halten.

Kontrollierte Bedingungen?

Eine weitere Schwäche von rein anekdotischer Evidenz ist die schwammige Definition des Nutzens sowie die ungeklärten Umstände, unter denen ein “research chemical” appliziert wird. Welche Dosis wird genutzt? Welche anderen Arzneimittel werden konsumiert? Wie äußert sich der Benefit überhaupt und wie stark ist die Wirkung? Wie würde ein Placebo wirken? Das sind nur einige ungeklärte Fragen, die beim Selbstversuch einerseits nicht gestellt werden müssen, was die Hürde natürlich herabsetzt und es möglich macht, dass mehrere Substanzen niederschweflig zur Anwendung kommen und mögliche Nutzen auch entdeckt werden können. Andererseits sind mögliche positive Berichte nur einzelne Erfahrungen und auch als solche zu betrachten, denn einige Erfahrungsberichte zu einem nicht zugelassenen Medikament kommen in ihrer wissenschaftlichen Belastbarkeit niemals an die Evidenz einer Studie heran, selbst wenn das “Patientenkollektiv” vielleicht sogar größer ist.

Was man der anekdotischen Evidenz allerdings auch zugute halten muss, ist, dass Nebenwirkungen ganz sicher nicht untergehen oder unterschätzt werden, sondern eher im Gegenteil. Denn sogar vielleicht nur sehr seltene Nebenwirkungen erlangen durch den reporting bias ein viel größeres Gewicht, da das Einzelschicksal (medial) mehr Aufmerksamkeit bekommt als in einer Studie, in der jeder Proband nur “einer von vielen” ist.

Warum auch Studien nichts garantieren

Wenn man also die gesamten Rahmenbedingungen miteinbezieht, so scheint zumindest klar zu sein, dass eine medizinisch-pharmakologische Studie der anekdotischen Evidenz überlegen ist. Es werden die Ergebnisse und Effekte nicht nur durch verschiedene Messgrößen (entweder Blutwerte oder auch Fragebögen) vereinheitlicht und objektiviert, sodass jeder unter einem “positiven Effekt” auch dasselbe versteht. Weiters wird der gesamte Testprozess überwacht und wissenschaftlich begleitet, sodass die Einhaltung bestimmter Protokolle hinsichtlich Dosis, Dauer der Einnahme, begleitenden Umständen (andere Medikamente etc.) gewährleistet wird. Und schon in der Rekrutierung der Studienteilnehmer wird darauf geachtet, dass es sich um eine repräsentative Gruppe handelt und nicht um vorselektierte Individuen, bei denen mehr oder weniger von einem Medikament zu erwarten ist. Am Ende des Studienzeitraums (der ebenfalls bei allen Probanden gleich ist) liegen den Forschern dann ausreichend Daten vor, die sie nach statistischen Richtlinien auswerten und mit mathematischen Modellen berechnen, ob und welche Effekte messbar waren oder nicht bzw. ob diese auch die Wirkung eines Placebos statistisch signifikant übertreffen. Somit liefert eine Studie eine wirklich belastbare Aussage darüber, ob und wie ein (neues) Medikament wirkt und worauf sich später auch der Zulassungsprozess stützt. Und dennoch ist auch beim Lesen von Studien Skepsis nie schlecht, sondern im Gegenteil äußerst empfehlenswert. Hier ein paar Gründe:

Starres Studiendesign: Nur weil eine Substanz unter gewissen Rahmenbedingungen (nicht) wirkt, leben wir in einer dynamischen, im Versuch nicht wirklich gut reproduzierbaren Welt. Einflussfaktoren aus unserer Umwelt können somit eine mögliche Wirkung sowohl verstärken als auch verringern und nur weil zB eine Ernährungsform in einer Studie gut funktioniert hat, bedeutet das nicht, dass dies im echten Leben genau so der Fall ist. Natürlich kann eine Studie nie auf alle Eventualitäten eingehen und für jegliche mögliche Situation eine eindeutige Aussage treffen - doch dafür kann wenigstens dies für eine ganz bestimmte, wenn auch konstruierte, Ausgangslage der Fall sein.

Individuelle Schwankungen: Auch in Studien gilt, dass die präsentierten Ergebnisse einen Mittelwert darstellen, der noch nichts über die Wirkung und Nebenwirkungen in einem Individuum aussagt. Während manche Menschen vielleicht enorm gute Ergebnisse erzielen, können andere auch keine positive, sondern nur negative Wirkungen spüren - dies lässt sich nie mit vollständiger Sicherheit ausschließen, auch wenn wie Wahrscheinlichkeit für beide Fälle sehr klein ist. Dennoch sei im Kontext von pharmakologischen Studien bzw. dem Assessment der Wirksamkeit von Peptiden und Co. erwähnt, dass jede anekdotische Evidenz (besonders, wenn diese außergewöhnlich gut oder schlecht ist) genauso ein Ausreißer sein könnte und nichts über die Allgemeinwirkung aussagt. Man muss deshalb nicht jedem Medikament, das man einnimmt, misstrauen, doch es bleibt immer eine gewissen Restwahrscheinlichkeit für Zwischenfälle, auch wenn diese mehrfach durch Studien geprüft und zugelassen sind.

Finanzierung: Besonders anekdotische Evidenz hat - gerade beim Thema Supplemente - auch immer einen fahlen Beigeschmack, da Influencer oder Ahtleten oft mit Firmen zusammenarbeiten, die genau jene Produkte verkaufen, die angeblich so gut wirken sollen. Es steckt somit auch ein finanzielles Interesse hinter der Präsenz und “Werbung” für die Wirksamkeit eines Supplements/Peptids etc. Studien sollten eigentlich immun gegen solche Einflussnahme sein, doch die Praxis zeigt, dass dem oft nicht so ist. Es ist schließlich die Pharmabranche selbst, die die Entwicklung neuer Präparate sponsert und möglichst gute Ergebnisse in möglichst jeder Studie sehen möchte. Was wissenschaftlich zwar als “Conflict of interest” deklariert werden muss, hindert jedoch große Konzerne nicht daran, jährlich Milliarden in solche Studien zu stecken. Dennoch kann diesen wissenschaftlichen “trials” in den allermeisten Fällen Vertrauen geschenkt werden - zumindest mehr als der anekdotischen Evidenz. Es bleibt jedoch festzuhalten, dass auch die “wissenschaftliche” Schiene nicht ganz unbeeinflusst von äußeren Interessen bleibt.

Statistisch signifikant vs. praktisch relevant: Auch kaum merkliche Effekte können, bei ausreichender Probandenzahl, ein statistisch signifikantes Studienergebnis liefern - was aber nicht unbedingt immer bedeutet, dass ein gewisses Präparat nun wirklich besonders wirksam ist. Es macht einen Unterschied, ob zB ein Nahrungsfette bindendes Medikament, welches auf der Verpackung verspricht, den Gewichtsverlust zu erleichtern, vielleicht im Vergleich zu Placebo einen “Mehrwert” von 0,5kg während dem Studienzeitraum bringt, oder ob ein Peptid, welches zwar noch nicht zugelassen, aber in der Bodybuilding-Szene schon verabreicht wird, einen Gewichtsverlust von 25% und mehr ermöglicht. Dieses Beispiel soll veranschaulichen, dass nur, weil die “Wirksamkeit” durch “klinische Studien” belegt ist, das noch nichts über den tatsächlichen Effekt und sein Ausmaß aussagen muss. Denn ob ein Medikament nun wirksam ist oder nicht, hängt auch vom Studiendesign und der Ausgangshypothese ab: Vergleicht man beispielsweise Globuli mit einer Kontrollgruppe, die kein Placebo bekam, so erzielen auch diese einen statistisch signifikanten Effekt, auch wenn der versprochene Wirkstoff in den Zuckerkügelchen vielleicht gar nicht mehr nachweisbar ist. Erhält die Kontrollgruppe hingegen Placebo, so kommt die Studie zu einem ganz anderen Schluss - nämlich dass die homöopathischen Mittel eben nicht statistisch signifikant wirken, da auch die Placebogruppe einen gewissen Effekt spürte, der in etwa gleich groß war.

Hat anekdotische Evidenz also gar keinen Wert?

Doch, auf jeden Fall - sogar einen sehr großen. Denn die große Stärke von wissenschaftlichen Studien, dass sie nämlich unter kontrollierten Bedingungen ablaufen, ist gleichzeitig auch deren größte Schwäche. Der Alltag und die Lebensrealität vieler Menschen sieht nämlich oft komplett anders aus, als es in Studienprotokollen festgelegt ist. Diese starren Rahmenbedingungen sind zwar einerseits notwendig, um belastbare Aussagen treffen zu können, andererseits können Erkenntnisse eben nur sehr bedingt auf den Alltag übertragen werden, gerade wenn es um Lebensstilinterventionen und deren Effektivität geht.

Ein weiterer Punkt, der zwar vielleicht nur unter vorgehaltener Hand genannt wird, aber von dem auch die Forschung extrem profitiert, ist, dass Privatpersonen selbstverantwortlich sind und oft Risiken eingehen, die nie im Rahmen einer wissenschaftlichen Studie erlaubt wären, weil keine Ethikkommission sie bewilligen würde. Gerade wenn es um neue Medikamente, Präparate für Regeneration, Muskelaufbau und Fettverlust geht, leisten Bodybuilder (auch mit den angewandten Dosierungen) oft Pionierarbeit, ohne die die Forschung viel länger brauchen würde, um eventuelle Schwächen, Risiken und Nebenwirkungen, aber eben auch Stärken zu entdecken. Es mag vielleicht etwas makaber erscheinen, doch tatsächlich liefern genau diese freiwilligen Selbstexperimente die nötigen Erfahrungswerte, auf Basis derer dann weitere Schritte innerhalb ethischer Richtlinien gesetzt werden können. Um sowohl ein Positiv- als auch ein Negativ-Beispiel zu nennen: Vor einigen Jahren waren die sogenannten SARMs (“selektive Androgenrezeptormodulatoren”) besonders im Fokus der Forschung, da sie - wie der Name schon sagt - dieselben Rezeptoren stimulierten wie Androgene, ohne dabei aber wie die körpereigenen Hormone aufgebaut zu sein. Was zuerst vielversprechend klang, ist leider bis heute aufgrund zahlreicher Nebenwirkungen nie über die Phase der Tierversuche hinaus gelangt. Ohne diverse Bodybuilder, die Substanzen wie MK-677 aber damals schon angewandt hatten, hätte diese Erkenntnis vermutlich noch länger auf sich warten lassen. Als positives Beispiel möchte ich erneut einen Vertreter der GLP-Agonisten nennen: Retatrutid. Schon lange, bevor dieses sich in klinischen Studien befand, geschweige denn wie derzeit kurz vor der Zulassung steht, wurde es in einschlägigen Kreisen bereits getestet, obwohl es damals schon erwiesenermaßen wirksame andere Präparate wie das Semaglutid gab. Doch die Innovation wurde weiter angetrieben, und so kommt Retatrutid wohl bald als der wirksamste GLP-1-Agonist auf den Markt.

Dies soll in keinster Weise eine Verherrlichung des Schwarzmarktes, off-label-uses oder gefährlicher Selbstexperimente sein. Doch es ist einfach festzuhalten, dass den Erkenntnissen einiger “experimentierfreudiger” Athleten es zu verdanken ist, dass wir mit unserem Wissen heute dort stehen, wo wir sind.

Fazit

Um die Wirksamkeit eines Medikaments, einer Lebensstilintervention oder auch einer Trainingsmethode sowohl qualitativ als auch quantitativ nachweisen zu können, braucht es kontrollierte Bedingungen und wissenschaftliche Studien. Alles andere wäre unseriös und könnte ebenso gut ein Zufall sein, was der großen Masse an Interessenten nur wenig Information liefert. Einzelne Erfahrungsberichte sind deshalb in diesem Kontext nur sehr begrenzt aussagekräftig und die anekdotische Evidenz stößt hier klar an ihre Grenzen. Dennoch sind es gerade einzelne - wohlwollend formuliert - “Fallstudien”, die Anhaltspunkte dafür liefern, wie später Forschungsfragen formuliert werden und Studien tatsächlich designed werden können. Und auch die Umsetzung im Alltag, die Anwendung im echten Leben und welche Einflüsse außerhalb von “sterilen” Bedingungen noch mitspielen, ist in der anekdotischen Evidenz sicher besser abgebildet als in einem starren Studienprotokoll. Beide Wege “zur Wahrheit” haben demnach für sich genommen ihre Daseinsberechtigung und im Optimalfall kombiniert man wissenschaftliche Ergebnisse mit den Erfahrungen einzelner Personen, um für sich die besten Schlüsse zu ziehen, egal ob es um Medikamente, Training oder auch Ernährung geht.

Eigener Ansatz: Am Ende des Tages können Studien und auch Erfahrungsberichte jedoch nie mehr liefern als einen Anhaltspunkt dafür, was für dich selbst funktionieren KÖNNTE. Egal, ob es sich um Medikamente, Trainingspläne, Ernährungsphilosophien oder andere Dinge handelt - was für jeden und jede Einzelne funktioniert, wird sich IMMER unterscheiden. Jeder Mensch wird unterschiedliche Wirkungen und Nebenwirkungen bei der Einnahme diverser Pharmaka spüren, was physiologische und auch psychologische Ursachen (etwa die Erwartungshaltung) hat. Es gibt Menschen, die mit einem Trainingsplan die besten Fortschritte erzielen, der 3 Krafttrainings pro Woche vorsieht, weil sich genau dieser mit ihrem Alltag langfristig vereinbaren lässt. Gleichzeitig kann es sein, dass andere Athleten mit mehr Zeit gerne 6x pro Woche trainieren, weil sie Routine und einen ähnlichen Tagesablauf schätzen und so langfristig dranbleiben können. Selbiges gilt auch für die Ernährung - manche ziehen vielleicht einen starren Mealplan vor, bei dem sie nichts mehr hinterfragen müssen, während wieder andere die Flexibilität und Abwechslung mehr brauchen und lieber nur ihre Makronährstoffe tracken. Was also für DICH funktioniert und die Ergebnisse liefert, die du dir wünschst, wird immer auch ein bisschen ein “trial and error” bleiben, bei dem du verschiedene Ansätze ausprobierst und letzten Endes das Beste aus allen Welten für dich herausfinden darfst. Studien können dabei - genau wie auch anekdotische Evidenz - gute Anhaltspunkte liefern, was im Durchschnitt bzw. in Einzelfällen (nicht) zu funktionieren scheint - was jedoch noch nicht bedeutet, dass das für dich auch so stimmen muss. Und dennoch kann es als Orientierung im Dschungel der (Fehl-)Information dienen, um so gut wie möglich den besten Ansatz für sich selbst zu finden.

Wie stehst du zu dem Thema? Vertraust du nur wissenschaftlichen Studien? Oder muss es bei dir jemand Vertrautes sein, der dir einen Tipp gibt, damit du ihn auch wirklich umsetzt? Lass mich gerne deine Meinung dazu wissen! Alles Gute inzwischen, Jakob

Jakob Dellasega