Forschungsthemen

Abbildung des Wassermann Tests zum Nachweis der Syphilis (Aus: Maximilian Herzog, 1910: A Text-Book on Disease-Producing Microörganisms [sic]. Philadelphia and New York: Lea & Febiger) und Person mit negativem Covid-19-Antigentest (Pixabay/Alexandra Koch 2021). 

Nr 77
Praktiken der Validierung in der Biomedizinischen Forschung
Nachdem spätestens 2021 deutlich wurde, dass die Corona-Pandemie nicht vollständig eingedämmt werden könne, wurde die Bewertung von Covid-19-Tests zu einem vieldiskutierten Thema in der Politik und Öffentlichkeit. Können wir uns ausreichend auf Schnelltests verlassen, um Schulen, Geschäfte und Museen wieder zu öffnen, während die Pandemie noch in vollem Gange ist? In Podcasts und Zeitungen erläuterten wissenschaftliche Expert*innen Fachbegriffe wie die „Spezifität“ und „Sensitivität“ von Tests. Diese Bewertungskategorien werden herangezogen, um darzustellen, wie groß der Anteil der Infizierten und Nicht-Infizierten ist, die mit dem betreffenden diagnostischen Test richtig erkannt werden.

Die Vorstellung, dass diese Größen eine weitgehend kontextunabhängige Eigenschaft des Tests sind, ist eng verknüpft mit der Geschichte ihrer Einführung: Im frühen zwanzigsten Jahrhundert verwandten Serologen (die Blut und andere Körperflüssigkeiten untersuchten) die Begrifflichkeit von Spezifität und Sensitivität innerhalb einer Debatte über die richtige Durchführung und Interpretation der Wassermann-Reaktion, die zur Diagnose von Syphilis diente. Die Interpretation der Aussagekraft hing von Prämissen zur Beschaffenheit der Reaktion und zu den verschiedenen Stadien der Infektionskrankheit Syphilis ab. Später lösten sich die Begriffe von diesen Annahmen und Methoden und wurden als statistische Größen kontextunabhängig verwandt. Gegenwärtig rückt die Frage nach den Voraussetzungen und Bedingungen, unter denen die Spezifität und Sensitivität eines Tests aussagekräftig sind, wieder stärker in den Fokus. 

Das Beispiel der Sensitivität und Spezifität von diagnostischen Tests – das auch der Ausgangspunkt eines Projekts in der Forschungsgruppe ist – verdeutlicht, dass die Frage nach der Interpretation von Testergebnissen eine lange Geschichte hat, die manchmal verdeckt oder vergessen und manchmal reaktiviert wird. Dieser Geschichte(n) widmet sich die neue Max-Planck-Forschungsgruppe „Praktiken der Validierung in der biomedizinischen Forschung“. Wie wurde „Validität“, „Spezifität“ oder „Reliabilität“ praktiziert – und wie wurden diese Konzepte zueinander in Bezug gesetzt oder voneinander unterschieden? Wie wurde Unsicherheit erfasst, reguliert und mit ihr argumentiert? Anhand dieser Fragen verfolgen wir die Entwicklung der modernen biomedizinischen Forschung und verorten gegenwärtige Herausforderungen für die Anwendung und Beurteilung von biomedizinischem Wissen.

Validität historisieren

Ein Schlüsselbegriff der modernen biomedizinischen Forschung ist „Validität“. Im zwanzigsten Jahrhundert hielt dieser technische Begriff, dessen Genealogie in die Logik, Statistik und Psychologie zurückreicht, Einzug in viele Wissenschaften. „Validität“ bezeichnet das Ausmaß (aber nicht zwangsläufig die Zuverlässigkeit), in dem ein Testverfahren den (abstrakten) Gegenstand, den es zu treffen beansprucht, tatsächlich trifft. Die Psychometrie beispielsweise würde einen Intelligenztest als „valide“ bezeichnen, wenn er Auskunft über die hypothetische Entität „Intelligenz“ gibt.

Die Forschungsgruppe untersucht die philosophischen und historischen Grundlagen dieser Auffassung von Validität und rekonstruiert die Wege, auf denen Konzepte und Praktiken der Validierung in der Mitte des zwanzigsten Jahrhunderts die Biomedizin erreichten und dort weiter geformt wurden. Uns interessiert dabei besonders, wie „Validierung“ praktiziert wurde und welche Herausforderungen sich bei der Bewertung der Aussagekraft biomedizinischer Studien für die jeweilige Forschungsfrage stellten.

So untersuchen wir beispielsweise, welche Auswirkungen der exponentielle Zuwachs an Forschungsgemeinschaften, die Entstehung internationaler Forschungsorganisationen in der Nachkriegszeit und technologische Entwicklungen, wie etwa die im Bereich des Humangenomprojekts, auf die Einführung standardisierter Validierungsverfahren hatte. In jüngster Zeit wurde die mangelnde Reproduzierbarkeit vieler veröffentlichter Forschungsergebnisse, die so genannte Replikationskrise, als epistemisches und wirtschaftliches Problem u.a. für die Testung von aussichtsreichen Wirkstoffkandidaten in klinischen Studien thematisiert. Anhand solcher Fallstudien verfolgen wir, wie die zunehmende Hochskalierung biomedizinischer Forschung die Debatten und Methoden zur Validierung in vielfacher Hinsicht beeinflusste.

Im vergangenen Jahrhundert haben sich nicht nur die Praktiken der Validierung, sondern auch die biomedizinischen Zugänge zu Gesundheit und Krankheit grundlegend gewandelt. Wir interessieren uns daher besonders für die Geschichte und Philosophie wissenschaftlicher Methoden, die der Überprüfung der Validität von Forschung über veränderliche Ziele dienen, wie z.B. in der Forschung über psychische Störungen.

 

Validity and reliability
Validität und Reliabilität

Validität und Reliabilität (Nevit Dilman, 2012/CC-BY-SA), sowie modifizierte Version mit Darstellung der Problematik eines Moving Target das die Forschungsgruppe besonderes interessiert.

 

Erste Forschungsprojekte und Arbeitsgruppen

Die Forschungsgruppe vereinigt philosophische und historische Perspektiven auf die Genese und den Wandel von evaluativen Methoden und Kategorien. Die ersten Projekte einzelner Gruppenmitglieder fokussieren sich auf die Bedeutung von „Spezifität“ und „Sensitivität“ in diagnostischen Tests im langen zwanzigsten Jahrhundert (Nicholas Binney) und erforschen die Suche nach einem universellen Verständnis von Validität sowie die sich wandelnden Maßstäbe der Validierung in der Nachkriegszeit (Alfred Freeborn). Zu unseren Quellen gehören neben Veröffentlichungen und Archivmaterial auch Interviews. Hierfür arbeiten wir mit einer Kombination aus Methoden der Digital Humanities und qualitativer historischer Forschung, um neue Möglichkeiten zu erproben, bereits verfügbare mündliche Quellen einer sekundären Nutzung zu unterziehen. Zudem koordinieren wir die beiden interdisziplinären Arbeitsgruppen:

in denen wir gemeinsam und vergleichend erforschen, wie „Validität“ und „Validierung“ global angewandt und lokal angepasst wurden, um ein vielfältiges Spektrum von Objekten zu bewerten und zu reglementieren – vom toxikologischen Test bis hin zu psychiatrischen Konstrukten.

Examiner's Kit 1972 Norms Edition of the Third Revision Form

Materialien zur Durchführung eines Intelligenztests. Sasha Bergstrom-Katz, 2020: Examiner's Kit 1972 Norms Edition of the Third Revision From L-M Stanford-Binet Scales by Terman-Merrill. Vollständiges Kit. Digitales Foto.

Geschichte und Philosophie des biomedizinischen Wissens perspektivieren

Der eingangs genannte Wassermann-Test hat das biomedizinische Verständnis der Labordiagnostik geprägt, spielte aber auch eine bedeutende Rolle in den Anfangstagen der Wissenschaftsgeschichte, -philosophie und -soziologie. Er stand im Zentrum des von Ludwik Fleck 1935 publizierten Werks Entstehung und Entwicklung einer wissenschaftlichen Tatsache, welches nicht zuletzt als Inspiration für die prominente wissenschaftshistorische Beschreibung von „Paradigmenwechsel“ (Kuhn) gewürdigt wurde. Fleck war ausgebildeter Arzt und Serologe. Wir sehen dies als Anregung, über die Überschneidung der Perspektiven von „Akteurinnen und Akteuren“ einerseits (z. B. biomedizinisch Forschenden) und der „Analyse“ andererseits (z. B. der Wissenschaftsphilosophie) nachzudenken, wenn wir die historische Entstehung von Validitätskonzepten untersuchen. Paul Meehl (1920-2003) war beispielsweise klinischer Psychologe und zugleich Mitgründer des Minnesota Center for Philosophy of Science. Er war in den 1950er Jahren daran beteiligt, den Begriff der „Konstruktvalidität“ einzuführen, um – ganz im Sinne von Karl Poppers Wissenschaftstheorie – Zweifel darüber signalisieren zu können, ob ein Test tatsächlich über das aussagekräftig ist, worüber er etwas aussagen soll.

Das Ideal der Validität in der Biomedizin ist und bleibt ein transdisziplinäres Projekt, das die Geschichte und Philosophie miteinschließt. Indem wir über dieses Projekt und unseren Platz darin nachdenken, strebt die Forschungsgruppe ein besseres Verständnis der Geschichte und Philosophie von evaluativen Begriffen und Methoden an – sowohl in der biomedizinischen Forschung als auch bezogen auf Kategorisierungen der Wissenschaftsgeschichte und -philosophie.