Aronson: Methods of Research in Social Psychology

Kapitel 1: An Introduction to Experiments

Verständnis der Methodologie/ Forschungslogik nützlich für:

  • das Verständnis für informelle eigene Forschung zur Verbesserung der eigenen Leistung im Beruf
  • Bewertung der veröffentlichten Untersuchungen
  • Verbesserungen der Schlussfolgerungsfähigkeit in alltäglichen Problemen

3 Gründe für die Anwendung nicht-experimenteller Verfahren:

  • Kausalität von Variablen unwichtig, eher z.B. Existenz eines Phänomen
  • Experiment wäre nicht ethisch vertretbar oder nicht unmöglich durchzuführen
  • Experiment nicht ausreichend, Ergänzungen durch andere Methoden notwendig


Experimente ermöglichen, kausale Zusammenhänge festzustellen, durch Ausschluss von möglichen Fehlerquellen wird garantiert, dass die Veränderung der AV von UV abhängen und die UV die AV damit verursacht.

Grundidee des Experiments:

  1. Formulierung der Vorhersage/ Hypothese, häufig basierend auf einer Theorie
  2. Transformation der allgemeinen Hypothese in eine spezifische Frage
    UV = Ursache für die kausale Sequenz
    VL schafft, kontrolliert, manipuliert die Variation der UV, sie ist abhängig von anderen kausalen Einflüssen, Anzahl der UV bestimmt Anzahl der Bedingungen (mind.2: Experimental- und Kontrollgruppe)
    AV = Effekt der kausalen Sequenz, Wert der AV hängt von den Änderungen der UV ab
    Variable = Wert der VP in einer bestimmten Bedingung und zu einem bestimmten Zeitpunkt stetige V: innerhalb bestimmter Grenzen unendlich viele Werte möglich (z.B. Gewicht)
    diskrete V.: Werteanzahl begrenzt (z.B. natürlich dichotom, wie Geschlecht)
  3. Transformation der konkreten Frage in beobachtbare Ereignisse = empirische Realisation


Fehlerquellen = jeder weitere Einfluss auf AV außer der UV ( individuelle Unterschiede zwischen VP, Erwartungen des VL, ...)
Zufallsfehler = externaler Einfluss, der in allen Bedingungen mit gleicher Wahrscheinlichkeit auftaucht ( häufig wird dadurch die Varianz der Ergebnisse innerhalb aller Bedingungen gleichermaßen vergrößert und damit die Signifikanz verkleinert)
Zusammenhang zwischen UV und AV wird nicht erkannt
systematischer Fehler = Einfluss auf alle Werte einer Bedingung in gleiche Richtung
Zusammenhang zwischen UV im und AV wird fälschlicherweise angenommen

3 Methoden zur Vermeidung von Fehlerquellen:

  1. Eliminierung eines systematischen Fehlers durch Umwandlung in Zufallsfehler: systematische Fehler entstehen häufig durch über Überrepräsentierung ähnlicher VP/ VL in einer Bedingung, durch zufällige Zuordnungen der VP/ VL zu Experimentalgruppen werden solche Überrepräsentationen auf alle Bedingungen durch Zufall gleichwahrscheinlich verteilt und mögliche fehlerhafte Effekte damit ausgeschlossen
    Randomisierung
  2. Eliminierung eines Zufallsfehlers durch Konstanthalten der fraglichen Variable: mögliche Werte der fraglichen Variable Werte auf wenige/ einen reduziert (z.B. Zufallsvariable bei Gruppendruck ist Gruppengröße: Experiment nur mit 7 Menschen pro Gruppe, keine Aussagen über mit 3,8, usw. Menschen)
    Reduzierung der Generalisierbarkeit des Experiments
  3. Eliminieren von Fehlerquellen durch systematisches Variieren
    Variable wird zu weiteren UV des Experiments
    sicherste und aufwändigste Methode zur Fehlerquellenvermeidung
    Variation mehrerer UVs erlaubt Interaktionen zwischen UVs zu entdecken (bei a) und b) sind nur HE beobachtbar, da gehen diese Infos verloren)
    Interaktion = Effekt einer UV ist vom Wert der anderen UV abhängig
    Haupteffekt = nur durch eine UV verursachte Effekte


Ausschluss aller Fehlerquellen in einem Experiment ist unmöglich, daher sollte der Versuchsplan nur die gravierendsten und für das Experiment entscheidenden berücksichtigen

Konfundierung liegt vor, wenn eine andere Variable sich mit der AV ändert, dies sollte ausgeschlossen werden

Artefakt = Messfehler, 2 spezielle Arten:

  • Hawthorne-Effekt: Verhaltensänderung der VP allein durch Wissen an einem Experiment teilzunehmen
  • VL-Effekt: Ergebnisänderungen durch Erwartungen des VL


Alternativerklärung = ermöglicht neben den gezogenen Schlüssen alternative Erklärungen für die Ergebnisse einer Untersuchung, gegen die sich Forscher durch klare Definitionen, Vermeidung von Konfundierungen, usw. absichern sollten
Replikation = Wiederholung einer Studie
Direkte Replikation: Wiederholung der Studie unter gleichen Bedingungen (Stabilität)
Systematische Replikation: Wiederholung der Studie mit abgewandelten Bedingungen ( Erweiterung)

Experiment =

  • Kontrolle über AV, systematische Beobachtung der AV unter verschiedenen Bedingungen
  • Randomisierung, äquivalente Gruppen bis auf die Erfahrung mit AV
  • ermöglicht Feststellen von Kausalitäten, weil Verhaltensänderung wegen Randsomisierung nur auf AV zurückführbar
  • realitätsfern


Quasiexperiment =
Zufälligkeit der Gruppenzuordnung nicht gegeben, weil die Gruppeneinteilung natürlich vorgegeben ist (z.B. Geschlecht)
Gruppen nicht mehr eindeutig äquivalent, weil natürliche Zuordnung mit anderen Variablen einhergehen kann, die mit der AV konfundieren können
(z.B. Frauen verfügen häufig über weniger Selbstbewusstsein als Männer, zeigen deswegen Effekte des Gruppenzwangs auch schon bei kleineren Gruppen)
AV kann nicht mit Sicherheit als die einzige Ursache angenommen werden

Korrelationale Studie =
Untersuchung der Beziehung zwischen zwei Variablen, die man messen kann (keine Bedingungen, Untersuchung von natürlichen Sachverhalten)
Korralitionskoeffizient gibt Grad des Zusammenhangs an
- hoher Zusammenhang entspricht nicht der Kausalität (unklar: X verursacht Y, Y verursacht X, Mediatorvariablen)
+ Vorhersagen möglich

Kapitel 2: Einige Probleme mit Experimenten in der Sozialpsychologie

  • In den 40ern, 50ern fanden sich Vp in Experimenten wieder (Asch, Milgram), in denen intensive, involvierende Ereignisse sich entgegen ihrer Erwartungen entwickelten
  • die heutigen experimentellen Methoden haben sich verändert, dies liegt zum einen an ethischen Fragen und zum anderen daran, dass andere Fragen gestellt werden, z.B. in der sozialen Kognitionsforschung
  • es gibt mehr Experimente, in denen die Vp unbeteiligte Zuschauer von geschriebenen oder aufgenommenen Reizen sind: Urteilsexperimente (Bsp. Kahneman und Tversky)


Auswirkung (impact) und Kontrolle

  • eine Hauptdeterminante der Kontrolle in Experimenten ist das Ausmaß, in dem individuelle Differenzen die Ergebnisse eines Experiments beeinflussen können
  • Möglichkeit zur Kontrolle: Messwiederholungen
  • zufällige Zuweisung zu den experimentellen Bedingungen sorgt dafür, dass die Variabilität keine systematische Fehlerquelle wird, aber trotzdem können so viele Zufallsfehler entstehen, dass die Effekte des treatments verdeckt werden.
  • Kontrolle über die Reizsituation: Reizsituation interagiert mit individuellen Unterschieden zwischen den Vp, die aus ihren unterschiedlichen vergangenen Erfahrungen in ähnlichen Situationen und unterschiedlichen Interpretationen auch einer identischen Situation entstehen


Der Kompromiss zwischen Auswirkung und Kontrolle

  • Vl muss Reizsituation wählen, die bedeutungsvoll und involvierend ist und gleichzeitig die Variabilität minimieren, die durch unterschiedliche Interpretationen der Situation entsteht
  • es gibt keine generelle Regel für den Kompromiss zwischen impact und Kontrolle
  • Kontrolle über die Variablen und Auswirkung auf die Vp wird reduziert durch Faktoren wie ethische Überlegungen, Zeitrestriktionen, Wissen der Vp, dass sie sich in einem Experiment befinden
  • treatment, das verwendet wird repräsentiert einen Kompromiss zwischen dem Verlangen des Vl die Intensität und Effektivität des Reizes zu maximieren, um die Variabilität durch die individuellen Differenzen aufzuheben und seiner Verantwortung für das Wohlergehen der Vp
  • wenn Realismus erhöht wird, um mehr Auswirkungen zu haben opfert man Kontrolle, z.B. in naturalistischen Settings
  • in Tierexperimenten wird Relevanz geopfert, um höhere Kontrolle zu erlangen
  • wenn Auswirkung geopfert wird, kann es sein, dass das treatment das Verhalten der Vp nicht messbar beeinflusst


Die Auswirkung- Kontroll- Dimension: zwei Beispiele

  • Beispiel für hohe Kontrolle: Hovland und Weiss, 1951
    Experiment in Serie von Studien der Einstellungsänderung im Yale- Programm
    Frage: verändert ein glaubwürdiger Kommunikator Einstellungen stärker oder weniger stark als ein weniger glaubwürdiger?
    gleiche Kommunikation für beide Gruppen, unterschiedlich glaubwürdige Kommunikatoren, 5 Tage vorher Fragebogen zu Einstellungen auch bezüglich des relevanten Themas und Bewertungen der Glaubwürdigkeit von Quellen
    4 verschiedene Themen (befürwortende vs. ablehnend), 8 verschiedene Kommunikatoren (glaubwürdig vs. unglaubwürdig)
    danach Fragebogen, Ergebnisse waren signifikant, aber schwach, die Unterschiede in der wahrgenommenen Glaubwürdigkeit waren groß, aber die Unterschiede in der Einstellungsänderung gering
  • Beispiel für starke Auswirkungen: Murray, 1963:
    Vp hatten einen Monat Zeit, um ihre persönliche Philosophie zu beschreiben, Kopie davon wurde einem Anwalt gegeben, und Vp erhielt die Kopie der Philosophie des Anwalts
    die beiden diskutierten die Philosophien, der Anwalt kritisierte die Philosophie der Vp stark
    es ist hier schwer zu determinieren, welcher Aspekt des Treatments die Antworten der Vp beeinflusst
    Fazit: die beiden Ziele Kontrolle und Auswirkung stehen in kontinuierlichem Spannungszustand, wenn eines dominiert, opfert man das andere
    man könnte als Kompromiss in einer Studie zur Glaubwürdigkeit des Kommunikators einen Film zeigen, mit einem dramatischen und artikulierten Kommunikator


Multiple Bedeutung und systematische Replikation

  • Erlangung von Auswirkung kann nicht nur in Verringerung der Kontrolle resultieren, sondern auch in erhöhter Anzahl möglicher konzeptueller Konstrukte, die mit der UV assoziiert sind, da der Reiz komplex ist, weiß man nicht, welche der Komponenten des Reizes verantwortlich ist für die beobachteten Verhaltensänderungen
  • dieses Problem wird Problem der multiplen Bedeutung genannt


Multiple Bedeutung

  • man kann quasi für jedes Experiment alternative Erklärungen finden
  • wenn man ein Experiment untersucht, sollte man sich zunächst fragen, worin der Unterschied zwischen den experimentellen Bedingungen besteht
  • der Autor hat meist eine einzelne konzeptuelle Variable im Kopf, diese muss in eine experimentelle Prozedur übersetzt werden
  • das Problem ist, dass es nicht zwangsläufig eine eins- zu- eins- Korrespondenz zwischen der konzeptuellen Variable und ihrer empirischen Realisierung gibt
  • die konzeptuellen Variablen in der Sozialpsychologie sind oft der Alltagssprache entnommen, wie Aggression, Emotion, Schuld
  • die definierenden Charakteristiken vieler Konzepte werden nicht immer klar angegeben vom Autor, unterschiedliche konzeptuelle Definitionen eines psychologischen Prozesses können zu unterschiedlichen empirischen Realisierungen führen und die Messung unterschiedlicher Verhaltensweisen suggerieren, entsprechend ist es schwierig, die Ergebnisse von zwei Experimenten zu vergleichen, die beide den gleichen Prozess (also die gleich konzeptuelle Variable??) messen


Verfeinerung konzeptueller Variablen: systematische Replikation
Es gibt keine Standardmethoden zur Manipulierung und Messung von konzeptuellen Variablen
Es gibt zwei Eigenschaften von Serie von Experimenten, die gegeben sein müssen, um sagen zu können, dass man es mit einer einheitlichen konzeptuellen Variable zu tun hat:

  1. Es muss eine Anzahl empirischer Techniken (UVs) gegeben sein, die sich in möglichst vielen Aspekten unterscheiden und nur diese zugrunde liegende konzeptuelle Variable gemeinsam haben.
    jede dieser Techniken muss dann im gleichen experimentellen Paradigma angewendet werden, wenn sie alle das gleiche Ergebnis erzielen, kann man sich sicherer sein, dass es die gemeinsame zugrunde liegende Variable ist, die die Ergebnisse produziert
    Bsp.1: Miller manipulierte verschiedene Prozeduren, die Hunger beeinflussen könnten, wie Läsion im Hypothalamus, Injektion angereicherter Milch in den Bauch, normale Aufnahme von Milch über den Mund
    Bsp.2: Greenwald et. al., Untersuchungen zum sleeper effect:
    Def: verschwindende Effekte der Quellenglaubwürdigkeit über die Zeit; Wahrnehmende dissoziieren eine Quelle vom spezifischen Inhalt der Botschaft, die Überzeugung einer unglaubwürdigen Botschaft kann sich erhöhen mit der Zeit, die einer glaubwürdigen Quelle kann sich verringern
    Ob der sleeper effect auftauchte oder nicht, lag an einer simplen Operation: wenn die Glaubwürdigkeit einer Quelle vor der Botschaft präsentiert wurde gab es keinen sleeper- effect, wenn sie nach der Botschaft präsentiert wurde trat er hingegen auf
    Man kann nicht nur über eine Serie von Experimenten hinweg Replikationen durchführen, sondern auch innerhalb eines einzelnen Experiments, d.h. mehrere empirische Realisierungen der UV verwenden, z.B. mehrere glaubwürdige Quellen verwenden
    Internale Analyse: Ausführen eines Manipulationschecks oder andere relevante Maße verwenden, um die Beziehung zwischen tangierenden Variablen systematisch zu untersuchen in Bezug auf die zentrale Variable der Hypothese, diese Untersuchung von Inkonsistenzen in den eigenen Experimenten können zu neuen Ideen und Vorstellungen führen

  2. Zeigen, dass eine bestimmte empirische Realisierung einer konzeptuellen Variable eine Anzahl verschiedener Ergebnisse (AVs) hervorbringt, die alle theoretisch mit der UV verbunden sind
    D.h. in der ersten Prozedur wird die gleiche AV verwendet, um zu sehen ob die verschiedenen empirischen Realisierungen die gleichen Effekte produzieren, jetzt testet man die Effekte der gleichen empirischen Realisierung auf verschiedene AVs
    Man kann zwei Experimente, die verschiedene Operationen für die UV, verschiedene Situationen für die Manipulation verwenden und verschiedene AVs messen, nicht vergleichen


Schwierigkeiten bei der systematischen Replizierung

  • die Technik der systematischen Replizierung wird so selten verwendet, weil sie oft schwer oder unmöglich ist, es ist oft schwer die empirische Realisierung zu modifizieren, ohne die gesamte experimentelle Situation zu verändern, damit sie noch glaubwürdig ist für die Vp
  • man ist also oft gezwungen große Anzahl von Faktoren simultan variieren zu lassen
  • wenn sich das neue Experiment vom alten sowohl in Bezug auf die UV, als auch auf die AV voneinander unterscheidet, gibt es keine empirische Basis mehr um zu behaupten, dass die beiden Experimente etwas miteinander zu tun haben
  • und wenn das zweite Experiment, bei dem mehrere prozedurale Veränderungen gemacht wurden, nicht erfolgreich war, weiß man nicht, welche der Veränderungen die entscheidende war, wenn die Replikation aber ähnliche Ergebnisse hervorbringt, erhöht dies nicht nur Vertrauen in Reliabilität des Originalergebnisses, sondern auch in die Validität der konzeptuellen Variable, da man generelle Effekte hat


Andere Methoden, um die Bedeutung von konzeptuellen Variablen zu entdecken

  • man kann ein Experiment durchführen, das designed ist, um die Bedeutung der Variablen zu verfeinern, anstatt eine spezifische experimentelle Beziehung zwischen den Variablen zu replizieren
  • dieses Experiment zielt darauf ab andere Arten von Daten zu produzieren, die immer noch konsistent mit der originalen konzeptuellen Variablen sind
  • ein anderer Weg, um Informationen über die konzeptuelle Variable zu erlangen ist der, die hypothetischen intervenierenden Prozesse zu messen (durch Selbstberichte oder nonverbale cues)


Selbst- Bericht- Maße

  • diese werden oft verwendet als Indikator für subjektive Aspekte der konzeptuellen Variable
  • aber sie haben limitierten Wert, müssen mit Vorsicht verwendet werden, da ihre Interpretation schwierig ist, das Hauptproblem dabei ist, dass die Vp entweder unfähig oder nicht gewillt sind die stattfindenden Prozesse zu kommentieren
  • Bsp.: Latane und Darley: Rauchstudie: Vp gaben an, dass sie den anderen anwesenden Personen keine Aufmerksamkeit schenkten, aber ihr Verhalten zeigt, dass sie das wohl taten
  • weiteres Problem der Selbstberichte: die Aufforderung über einen Prozess zu berichten kann mit ihm interferieren, die Frage kann zu einem Artefakt werden, die verantwortlich ist für die Ergebnisse, man kann dann also nicht mehr sagen, ob das Verhalten an dem Treatment liegt, oder an der Frage, oder an der Kombination von beidem
  • wenn ein Experiment Täuschung beinhaltet, kann die Aufforderung internale Prozesse zu berichten, den Vp das Ziel des Experiments bewusst machen
  • d.h. Selbstberichte sollten nicht als finale Daten angesehen werden, aber sie können Anhaltspunkte liefern, welche Variablen manipuliert werden sollten und welche Fragen man in folgenden Experimenten stellen sollte, sie sind also als Pilot- Tests sinnvoll
  • Nützlichkeit von Selbstberichten hängt also davon ab, welche Art von Frage der Vl beantworten will, ob Täuschung involviert ist, welche Art von Erfahrungen die Vp berichten soll, und ob es Unterschiede in den wahrgenommenen Konsequenzen unterschiedlicher möglicher Antworten gibt.


Nonverbale cues
Eine subtilere Methode, um herauszufinden, ob die Vp die internalen Zustände erleben, die mit der experimentellen Variable assoziiert werden, ist es, nonverbale Indikatoren, wie Gesichtsausdrücke, Körperbewegungen, Veränderungen im Sprachmuster aufzuzeichnen

Zwei Vorteile gegenüber Selbstberichten:

  1. viele nonverbale Verhaltensweisen unterliegen weniger der bewussten Kontrolle und Zensur
  2. sie können gemessen werden, ohne die Aufmerksamkeit der Vp auf den Fakt zu lenken, dass eine Messung durchgeführt wird

Auch physiologische Maße wie Herzrate, EDA können verwendet werden, aber diese Daten reflektieren ein generelles Erregungslevel ohne Differenzierung zwischen verschiedenen Erregungstypen

Veränderungen im Design

  • Bsp.: Freedmans Replikation des Experiments von Aronson und Carlsmith
  • er fügte zwei neue Bedingungen hinzu, in denen keine Dissonanz auftreten sollte, weil der Vl im Raum war
  • das Experiment führt zu erhöhtem Vertrauen in die konzeptuelle Variable "kognitive Dissonanz"
  • eine konzeptuelle Variable kann also erhellt werden, indem man zusätzliche Bedingungen hinzufügt, die nicht durch die konzeptuelle Variable erklärt werden können, so reduziert man die Notwendigkeit aufwendiger systematischer Replikationen


Erfolgreiche und unerfolgreiche Replikationen
Man kann zwischen zwei Typen der Replikation unterscheiden:

  1. direkte Replikation: Vl versucht das Originalexperiment exakt zu wiederholen, wenn die Ergebnisse die gleichen sind wie im Originalexperiment, erhält man Vertrauen, dass die untersuchte Beziehung stabil und reliabel ist
  2. systematische Replikation: manche Aspekte der experimentellen Bedingung werden variiert, andere unkontrolliert gelassen. wenn eine solche Replikation erfolgreich ist, weiß man, dass das Ergebnis nicht einzigartig für die spezifischen Bedingungen des Originalexperiments ist

In der Sozialpsychologie liegt meist Typ 2 vor, denn auch wenn Typ 1 das Ziel ist, liegen meist Unterschiede vor, ein anderer Vl, andere Vp, Veränderungen in der Instruktion
Oft bieten die methodischen Beschreibungen nicht ausreichende Informationen, die einen befähigen würden eine exakte Replikation durchzuführen
Wenn also eine Replikation gelingt erhält man Vertrauen in die Generalität, wenn die Replikation nicht erfolgreich ist, unterliegt die Interpretation einer gewissen Unsicherheit, die Generalisierbarkeit ist dadurch limitiert, aber es gibt keine Implikationen für die Validität der involvierten Variablen
Eine unerfolgreiche Replikation kann Mangel an Generalisierbarkeit oder Validität des Originalexperiments anzeigen, aber auch die Inkompetenz des zweiten Vl demonstrieren

Cross- kulturelle Replikationen

  • Immer häufiger werden Studien mit Mitgliedern verschiedener Kulturen oder Subkulturen durchgeführt, um die Generalität eines Phänomens zu testen.
  • Problem: auch wenn man eine direkte Replikation in einer anderen Kultur durchführen könnte, könnte sie bedeutungslos sein, weil Vp einer anderen Kultur die experimentelle Situation unterschiedlich interpretieren könnten, man kann also nicht annehmen, dass Unterschiede in der Reaktion auf das Experiment wirklich Differenzen in ihren Reaktionen auf die konzeptuelle Variable repräsentieren
  • Vl muss sich also bemühen ein Experiment aufzustellen, das konzeptuell äquivalent zur Originalstudie bezüglich der Erfahrungen und Erwartungen der neuen Vp ist
  • um zu wissen, welche Veränderungen gemacht werden müssen, um Äquivalenz zu erreichen, sollte er einen Experten konsultieren, der die Kultur untersucht hat


Experimenteller Realismus vs. mondäner Realismus Aronson und Carlsmith unterscheiden diese beiden Formen, in denen ein Experiment realistisch sein kann
Experimenteller Realismus: Situation ist realistisch, überzeugend für die Vp, sie sind aufmerksam und nehmen es ernst, es hat also Auswirkungen auf sie (impact).
Mondäner Realismus: Ähnlichkeit der Ereignisse mit Ereignissen, die im realen Leben geschehen.
Mondäner und experimenteller Realismus sind keine polaren Konzepte, eine Technik kann bei beiden Konzepten hoch, bei beiden niedrig, bei einem hoch und beim anderen niedrig sein
Beispiele für hohen experimentellen und niedrigen mondänen Realismus: Asch, Milgram
Beispiele für hohen mondänen und niedrigen experimentellen Realismus: Wegener; Vp sollten Schlagzeilen über politische Kandidaten in einer entfernten Stadt lesen
Beispiel für geringen experimentellen und geringen mondänen Realismus: Byrne; Vp füllen Fragebögen zu diversen Themen aus, dann erhielten sie den gleichen Fragebogen, der angeblich von einem anderen Studenten ausgefüllt wurde, Vp sollten die fiktive andere Person bewerten
Hoch bei beiden Realismustypen: Murrays Studie zur stressreichen zwischenmenschlichen Diskussion

Es wird manchmal kritisiert, dass sozialpsychologische Experimente künstlich sind, weil der Fakt, dass eine Vp das Labor betritt eine unrealistische Atmosphäre schafft, und dass die gewonnen Daten deswegen invalide sind
Diese Kritik stammt nach Meinung der Autoren aus einer Konfusion der beiden Realismusarten

Mondäner Realismus und Auswirkung

  • wenn der experimentelle Realismus hoch ist, ist die Auswirkung auch groß, Streben nach mondänem Realismus ist dann unnötig
  • es gibt allerdings Situationen, in denen die Erhöhung des mondänen Realismus auch die Auswirkungen erhöht, z.B. wenn ein Experiment die Manipulation oder den Ausdruck von Feindseligkeit erfordert, denn Vp gehen davon aus, dass dies nicht angemessen ist in einem Laborexperiment
  • für solche Variablen wie Aggression ist ein Feldexperiment mit hohem mondänen Realismus geeignet
  • viele Ereignisse des alltäglichen Lebens können im Kontext von Laborexperimenten anders interpretiert werden, deswegen ist es falsch zu sagen, dass die Erhöhung von mondänem Realismus die Relevanz der Ereignisse erhöht, wenn der experimentelle Realismus dafür geopfert wurde


Internale und externale Validität Unterscheidung ist von Donald Campbell
Internale Validität: es gibt eine signifikante Differenz zwischen den Effekten der Bedingungen und diese Effekte liegen an der UV

  • kann erhöht werden durch experimentelle Kontrolle, leidet wenn kein experimenteller Realismus vorliegt

Externale Validität: Generalisierbarkeit eines Effektes auf Populationen und Situationen

  • kann maximiert werden durch Heterogenität der Stichprobe und der Bedingungen, durch Serien von Studien und multiple AVs
  • aber man kann Generalisierbarkeit nicht garantieren durch ein Experiment, das hohen mondänen Realismus hat
  • internale und externale Validität können erhöht werden durch experimentellen Realismus
  • Überlegungen der Vp zur sozialen Erwünschtheit oder über die Hypothese des Vl bedrohen die internale Validität, Vp können sich entscheiden sich aufgrund ihrer Erwartungen kooperativ, unkooperativ oder sozial erwünscht zu verhalten
  • auch die externale Validität leidet darunter, denn dann sind die Ergebnisse nur auf Vp generalisierbar, die ebenso kooperativ, unkooperativ, sozial erwünscht handeln
  • optimales Design sollte beide maximieren, aber die internale Validität ist wichtiger, denn wenn zufällige oder systematische Fehler es unmöglich machen Schlussfolgerungen zu ziehen, dann stellt sich die Frage nach der Generalisierbarkeit nicht


Trivialität: das Künstliche, das Offensichtliche, das Irrelevante und das Nichtgeneralisierbare
Häufiger Kritikpunkt an der Sozialpsychologie steht in Beziehung zu den Themen Realismus und Validität
Schlüsselwort ist Trivialität, viele Menschen, die sich nicht trauen würden die Relevanz eines physikalischen Experiments zu bewerten, meinen sie könnten dies bei sozialpsychologischen Experimenten, da diese sich mit menschlicher Interaktion beschäftigen, mit denen jeder Erfahrung hat
Trivialität bezieht sich auf drei Typen wahrgenommener Defizite: Künstlichkeit, Offensichtlichkeit, Irrelevanz

Künstlichkeit

  • Forschung ist trivial, weil sie künstlich und nicht anwendbar ist, aber die Vorstellung, dass eine experimentelle Situation möglichst lebensnah sein sollte beruht auf einer falschen Prämisse, nämlich der, dass sich die gleichen Variablen auf die gleiche Weise verhalten in zwei verschiedenen Situationen
  • Forscher interessieren sich für grundlegende Variablen, die das Verhalten beeinflussen, dafür muss die Situation limitiert werden auf kleine Proportionen, bei denen viele Variablen konstant gehalten und nur einige, wenige Aspekte der Situation fokussiert werden
  • aber sozialpsychologische Forschung beschäftigt sich auch mit Bereichen wie Erziehung, Recht, Wirtschaft, Gesundheit
  • oft meinen Menschen, dass die Ergebnisse einer Laboruntersuchung spezifisch für das Laborsetting sein müssen, da sie unplausibel erscheinen in Bezug auf alltägliche Erfahrung, diese Widersprüche zwischen sozialpsychologischen Ergebnissen und Erfahrungswissen liegen daran, dass unterschiedliche Fragen gestellt und unterschiedliche Vergleiche gemacht werden


Trivialität und Generalisierbarkeit

  • Generalisierbarkeit ist nicht immer der Standard mit dem sozialpsychologische Experimente bewertet werden sollten
  • oft ist das Ziel nicht Generalisierungen zu machen, sondern sie zu testen
  • die Frage, welche Experimente eine größere Generalisierbarkeit haben ist die falsche Frage, die Generalisierbarkeit jedes experimentellen Ergebnisses ist limitiert
  • diese Limitierung kann nur verringert werden, indem man die Robustheit der Ergebnisse über verschiedene empirische Realisierungen der unabhängigen und der abhängigen Variable testet durch systematische Replikation
  • man sollte sich als Forscher nicht auf Generalisierbarkeit konzentrieren, sondern auf das Testen der Akkuratheit oder Implikationen von abstrakten theoretischen Vorstellungen

Kapitel 3: Ethische Fragen

Wann ist es gerechtfertigt Vp´s einem Schmerz auszusetzen oder sie zu belügen, in die Irre zu führen, um an gewünschte Informationen zu gelangen?
Ethik im Kontext der Sozialpsychologie sieht sich herausfordernden Problemen gegenüber, da es gilt zwischen zwei Kategorien von Werten zu vermitteln:

  1. Freie wissenschaftliche Forschung
  2. Menschenwürde, Recht auf Privatsphäre und Schutz vor Schaden


Bei jedem Experiment muss die rechte Balance gefunden werden, welche beiden Werten gerecht werden kann. So soll die Wichtigkeit des Experiments im Hinblick auf den möglichen Schaden für die Vp bedacht werden.

Es ist wichtig zu berücksichtigen, dass die Folgen eines Experimentes größere Wellen schlagen, als man im Vorfeld meinen könnte. So sind Beispiele von "social dilemma"- Experimenten bekannt, wo Beteiligte nach 24 Stunden den Versuchsleiter anriefen, da es ihnen schlecht ging und sie entweder das Vertrauen in andere Menschen verloren hatten oder sich selber schlecht für das eigene Verhalten fühlten, welches sie beim Experiment an den Tag legten (vgl. Dawes, McTavish,Shaklee, 1977).

In den vergangenen Jahren wurden mehr und mehr ethische Fragen diskutiert, die sich um Rechte und Pflichten der Beteiligten drehten. So wurden für die Forschung mit Menschen u. a. aus den Händen der APA (1953, 1981, 1982) oder auch der NIH (National Institutes of Health) Richtlinien erlassen. Solche sollen vor dem Umgang mit Menschen verinnerlicht werden, um als Forscher vernünftig handeln zu können.

Schmerz und Leid:

  • körperlicher Schmerz: Elektroschocks, kaltes Wasser, Lärm…
  • psychischer Schmerz: Stress, etwaige Sorgen nach dem Experiment…


Die Vp soll nur dem unbedingt nötigen Stress ausgesetzt werden, wenn dieser denn nötig für die Studie ist. Zu berücksichtigen ist auch, dass der verabreichte Stress von den Vp´s verschieden stark wahrgenommen werden kann (vgl. auch Angst).

Die Verabreichung von Stress ist immer ein ethisches Problem!
Weniger Probleme gibt es, wenn die Vp vorgewarnt werden kann und so die Entscheidung eines Ausstiegs gleich zu Beginn möglich gemacht wird. Es sollte also immer möglichst viel an Infos im Vorfeld gegeben werden! Die Vp soll sich frei entscheiden können! Aber auch dann sollte der Vl nicht seine Möglichkeiten bis zum Äußersten ausreizen. Natürlich muss den Teilnehmern auch klar vermittelt werden, dass sie IMMER ohne Sorge aussteigen können! Man könnte so auch einen Eingeweihten das Experiment abbrechen lassen, damit die Vp sieht, dass es hier keine Probleme gibt. Wenn das Exp. dann begonnen wird, muss der Vl die Vp im Auge behalten, um bei unnormalen Reaktionen das Exp. sofort abbrechen zu können. Nachher soll ein Interview folgen, welches zeigt, wie es der Vp geht. Ansonsten soll die Vp alle Infos bekommen, die gegeben werden können.

Wieviel Missbehagen darf der Person zugemutet werden?

  1. Zunächst muss gesagt werden, dass quantitative Messungen hier kaum möglich sind. Die Person muss immer als eine solche behandelt werden und sich Sympathie, Offenheit, Interesse gegenüber sehen, damit sie sich angenommen fühlen kann und frei fühlt. Zudem ist die Person immer als Individuum zu sehen. Ihr kann etwas unbehaglich sein, was anderen nicht zusetzt.
  2. Das Verhältnis von Vl und Vp ist immer unausgeglichen, ungleich, was die Vp dazu verleiten kann eher zu gehorchen, sich klein zu fühlen. Auch hier gilt es der Vp entgegenzukommen, damit der Stress möglichst klein bleibt!
  3. Stress sollte nicht grundlos vermittelt werden! Komitees sollen mitentscheiden, welcher Stress nötig ist und zugemutet werden kann, um das Experiment ausführen zu können und ob das Exp. überhaupt gerechtfertigt ist. Der Vl ist hier möglicherweise nicht objektiv genug und sieht sein Experiment wichtiger an, als es tatsächlich ist.
  4. Der Vl sollte sich gegen Folgeschäden absichern, wie es Milgram (1963) tat, dessen Schockexperiment für den vermittelten hohen Stress sehr angegriffen wurde. Milgram (1964) stellte nach dem Experiment der Vp die "geschockte" Person gegenüber und zeigte den Vp´s, dass sie "normal" reagiert haben und die andere Person "nicht nach verbranntem Fleisch (tschuldigung) roch." Es ihr also sehr gut ging! Später gab es dann auch noch einen ausführlichen Versuchsbericht nach Hause und ein Treffen mit einem Psychiater, der schaute, ob noch alles in Ordnung ist.
  5. Natürlich soll das Experiment dann auch wissenschaftlich korrekt durchgeführt werden, damit sich der Aufwand auch rentiert und die Studie auch verwertet werden kann.


Täuschung:
Es ist oft nötig der Vp nicht ganz reinen Wein einzuschenken, damit dann z. B. überhaupt Erregung entstehen kann. Situationen müssen also als gegeben betrachtet werden, die ja in Wirklichkeit nur fingiert sind. Es ist schwierig eine Person zornig zu machen, wenn sie die Kenntnis davon hat, dass das Skript des Vl es so vorschreibt. Auch wäre die Vp bei Milgram (1973) sicher weniger gehorsam gewesen, wenn er vorher verkündet hätte, wie wichtig Gehorsam für ihn in dieser Studie ist.
So wird die Vp in vielen Exp. z. T. im Dunkeln gelassen und erfährt nicht die ganze Wahrheit.

Zu diskutieren ist nun der Einbruch in die Privatsphäre der Vp, welche ja vielleicht Dinge offenbart, die sie nie ans Licht bringen wollte sowie die Verletzung des Vertrauens in den Vl, dem die Vp Wahrhaftigkeit unterstellt. Kurz die Vp ist nicht voll informiert und so nicht das volle Einverständnis, die volle Zustimmung gegeben.

Die Suche nach der Methode mit der geringsten Täuschung ist angesagt!
So kann man wie Smith und Ellsworth (1985) auch mit Gedächtnisstudien bzgl. Emotionen beginnen, die die Täuschung unnötig machen und dann wenn die Ergebnisse bestätigen zur Validierung mittels Täuschung übergehen.
"Cover stories" oder die Unterschlagung von Infos z. B. bzgl. des TAT gelten natürlich beide als Täuschung, wenn vermittelt wird, dass z. B. Kreativität gemessen werden soll und dann geht es tatsächlich um die Ängste "vor dem Sandmann". Die Vp wäre dann ja bei der rechten Kenntnisnahme möglicherweise ausgestiegen. Auch wird getäuscht, wenn die Aufmerksamkeit abgelenkt wird oder durch Pseudofreundlichkeit die Vp zur Mitarbeit angeregt wird (vgl. Edward Shils, 1959). Natürlich kann auch getäuscht werden, indem die Wichtigkeit der eigenen Angabe bzgl. bestimmter Dinge verschleiert wird (vgl. "Kommunikations- Überzeugungsstudie" von Hovland & Weiss, 1951).

Ob nun die Täuschung im Experiment ohne die Aussetzung von Stress ethisch verwerflich ist, wird noch diskutiert (Baumrind, 1985; Kelman, 1968). Christensen (1988) zeigt, dass nur wenig Vp´s ärgerlich darüber waren, wenn sie getäuscht wurden. Personen scheinen sogar glücklicher mit Täuschungsexperimenten zu sein (Smith & Richardson, 1983), da diese interessanter wirken.
Der Vl soll die Vp ernst nehmen, wenn sie mitteilt, dass sie mit der Täuschung gut zurechtkommt, aber hier genauer hinhören, ob das nicht nur dahin gesagt ist, um den Vl zufrieden zu stellen.

Besonders muss berücksichtigt werden, wenn die Vp sich Dingen oder Seiten der eigenen Person gegenüber sieht, die ihr nicht gefallen können. Auch wenn der Forscher sagen würde, dass die Studie in einem solchen Fall halt ein gutes therapeutisches, erzieherisches Moment mitbringen würde, darf dies so nicht unkritisch angenommen werden.
Der Vl kann nicht wissen, ob die Studie für alle therapeutisch wirkt und zudem darf hier nicht ungewollt an den Vps therapiert werden. Auch nicht, wenn es möglicherweise "gut für die Vp" sein könnte.
Auch darf nicht dem Individuum Leid zugefügt werden, um der Allgemeinheit Vorteile zu verschaffen!
Ex post facto- Verteidigung ist keinesfalls angebracht, wenn z. B. nach einem Experiment mit sehr hohem Stressfaktor schließlich alle sagen, dass sie es gerechtfertigt und gut fanden! Auch hier könnten die Vps sich und dem Vl etwas in die "Tasche lügen".

Bedenklich ist auch, dass die Zustimmung der Vp nur soweit geht, wie sie eingeweiht ist und alles weitere zugemutet wird. Es wird dann schwierig zu sagen, ob die preisgegebenen, persönlichen Seiten der Vp freiwillig gezeigt werden und ob die Privatsphäre nicht übertölpelt wird. Das sieht nicht anders aus, wenn die Vp im Vorfeld schlimmerer Behandlung zustimmte, welche sie so nun erwartet. Als Beispiel lässt sich hier das Experiment von Schachter (1959) anfügen, wo es im Endeffekt um "affiliation" ging und die Vp´s Schocks erwarteten, die nicht kamen, da nur die resultierende Angst vor den Schocks sowie die Tendenz sich anderen Menschen anzuschließen, gemessen wurden. Die Vp´s wussten nicht, dass es um das Anschlussverhalten und ihre Angst ging und konnten so auch nicht im Vorfeld konkret zustimmen.
Dies fachte eine Diskussion zum Thema "der informierten Zustimmung" an. Soble (1978) bot darauf einen Weg aus dem Dilemma an. Die Vp sollte generell zustimmen und ein Freund der Vp dann sagen, ob die Vp auch im vorliegenden, konkreten Fall zustimmen würde. Problematisch bleibt jedoch, dass sich der Freund irren kann und entgegenkommender ist, als es die Vp sein würde. Auch kann diese Prozedur übersteigerte Angst hervorrufen und den Freund mit Verantwortung belasten.

Immerhin kann der Vp zugesichert werden, dass die Daten vertraulich behandelt werden. Die Vp kann anonym bleiben. Auch sind für die Forscher allgemeine Tendenzen der Vp´s von Interesse und nicht die Daten eines bestimmten Individuums. Der Name der Vp kann durch eine Nummer ersetzt werden, damit niemand anderes die Daten mit der Person in Verbindung zu bringen vermag. Die Vp soll davon in Kenntnis gesetzt werden! Alle Daten bleiben vertraulich und die Person anonym.

Alternativen zur Täuschung
In den 60ern und 70ern gab es eine große Debatte zum Thema Täuschung. Gegner brandmarkten diese Art von Experimenten als "Vertrauensspiele" (Forward, Canter, & Kirsch, 1976) und führten mögliche Gefahren (Kelman, 1967) an. Auch wurde die methodische Basis in Frage gestellt und das Ganze als Augenwischerei und Rollenspiel bezeichnet. Beide Seiten der Debatte sahen sich im Recht. Das Individuum, welches geschützt oder die Gesellschaft, die von solchen Experimenten profitiert, wurden in die Pflicht genommen.
Die Hypothesen sollen vor einem Täuschungsexperiment ohne eine solche Verschleierung behandelt werden. Auch werden Alternativen zu solchen Experimenten untersucht (siehe Holmes & Bennet, 1974; Miller, 1972a; Willis & Willis, 1970).

Rollenspiel
Womöglich die meist zitierte Alternative ist das Rollenspiel, die Simulation, das "als ob"- Experiment, wo sich Personen verhalten sollten, als ob sie sich in einer bestimmten Situation befänden. Die Vp´s werden also eingeweiht und gebeten sich in die vorgestellte Situation zu versetzen und nach dieser auch zu handeln und zu vergessen, dass diese unreal ist und die Vp´s instruiert.

Ein frühes Beispiel bieten Milton, Rosenberg und Robert Abelson (1960). Diese forderten dazu auf sich als Ladenbesitzer zu fühlen und entsprechende Eigenschaften mitzubringen. Diese waren so arrangiert, dass es zu Unstimmigkeiten kommen musste. So sollten die Vp´s z. B. viel vom Verkauf halten; eine Gruppe sollte dann eine negative Einstellung zu moderner Kunst einnehmen und eine positive zu Fenwick, einem Manager eines Teppichgeschäfts (Andere Vp´s wurden anders instruiert).
Alle sollten jedoch glauben,
1) dass Abwertung von moderner Kunst den Verkauf senkt,
2) Fenwick eine Ausstellung mit moderner Kunst organisieren will und
3) Fenwick den Verkauf im Teppichgeschäft gesteigert hat.
Dann wurden die Vp´s gefragt, wie ihre Einstellungen nach diesen neuen Infos aussehen. Die Vp´s wählten den jeweils einfachsten Weg, um die Widersprüche zu korrigieren, was auch vorausgesagt worden war.

Hier sehen wir also ein Experiment ohne jegliche Täuschung. Auch ist der Grad der Realitätsnähe ausgeprägt. So wurde auch oft vertreten, dass diese Art von Experimenten besser sei, als die von Asch, Milgram, Aronson und Mills (Brown, 1962; Kelman, 1968, Schulz, 1969). Brown (1962) sieht hier zudem die Möglichkeit zu mehr Wirklichkeitsnähe.

Allerdings ist diese Meinung nicht ganz unproblematisch, da es hier die Probleme gibt, die auch die Introspektion mit sich bringt:

  1. Personen, die sich in einer gewünschten Situation noch nicht befanden, können nur ahnen, wie sie sich unter solchen Bedingungen verhalten würden.
  2. Auch wenn sie sich schon in einer solchen Situation befanden, ist es a) schwierig sich diese in Erinnerung zu rufen und b) ist die Situation in einem Versuch wieder ganz anders, da die Person z. B. dem Vl gefallen möchte oder nicht aus der Norm fallen möchte und dementsprechend handelt o. ä..


In einem Experiment sind die Bedingungen wieder ganz anders, da die Situation z. B. nicht aus "heiterem Himmel" kommt und nicht immer so verständlich ist, wie in der Instruktion eines Versuchs. Die Situation ist anders und so auch der Druck sowie die Motivation (vgl. Freedman, 1969). Vp´s sind zudem sehr sensitiv, was die Wünsche der Vl´s betrifft, wie Rosenberg (1965) und Riecken (1962). Auch ist die Tendenz da zu kooperieren und dem Forscher zu helfen (Orne, 1962). Die Vp´s wollen in einer Testsituation intelligent, reif, gesund erscheinen (Silverman, Shulman, & Wiesenthal, 1970), was nach Aronson et al. (1970) den Wunsch zu helfen noch übersteigt.
So sind die Ergebnisse oft nur, dass die Vp die mögliche, angenommene Handlung der Allgemeinheit reflektiert (Freedman, 1969)! Auch wenn man sich also der Realität irgendwie nähern kann, fehlt es hier doch an experimentellem Realismus!
Man kann auch eine Hierarchie des Realismus aufstellen:

  1. Rollenspiel,
  2. Laborexperiment,
  3. Experiment außerhalb des Labors, wenn auch die ethischen Probleme mit dem Grad an Realität zunehmen!


Da hier mehr und mehr in die Privatsphäre eingebrochen wird.
Auch ist klar, dass Rollenspiel oder Selbsteinschätzung nicht zeigen, wie sich die Person tatsächlich verhalten würden (siehe La Piere 1934 und seine Studie bzgl. Vorurteile und Folgen bzgl. Chinesen, wo 90% der Hotelbesitzer angaben keine Chinesen aufzunehmen und 99% im konkreten Fall eine "Ausnahme" machten).

Kelman (1968) führte an, dass simulierte Studien ordentliche Ergebnisse beringen, aber das heißt nicht, dass diese auch valide sein müssen, da in der Realität oft komplexere oder unerwartete Verhaltensweisen an den Tag treten. So tendiert der Mensch allgemein dahin mehr Ordnung und Einfachheit anzunehmen, als wirklich existieren (Markus & Zajonc, 1985; Nisbett & Ross, 1980). Anthony Doob (1967) zeigt, dass ein solcher BIAS auch in der experimentellen Situation auftreten kann (Doob verglich Annahmen mit Ergebnissen).
Zudem kann die Vp in einem Rollenspiel kaum zweifach- interagierende Variablen darstellen, die im Labor zu Tage treten (Miller, 1972a).
Auch erfolgreiche Replikationen von Experimenten - mittels Rollenspiel- bergen Probleme in sich, so stützte Bem (1965) das "Forced-complinace"-Experiment von Festinger und Carlsmith, welches aber mittels Laborexperimenten nicht bestätigt werden konnte (Brehm et al. (1968).

Der Weg muss vielmehr andersrum sein und das Experiment das Rollenspiel stützen!

Eine Rolle für Rollenspiele
Rollenspiele sind aber auch nützlich für das Entwickeln von neuen Ideen und Hypothesen, bei der Hinterleuchtung von Experimenten, bei der Beobachtung der Meinungsbildung gegenüber dem Verhalten des Mitmenschen et cetera.

Interessant ist auch, dass Personen im Labor eher globale Aussagen treffen und im realen Leben hingegen spezifischer agieren (Swann, 1984). Das sterile Labor ist somit ein anderer Nährboden für Entscheidungen. Das Rollenspiel mag hier vermitteln können (Funder, 1987). Wenn wir auch die äußere Validität der Spiele in Frage stellen, so ist die Innere jedoch gegeben. Freedman (1969) träumt dann auch von einer Zukunft, wo Rollenspiele mit der richtigen Theorie so ausgefeilt sein werden, dass sie auf das tägliche Leben reflektiert werden können.

Wechselseitige Enthüllung
Der zweite Typ einer Alternative zur Täuschung ist einfach ein ehrlicher Umgang zwischen Vl und Vp (Jourard, 1968; Kelman, 1968; Schulz, 1969). So darf anfangs gesagt werden, dass die völlige Einweihung in das Experiment erst am Ende kommt und man sich bitte "normal" verhalten soll, was zu einer Art "Vertrag" zwischen beiden Beteiligten führt. Oder aber die Person wird durch eine sofortige Einweihung zum Mitarbeiter und weniger zum Studienobjekt (Jourard, 1968). Dann würde auch die Vp ihrerseits völlige Offenheit zeigen und so das Ergebnis fördern. All das kann sogar bessere Werte als ein Täuschungsexperiment geben.

Vorbehalte: Solch Dialog verändert die ganze Situation und dies schon allein dadurch, dass in der Realität kaum solch offene Dialoge vorkommen.

Als Sozialpsychologe möchte man Verhalten untersuchen, welches spontan, unreflektiert, auf die Schnelle und ohne Helfer auftritt. Nach dem Experiment ist so ein Dialog sicher sinnig!
Natürlich kann die Wechselseitige Enthüllung auch unter bestimmten Umständen lohnend sein, aber es muss für die jeweilige Situation das passende Instrument sein. Somit soll dieser Weg nicht ganz abgekanzelt werden.

Debriefing
In einem typischen Täuschungsexperiment soll hierfür besonders Zeit genommen werden, um das Wohlergehen der Vp zu gewährleisten. Allerdings gibt es da verschiedene Vorgehensweisen. Es ist sinnvoll zunächst zu erklären, warum die Täuschung nötig und wichtig war. Zeit und Einsatz sind hier wichtig und lohnen sich, denn die Vp sieht dadurch zumeist die Sinnhaftigkeit ein und wird gar enthusiastisch teilgenommen zu haben. J Debriefing ist immer wichtig, egal wie die Studie aussah und kann lehrhaften Charakter haben. Es soll gezeigt werden, dass es hier um Forschung für die Allgemeinheit geht und so die Teilnahme verdienstvoll war. Natürlich müssen Fragen der Vp beantwortet werden. Dialog!

Die Beziehung zwischen Vp und Vl als Vertrag
Wenn die Vp "hinters Licht geführt" wurde, gibt es für den Vl keine 100% Wiedergutmachung seines Verhaltens. Die meisten Sozialpsychologen fühlen sich zwar unwohl dabei, aber tragen diese ethische Bürde mit Fassung. Sie sind der Meinung, dass der "Zweck die Mittel heiligt", wenn der Vp kein größerer Schaden zugefügt wird. Der Vl tröstet sich auch mit dem Gedanken, dass die Vp sich ja bewusst ist in einem Experiment zu sein. So kann eine Täuschungsmöglichkeit implizit als Klausel des "Vertrages" angenommen werden. Psychologische Experimente sind nicht immer, was sie vorgeben und dieses Wissen ist doch in der Regel bekannt. Überraschung tritt dann auch selten auf, wenn es zu einer Täuschung kam. Die Vp wird von Weber und Cook (1972) als "faithful subject" bezeichnet. Sie nimmt also teil und analysiert nicht umgehend das Verhalten und die Aufgaben des Vl. Es kann vor dem Experiment angekündigt werden, dass nicht alles im Vorfeld erklärt werden kann, um das Experiment nicht zu gefährden, was dann schon eine Art Vorwarnung sein könnte. Dies ist nach Weber und Cook (1972) förderlich für die Übernahme der "faithful subject"- Rolle.

Nach dem Experiment ist aber totale Ehrlichkeit verpflichtend! Falls dies nicht so ist, verliert sich jedes Vertrauen in den Vl. Solch Verhalten wäre ethisch nicht tragbar. Mit einem ehrlichen Debriefing ist die Sitzung dann auch rund und abgeschlossen. Die Vp fühlt sich so sicher und vertraut auf vertrauliche Behandlung ihrer Werte.
Höchst problematisch ist andersrum, wenn das Exp. nach einem offiziellen Abschluss doch noch weiterläuft, d. h. die Vp weiterhin beobachtet oder manipuliert werden soll.

Ethik im Feld Dies ist auch ein Problem im Feldexperiment. Die Vp ahnt nichts von der Beobachtung sowie möglicher Täuschung. Informierter Konsensus oder eine Art Vertrag zwischen den Beteiligten kann im Vorfeld nicht hergestellt werden. Obacht also!
Natürlich ist sich die Vp im Labor auch nicht bewusst, wie sehr die für den Experimentator interessante unabhängige Variable von Bedeutung ist, was aber nicht den "Vertrag der stillen Zustimmung" zwischen den Teilnehmern aushebelt. Das Problem der Unkenntnis über die Wichtigkeit der verschiedenen Teile des Laborexperiments ist sicher auch gegeben, jedoch spielt sich dies in einem anderem Rahmen ab (vgl. Festinger & Carlsmith (1959), die $1 oder $20 Belohnung für eine Aufgabe gaben und schauten, wo die Vp die Aufgabe besser fand) da die Vp bewusst im Labor sitzt.

  1. Es ist also abzuwägen, ob ein Feldexperiment nötig ist oder die Daten anders zu beschaffen sind. Sicher sind die Daten eines Feldexperiments objektiver, aber ein Laborexp. ist zumindest zu erwägen (vgl. Harris (1974) Aggressionsstudie, die milder im Feld ausgefallen war, à verringerten Selbstwahrnehmung).
  2. Abzuwägen ist immer zwischen "Kosten (ethisch) und Nutzen (wissenschaftlich)"
  3. Feldexperimente ermöglichen größere Anonymität für die Vp und so größeren Schutz vor unliebsamen Folgen. Was wäre, wenn ausgeplappert würde, wer in der bekannten Milgramstudie (s. o.) am meisten Strom verteilte?! Ein Beispiel ist eine Serie von Feldexperimenten von Doob et al. (1969), welche Kaufverhalten bei besonderen Preisen beobachteten (Es wurde hier weniger gekauft, wenn das Produkt erst 23$ und dann 39$ und nicht durchgehend 39$). à totale Anonymität
  4. Stress kann in einer Feldstudie auch verringert werden, da er nicht künstlich hergestellt sein muss, sondern wo natürliche, stressige Umstände genutzt werden können.
  5. Jedoch soll auch hier, sobald negative Folgen für die Vp auftreten, umgehend abgebrochen werden!


1967 kam McGuire so zum Schluss, dass Feldexperimente im Ganzen den Laborexperimenten vorzuziehen sind, da hier natürlicher Stress genutzt werden kann, der sowieso auftritt. Jedoch ist das Problem mit der Gewährung der Privatsphäre hier größer!
Methodisch sind natürlich die Daten der Feldforschung generalisierbarer, wenn auch die Kontrolle über die Variablen kleiner wird (Quasiexperimente). So z. B. bei dem Studieren des Affiliationsmotivs nach einer Flutkatastrophe.

Kelman (1968) schlägt vor die Vp´s im Feld einzuweihen, um die Privatsphäre nicht zu verletzen, aber hier kann man sich fragen, ob dann noch von Generalisierbarkeit und weniger Manipulierung zu sprechen ist.
Man muss auch hier wieder abwägen, was man will und was für die gewünschte Datenerhebung möglich ist.
Die Freiheit der Vp´s, ggf. zurückzutreten, sollte zudem immer gegeben sein und der Vl hierfür sensibel bleiben. Besonders, da Orne (1962) feststellte, dass Vp´s anscheinend alle Art von langen, langweiligen Aufgaben übernehmen ohne an Abbruch zu denken. Die Frage ist also auch immer, wie stark der Druck der Vl ausgeprägt ist. Die Vp neigt dazu sich ganz unter die Kontrolle des Vl zu begeben! Fühlt sich die Vp immer frei das Experiment abzubrechen?!
Ironischerweise wird hier oft getäuscht, damit die Vp nicht zurücktritt.

Ethik im Experiment mit Kindern In diesem Bereich gibt es ähnliche Probleme. Die Kinder sind oft völlig naiv und wissen nicht, dass sie sich in einem Experiment befinden! Dies interessiert ja gerade die Sozialpsychologen. Kinder sind einfacher zu beeinflussen und zeigen Gefühlsregungen, Gedanken unverdeckter!
Größere Vorsicht ist also geboten! Es muss dafür gesorgt sein, dass es dem Kind anschließend gut geht und keine Folgen des Experiments davonträgt (Smith, 1967)! Zustimmung muss von den Erziehungsberechtigten und/oder auch Medizinern, Pädagogen usw. gegeben werden.
Vorsicht gilt vor Eltern, die eine Teilnahme des Kindes wollen, aber nicht zuerst an das Wohl des Sprösslings denken! Sicherlich gilt es auch die Eltern im Vorfeld passend und umfassend zu informieren!
Der Vl sollte trotzdem nur sehr wenig Stress provozieren sowie sofort abbrechen, wenn es nötig erscheint! Inszenierte Alltagsszenen bieten sich hier auch an (Landauer et al. (1974) zeigten den Walt Disney Cartoon: The Legend of Sleepy Hollow, was Gleichaltrige - mit etwas Gruselgefühl - gerne sahen).

Institutionelle Richtlinien Es gibt kein absolutes Regelwerk und auch APA sowie der U.S. Public Health Service unterscheiden sich da nicht voneinander.
Jede Studie muss individuell betrachtet werden. Das beginnt beim Experimentator, der abwägen muss, welche Methode vernünftig ist. Natürlich soll auch geschaut werden, ob die Daten dann auch valide sind und den Stress der Vp lohnen. Falls das geplante Exp. ausfällt, was sind die Folgen? Kann das Design der Studie verändert werden? Sicher ist es oft schwierig jeden Stressfaktor ganz zu beseitigen, aber die o. g. Gedanken sollen doch bedacht sein. Die Gesundheit sowie das Wohlergehen der Vp´s stehen zunächst im Vordergrund! Es wird empfohlen Täuschung und Stress zu vermeiden, so möglich (vgl. Kelman, 1968).

Kapitel 4: Experimentelles Design

DIE Frage stellen (S. 114):
Wissenschaftliches Arbeiten zeichnet sich durch eine konkrete, zielgerichtete, nicht beeinflussende Fragestellung aus.

Kontrollgruppen (S.118):
Sollten sich nur in dem zu untersuchenden Punkt von den Experimentalgruppen unterscheiden, ansonsten aber gleich sein.
Zufällige Aufteilungen der Probanden in Kontroll- und Experimentalgruppen.
Zusätzliche Pretests sind zumeist nicht erforderlich und könnten sogar die Ergebnisse der Untersuchung verfälschen = interne Validität bedrohen (da die Probanden beim Pretest schon auf die zu untersuchenden Konstrukte aufmerksam werden können).
Während der Untersuchung sollten (wenn möglich) bis zur Einführung der unabhängigen Variable Experimental- und Kontrollgruppen gleich behandelt werden (gleiche Aktivitäten, gleiche Hintergrundinformationen,…).
"In the ideal social psychological experiment, the experiences of experimental and control subjects take the same amount of time, involve interaction with the same people, require the same information, and include the same activities, except fort the introduction of the treatment" (S. 120/121)
Dann kann davon ausgegangen werden, dass Unterschiede im Verhalten auf den UVn beruhen.

Mehrfaktorielle Designs (S. 123):
Mehrfaktorielle Designs helfen bei dem Auffinden von Haupt- und Interaktionseffekten.
Würde man ein mehrfaktorielles Design in mehrere Einzelexperimente aufteilen, würde man mehr Zeit und Probanden benötigen (Fehlerrisiko steigt) è Mehrfaktorielle Designs sind sehr nützlich (sagt mal Leute, warum fasse ich das eigentlich zusammen?).

Mehrfaktorielle Designs und Interaktionen (S. 126):
Interaktionen reduzieren die Allgemeingültigkeit eines Haupteffekts.

Kontrollgruppen in mehrfaktoriellen Designs (S. 128):
In vielen mehrfaktoriellen Designs ist keine Kontrollgruppe enthalten. Sollen jedoch auch Daten einen Kontrollgruppe vorhanden sein, muss man die Kontrollgruppe extra, d.h. zusätzlich zum vorhandenen Design aufstellen. Trotz ihrer "außen-vor"-Stellung müssen die Mitglieder der Kontrollgruppe genauso zufällig zugeteilt worden sein, wie die übrigen Probanden.
Es ist möglich, dass man keine, eine oder sogar mehrere Kontrollgruppen benötigt.

Faktorstufen der UV (S. 131):
Die UV benötigt mindestens zwei Faktorstufen (oftmals 0 und irgendetwas >0), damit man einen Effekt erkennen kann.
Das aus einem erfolgreichen "zwei-Faktorenstufen"-Experiment resultierende Wissen, dass ein Treatment ein Verhalten beeinflusst, reicht in anfänglichen Forschungsphasen häufig schon aus. Auf dieser Basis kann man weiterforschen, wie genau das Treatment wirkt. Hier kommen dann auch mehr Faktorstufen und zusätzliche UVn zum Einsatz.
Gefahr des simplen "zwei-Faktorstufen"-Experiments (Experimentalgruppe erhält Treatment, Kontrollgruppe nicht): "Deadspot". Das Treatment ist derart gewählt/eingestellt, dass es keinen Effekt liefert. Wäre es anders gewählt worden (z.B. größere/kleinere Menge o.ä.) hätte es aber einen Effekt gehabt, was dem Forscher so jedoch bei dem simplen "2-Bedingungen"-Experiment verborgen bleibt.

Dimensionales Modell: Um einen Deadspot zu vermeiden nutzt man viele verschiedene Faktorstufen der UVn. Je mehr Faktorstufen, desto genauer kann man die Funktion (z.B. linear, U-Funktion,…) beschreiben.
Bei Ereignissen, die entweder geschehen oder nicht geschehen (0 oder 1), werden oft nur zwei Faktorstufen verwendet (ergo kein dimensionales Modell).

Beispiel: Der Proband favorisiert eine andere Person, oder nicht. Der Proband kann eine Person nicht "halb favorisieren". Erst in weiteren Studien geht man dann auf genauere Determinanten des Effekts ein.
Zwei-Faktorstufen-Experimente müssen sich nicht immer nur um "anwesend" vs. "abwesend" (1 oder 0) drehen, sondern auch "hoch" vs. "niedrig" sind als Faktorstufen möglich (z.B. hohe oder niedrige Intensität einer Bedrohung etc.). Dann jedoch verliert man den "Nullpunkt" è keine No-Treatment-Kontrollgruppe mehr vorhanden. Entscheiden muss man je nach Experiment: Wenn es z.B. um Selbstvertrauen geht, macht es nur Sinn von hoch vs. niedrig sprechen. Der Vorteil eines hoch vs. niedrig -Experiments liegt darin, dass man die beiden Dimensionen beliebig aneinander annähern kann (wie weit liegen hoch und niedrig auseinander?), je nachdem, wie die Situation es erfordert. Zudem ist es bei hoch vs. niedrig -Experimenten eher gewährleistet, dass die Probanden beider Gruppen möglichst ähnliche Erfahrungen während der Untersuchung machen. Dies ist bei einer No-Treatment-Kontrollgruppe wesentlich schwieriger.
Das simple Zwei-Faktorstufen-Experiment stellt meistens den Beginn einer Studienreihe dar, um festzustellen, ob ein bestimmter Effekt existiert. Danach kommen zunehmend komplexere Designs zum Einsatz.

Die Anzahl der UVn (S. 133):
Man könnte seeeeeehr viele UVn innerhalb einer Untersuchung verwenden. Jedoch muss man beachten: Je mehr Tests, Messungen, Instruktionen und Ereignisse den Probanden (be)treffen, desto mehr ist er verwirrt, gelangweilt oder irritiert. Designs sollten nur so komplex wie nötig sein. Wenn man dennoch eine weitere UV hinzufügt, sollte man dies mit einer genauen Intention und Vermutung tun, nicht weil sie "irgendwie interessant" sein könnte. Man stellt Variable X auf, weil man vermutet, dass Variable X Variable Y beeinflussen könnte, oder man stellt Variable X auf, weil man hofft, dass Variable X Variable Y nicht beeinflusst.

Da auch die Versuchsleiter das Verhalten der Probanden ungewollt beeinflussen können, ist es häufig nützlich, die VL ebenfalls zu UVn zu machen. Gibt es nur einen VL wird somit diese UV "konstant gehalten" (somit kein Problem). Bei mehreren VLn wird jedem einzelnen VL eine UV zugewiesen, sodass man hinterher erkennen kann, inwiefern die Ergebnisse der Probanden auf Beeinflussungen durch die verschiedenen VL zurückgehen.

Wenn sich bei Verwendung mehrerer VL herausstellt, dass der Einfluss der VL auf den untersuchten Effekt vernachlässigbar ist, ist dies ein Hinweis auf die Allgemeingültigkeit des untersuchten Effekts. Stellt sich hingegen heraus, dass die VL einen großen Einfluss haben, wird die Allgemeingültigkeit des untersuchten Effekts entsprechend reduziert. Dies kann man nicht feststellen, wenn man nur einen VL hat. Allerdings führt die Verwendung mehrerer VL zu mehr organisatorischen Problemen (aufwändiger).

Eine andere Art sicherzustellen, dass die Resultate nicht an einen bestimmten VL gebunden sind: Man variiert die Variable "VL" in zufälliger Weise für jeden Probanden gibt es einen eigenen VL. Sehr hoher Aufwand und je nach Versuchssituation auch evtl. sehr verwirrend für die Probanden (viel Gerenne, hohe Hintergrundlautstärke,etc…). Nur möglich bei "robusten" untersuchten Effekten oder wenn der VL absolut kein Hintergrundwissen haben und auch nicht möglicherweise durch wiederholte Versuchsleitung erlangen darf (= da man zwar unwissend sein kann, aber immer lernfähig ist, muss ständig ein "neutraler" VL her. Hätte ein VL zweimal einen Versuch geleitet, könnte er schon zuviel wissen und somit das Resultat durch Voreingenommenheit beeinflussen).

Analyse von Veränderungswerten: Probleme des Pretesting (S. 138)
Pretest-posttest control-group design:
Wenn man eine durch ein Treatment verursachte Einstellungsänderung gegenüber nur einem Objekt unter vielen nachweisen möchte, muss man sowohl die Experimental- als auch die Kontrollgruppe einem Pretest unterziehen ("Wie findet der Proband die Objekte bevor das Treatment beginnt?") und die daraus resultierenden Werte mit den Ergebnissen eines Posttests ("Wie findet der Proband die Objekte nachdem das Treatment endete?") vergleichen.
Würde man den Pretest nicht durchführen, würden die ersten Vergleichswerte fehlen. Würde man die Kontrollgruppe nicht dem Pretest unterziehen, könnte der Effekt der Experimentalgruppe auf das Treatment, aber auch auf den Pretest zurückzuführen sein (nicht mehr unterscheidbar). Während dieses Modell zwar eine hohe interne Validität hat, ist die externe Validität nicht hoch, denn da alle Probanden dem Pretest unterzogen werden müssen, gibt es keine Beweise dafür, dass der Effekt auch solche Personen betrifft, die nicht zuvor dem Pretest unterzogen wurden (= kein Beweis dafür, dass der Effekt, der eine bestimmte Einstellungsänderung bedeutet, auch außerhalb des Versuchslabors auftritt). Es ist möglich, dass die beiden Ereignisse (Pretest und Treatment) interagieren und gemeinsam einen Effekt hervorbringen, dies alleine jedoch nicht schaffen würden. Dieses Problem nennt man "pretest sensitization".

Lösung: "posttest-only control-group design" (man eliminiert den Pretest):
Wenn man den Pretest einfach weglässt, müssen folgende Voraussetzungen erfüllt sein:

  1. Die Probanden müssen per Zufall der Experimental- oder der Kontrollgruppe zugeordnet worden sein. Dann kann ohne Pretest von zwei etwa gleichen Gruppen ausgegangen werden, die bei einem (nun eben nicht stattfindenden) Pretest die Objekte durchschnittlich in Übereinstimmung miteinander (d.h. in gleicher Weise) bewerten würden (d.h.: Tendenziell die meisten Personen würden Objekt X auf Position 1 wählen, Objekt Z auf Position 2, Objekt Y auf Position 3, etc.).
  2. Alle Probanden müssen dann beim Posttest unter mehreren Objekten das gleiche Objekt bewerten è Die Bewertung eines Objekts auf einer abstrakten Rangposition ist mit diesem Modell nicht mehr möglich, da der VL ohne den Pretest die Präferenz-Reihenfolge des Probanden nicht erfährt (= Der VL kann gar nicht anders, als ein bestimmtes Objekt zu bestimmen, da er keine weiteren Informationen über die Präferenz-Rangfolge der Probanden hat. Diese Informationen würde er durch den Pretest erlangen, der ja aber hier vermieden werden soll).

Beispiel:
Der Proband kommt in einen Raum, in dem er sich mit zehn Zeitschriften beschäftigen kann.
Schließlich betritt der VL den Raum und verabreicht das Treatment, mit dem er bei dem Probanden eine Einstellungsänderung bzgl. einer Zeitschrift erreichen möchte. Er sagt z.B.
"Diese Zeitschrift X darfst Du nicht mehr anfassen.", und verlässt daraufhin wieder den Raum. Nach ein paar Minuten wird der Proband dann aufgefordert, die Zeitschriften zu bewerten (Posttest). Wenn nun die Bewertung der durch den VL ausgesuchten Zeitschrift X bei der Experimentalgruppe signifikant besser oder schlechter ausfällt als bei der Kontrollgruppe, fand eine Einstellungsänderung durch das Treatment statt.

Ein Problem bei diesem Vorgehen: Da der VL aufgrund des nicht stattgefundenen Pretests nicht weiß, welche Objekte bei den Probanden auf dem ersten oder auf dem letzten Präferenzplatz stehen, ist es möglich, dass er ein Objekt als Ziel der Einstellungsänderung auswählt, das nur abgewertet (bei einem Objekt auf Platz 1) oder nur aufgewertet (bei einem Objekt auf dem letzten Platz) werden kann. Wenn der VL nun durch ein bestimmtes Treatment erreichen möchte, dass ein spezielles, von ihm ausgewähltes Objekt abgewertet wird, dieses Objekt aber ohnehin schon am wenigsten durch den Probanden präferiert wird (= sich auf dem letzten Platz befindet), dann kann der Proband das Objekt nicht noch weiter abwerten (die letzte Position ist eben die letzte Position.). Das bedeutet, dass der Effekt in den Daten schwächer dargestellt wird, obwohl er tatsächlich stärker ist.
Lösung: Wenn es dem VL um eine Abwertung geht, versucht er deshalb solche Objekte als Ziel des Treatments auszuwählen, die der Proband wahrscheinlich/voraussichtlich sehr hoch (möglichst Position 1) bewertet (hier gibt der Text interessanterweise das Beispiel der Zeitschrift "Playboy" an) und umgekehrt, wenn die Einstellungsänderung in einer Aufwertung resultieren soll. Dies kann man am besten so bewerkstelligen, dass alle Objekte total langweilig sind - außer eines, das ganz aufregend ist. è Schon hat man ein Objekt, das sich sehr gut zur Abwertung eignet (umgekehrt bei Aufwertung).

Das posttest-only control-group design hat die gleiche interne Validität wie das Modell mit Pretest (= Pretest-posttest control-group design), aber zusätzlich noch eine hohe externe Validität.
Wenn man sowohl auf Populationen verallgemeinern/schließen können möchte, die einem Pretest unterzogen wurden, als auch auf Populationen, die keinem Pretest unterzogen wurden, wendet man das "Solomon-vier-Gruppen-Design" an. Das sind dann vier Gruppen, von denen die ersten beiden (Experimental- + Kontrollgruppe) die Untersuchung mit Pretest durchmachen und die letzten beiden (Experimental- + Kontrollgruppe) die Untersuchung ohne Pretest absolvieren. Indem man die Ergebnisse einzelner Gruppen voneinander subtrahiert, kann man ausrechnen, wie das Treatment wirkt, wie das Treatment mit dem Pretest interagiert und ob auch der Pretest allein die Ergebnisse beeinflusst.
Nachteile dieses Designs: Es ist sehr aufwändig und erhöht nicht die interne Validität.

Within-Subjects vs. Between-Subjects Designs (S. 143):
Between-Subjects Designs: ohne Messwiederholung.
Within-Subjects Designs: mit Messwiederholung (MW).

Achtung: Carry-over-Effekte und Reihenfolgeeffekte (contrast effect)! (s. Statistik / Versuchsplanung)
Lösung: Lateinisches Quadrat
Vorteil der Messwiederholung: Man benötigt weniger Probanden.

Man kann Designs ohne und mit MW auch miteinander kombinieren ( Beispiel: Die erste Hälfte der Probanden durchläuft Bedingung A, die zweite Hälfte der Probanden Bedingung B. Vier Wochen später umgekehrt.)

Matching (S. 148):
In Untersuchungen, in denen man eigentlich ein Design mit MW nutzen würde, jedoch die Lernfähigkeit der Probanden für Ergebnisverfälschung sorgen würde, "matched" man jeweils zwei Probanden, die sich hinsichtlich bestimmter geforderter Dimensionen (z.B. IQ) ähnlich sind. Eine Person des Paares wird der Experimental- die andere der Kontrollgruppe zugewiesen. Welche der beiden Personen der einen der beiden Gruppen zugewiesen wird, muss per Zufall ermittelt werden. Konsequenterweise gelangt die andere Person dann in die andere Gruppe. è keine großen zufälligen Unterschiede zwischen den beiden Gruppen dank Matching.

Probanden-Verlust (S. 150):
Wenn man größere Mengen an Probanden verliert (sie beenden das Experiment nicht oder man muss aus bestimmten Gründen ihre Daten löschen), dann besteht die Gefahr, dass das Resultat der Untersuchung nur noch für solche Menschen gilt, die an der Untersuchung bis zum Schluss teilnahmen. Wenn die Daten aller anderen Personen, welche z.B. misstrauischer oder intelligenter o.ä. vorgegangen sind, aus dem Datenset gelöscht werden müssen oder die Daten gar nicht erst zustande kamen, ist dies ein Hinweis darauf, dass die Gruppe Menschen, auf der das Datenset basiert, keine zufällige Stichprobe mehr ist, sondern sie tendenziell aus Menschen mit z.B. geringem IQ bestehen könnte. Somit besteht kein Gleichgewicht mehr zwischen der Experimental- und der Kontrollgruppe. Wenn nur wenige Probanden ausfallen (gleichmäßig über alle Experimentsbedingungen verteilt) besteht kein großer Grund zur Sorge.