Gewalt in Computerspielen: Methoden der WirkungsforschungDonnerstag, 19. Januar 2012, von Adrian Schneider
Machen gewalthaltige Computerspiele aggressiv? Welchen
Einfluss haben Computerspiele auf das Verhalten der Spieler? Mit diesen
Fragen beschäftigt sich die Medienwirkungsforschung.
Häufig wird der Stand der Forschung als eindeutig dargestellt:
„Killerspiele“ fördern Gewalt. Doch Ergebnisse und Methoden der
Wirkungsforschung sind auch unter Psychologen umstritten.
Malte Elson ist Diplom-Psychologe und arbeitet als wissenschaftlicher Mitarbeiter an der Universität Gent. Er hat in einer Studie die Methoden der Wirkungsforschung untersucht und kam zu dem Ergebnis: Schon minimale Abweichungen bei den Versuchen können zu völlig gegensätzlichen Ergebnissen führen, viele Forschungsergebnisse sind kaum belastbar. Im Interview mit Telemedicus erklärt er die Hintergründe. Was genau ist Wirkungsforschung – was untersucht man da? Wie der Name schon sagt: Bei der Wirkungsforschung im Allgemeinen geht es um die Auswirkungen eines Reizes auf das Verhalten, Emotionen oder Gedanken. Die Medienwirkungsforschung befasst sich im Speziellen mit der Wirkung von Medien. Genauer: von Medienformen und Medieninhalten. Wie macht man das? Wie laufen solche Untersuchungen ab? Das klassische Experiment in der Medienwirkungsforschung sieht so aus, dass man einer Gruppe von Probanden einen bestimmten Medieninhalt zeigt (zum Beispiel lässt man eine Gruppe von Menschen ein gewalthaltiges Computerspiel spielen) und einer anderen Gruppe zeigt man andere Inhalte (zum Beispiel ein Computerspiel, das keinerlei Gewalt enthält). Konkretes Beispiel: Eine Gruppe von Probanden lässt man Counter Strike spielen, eine andere Tetris. Mit Spielen, die überhaupt nicht miteinander vergleichbar sind? Genau, und hier liegt ein großes Problem in der Forschung. Misst man bei der einen Gruppe später irgendwelche Auffälligkeiten, geht man davon aus, dass es auf die Medieninhalte zurückzuführen ist. Würde eine Gruppe ein Spiel mit Gewalt, und eine andere das gleiche Spiel ohne Gewalt spielen, könnte man eventuell gefundene Verhaltensunterschiede auf die Gewalt zurückführen. Die wenigsten Spiele unterscheiden sich aber nur durch eine Dimension: Es gibt kein „Counter Strike, nur ohne Gewalt”. Wenn ich aber die eine Gruppe Counter Strike spielen lasse und die andere Tetris, könnte zwar die Gewalt ein entscheidender Unterschied sein. Es könnten aber eben auch viele andere Dinge sein – Tetris zum Beispiel ist zweidimensional. Es ist also häufig sehr schwer zu sagen, was genau die Unterschiede, die man gemessen hat, ausgemacht hat. War es wirklich die Gewalt – oder war es eine andere Variable, die beim einen Spiel vorhanden ist und beim anderen nicht? Zum Beispiel? Zum Beispiel gibt es für das Genre „First-Person-Shooter”, oder „Ego-Shooter”, sehr viele Aspekte, die für diese Art von Spielen typisch sind. Allein die Ego-Perspektive gibt es in kaum einem anderen Genre. Wer weiß, vielleicht hat allein die Perspektive schon irgendwelche Auswirkungen? Systematisch untersucht wurde das jedenfalls noch nicht. Was ich selbst untersucht habe, ist die Auswirkungen der Spielgeschwindigkeit. Gerade Shooter haben oft im Vergleich zu anderen Spielen eine sehr hohe Geschwindigkeit. Man muss sich ständig bewegen, häufig bewegt man sich im Sprint, alles ist hektisch, man springt, dreht sich und so weiter. Wenn man im Vergleich z.B. die Fußballsimulation FIFA spielt, passiert da auf dem Bildschirm vergleichsweise wenig. Je nach Kameraperspektive hat man auch stets einen guten Überblick. In meiner Studie gab es also eine schnelle und einen langsame Version eines Shooters, und dieser Unterschied hatte tatsächlich starke Auswirkungen auf meine Probanden. Bei anderen Studien wurde das bislang nicht berücksichtigt.
Eine präparierte Maus, um körperliche Reaktionen zu messen. Quelle: Malte Elson, Lizenz: cc by-nc-sa.
Und wie misst man nun die Auswirkungen des Spielens? Da muss man verschiedene Aspekte unterscheiden: Häufig wird schon während des Spielens sog. „physiologisches Arousal“ aufgezeichnet. Also zum Beispiel Herzschlag oder Hautwiderstand. Damit misst man die körperlichen Auswirkungen. Viel wichtiger sind aber die anderen Auswirkungen: Gedanken, Emotionen und Verhalten. Um Gedanken zu „messen“ verwendet man häufig eine Art von Worterkennungstest. Den Probanden werden Buchstabenketten präsentiert: Einige sind echte Wörter, andere sinnlose Silben. Es wird dann gemessen, wie lange die Leute brauchen, um darin ein Wort zu erkennen und was für Wörter sie erkennen. Werden zum Beispiel Wörter schneller erkannt, die mit Gewalt zu tun haben (z.B. „Schlagen“), schließt man daraus, dass auch die Gedanken in irgendeiner Form „um Gewalt kreisen“. Emotionen werden dagegen meist mit Fragebögen erfasst. Das ist natürlich nicht ganz einfach: Nicht immer können Emotionen klar geäußert werden. Oft greift man deshalb auch auf die physiologischen Daten zurück, mit denen man zumindest das Maß der Erregung erfassen kann. Allerdings muss man da auch sehr vorsichtig sein: Erregung, gemessen durch Herzschlag und Hautwiderstand, kann auch bei sehr angenehmen Situationen steigen, z.B. wenn man verliebt ist. Aggressive Emotionen kann man damit also nicht so einfach ableiten. Letztlich müssen die Daten daher kombiniert werden, um eine grobe Vorstellung von den Emotionen zu bekommen. Wie misst man aggressives Verhalten? Gewalttätiges und aggressives Verhalten ist natürlich sehr schwer im Labor zu messen. Genauer gesagt: Eigentlich wäre es ganz einfach – man könnte Leute provozieren und messen, wie lange man braucht, um sie zu gewalttätigem Verhalten zu bringen. Dagegen sprechen aber natürlich ethische und auch juristische Gründe. Daher wurden Tests entwickelt, die mittlerweile in fast allen Studien eingesetzt werden. Fast alle Forschungsergebnisse beruhen auf diesen Tests. Da ist zunächst der CRTT oder Competitive Reaction Time Task. Das ist die wohl am weitesten verbreitete Methode in der Medienwirkungsforschung. Den Probanden wird dabei gesagt, man würde ein Geschicklichkeitsspiel gegen eine andere Person spielen. Jede Runde ertönt ein Signal und der Spieler muss so schnell wie möglich die Leertaste an einem Computer drücken. Wer schneller drückt, gewinnt. Der Verlierer einer Runde bekommt vom Gewinner ein unangenehmes Geräusch auf die Ohren gelegt. Lautstärke und Dauer des Geräusches kann der Gewinner bestimmen. Und je lauter und länger der Proband das Bestrafungs-Geräusch für den Gegner wählt, desto aggressiver soll sein Verhalten sein. Der zweite bekannte Test ist das sog. „Hot Sauce Pradigm“. Nach dem Spielen werden die Probanden aufgefordert, für eine andere Person einen Teller Chili zuzubereiten. Da steht also ein Topf mit Chili, von dem man eine Kelle nimmt und dann mit scharfer Sauce würzt. Dazu stehen verschieden scharfe Saucen zur Verfügung. Die Schärfe der Sauce, die der Proband auswählt und die Menge davon sind dann die Indikatoren für das Maß an Aggressivität. Natürlich ist klar, dass es noch mehr Gründe als Aggressivität geben könnte, jemandem scharfes Essen zu servieren. Eine systematische Validierung des Tests, ob Menschen mit einer dauerhaft aggressiven Persönlichkeit auch tatsächlich immer mehr scharfe Sauce verwenden, ist mir aber nicht bekannt.
Versuchsaufbau mit präparierten Eingabegeräten zur Messung des Spielerverhaltens, Quelle: Malte Elson, Lizenz: cc by-nc-sa.
Wo ist das Problem beim CRTT? Zunächst ist da dieses Geräusch, das „zur Strafe“ eingesetzt wird. Das ist ein etwas unangenehmes Quietschen, ein bisschen wie eine Rückkopplung. Schaden kann man damit natürlich niemandem. Da stellt sich die Frage, ob das Abspielen dieses Geräusches überhaupt schon geeignet ist, um aggressives Verhalten anzunehmen, und nicht beispielsweise Schadenfreude. Es sind auch noch weitere Gründe vorstellbar, ein lautes Geräusch zu senden: Für den Probanden geht es ja um ein Geschicklichkeitsspiel. Man könnte daher das Geräusch auch strategisch einsetzen, um die Reaktionszeiten des Gegners zu beeinflussen. Viel problematischer ist aber, dass es unglaublich viele Versionen von diesem Test gibt. Es gibt eine Version, bei der man nur die Dauer des Tons einstellen kann, eine nur mit Lautstärke, eine mit beidem. Es gibt dann noch Versionen mit verschiedenen Unterteilungen von Phasen des Spiels und so weiter. Uns es gibt noch einmal genauso viele Vorschläge, wie die Daten auszuwerten sind. Insgesamt gibt es neun oder zehn verschiedene Versionen – zum Teil von den gleichen Forschern, die in ihren Publikationen immer wieder andere Tests verwenden. Der Witz ist: Je nachdem, welche Version dieses Tests man einsetzt, kommt man zu hochgradig unterschiedlichen Ergebnissen. In der Studie, die ich durchgeführt habe, hat sich gezeigt, dass man sowohl Belege dafür finden kann, dass Gewalt in Computerspielen aggressiv macht, als auch dafür, dass sie keinen Effekt hat oder sogar eher friedlich macht – nur indem man verschiedene Versionen des CRTT einsetzt. Das stellt natürlich die Sinnhaftigkeit dieses Tests sehr in Frage. Wenn allein die Wahl des Tests Einfluss auf das Ergebnis hat, steht das wissenschaftlichen Prinzipien entgegen. Gibt es denn auch Referenztests? Wird also sowohl vor als auch nach dem Spielen gemessen? Man könnte so zumindest feststellen, ob es eine Veränderung gab. Nein. Das könnte man zwar machen, aber man befürchtet, dass der Test im Vorfeld schon Auswirkungen auf den Rest des Experiments hat. Solche Vorher-Nachher-Tests sind aber auch nicht unbedingt nötig. Es gibt psychologische Tests, mit denen vorher schon gewisse „Vorbelastungen“ (man spricht hier von der „Baseline“ an Aggression) zumindest erkennen kann, also beispielsweise eine aggressive Persönlichkeit. Außerdem hat man für den Vergleich der Auswirkungen auch die Kontrollgruppe, also die Gruppe von Probanden, die ein gewaltloses Spiel spielen. Kann man zwischen den beiden Gruppen signifikante Unterschiede feststellen, kann man auch recht sicher davon ausgehen, dass hier tatsächlich eine Veränderung stattgefunden hat. Was diese Veränderung dann wiederum hervorgerufen hat, ist eine andere Frage. Wie groß sind solche Testgruppen ungefähr? In guten Studien sollten es schon mindestens 30 Leute pro Gruppe sein. In den meisten Untersuchungen sind es zwischen 60 und 200 Teilnehmern. Sind es weniger Teilnehmer, wäre die Stichprobe nicht mehr verlässlich. Darauf wird aber meistens geachtet. Problematischer ist da schon, dass es sich in vielen Studien bei den Teilnehmern ausschließlich um Psychologiestudenten handelt. Die kennen natürlich die Methoden, sodass die Gefahr besteht, dass die Ergebnisse verfälscht werden. Außerdem sind sie sich auch demographisch sehr ähnlich: Jung, guter Schulabschluss, oft aus gutem Elternhaus, etc. Im Studium hört man öfter: „Wir wissen alles über Psychologiestudenten, aber nichts über den Rest der Welt“. Meist wird man aber sagen können: Hat ein Computerspiel Auswirkungen auf Psychologiestudenten, hat es relativ wahrscheinlich auch Auswirkungen auf andere Personengruppen. Aber klar, gerade soziale Faktoren sind schwierig zu berücksichtigen. Und Studien auf Basis bundesweit repräsentativer Teilnehmer oder Teilnehmer aus der Gruppe der typischen Computerspieler gibt es nicht. Das wäre auch extrem aufwändig durchzuführen. Hältst du es für sinnvoll, auf Basis dieser Forschungen politische oder juristische Entscheidungen zu treffen? Politische und juristische Entscheidungen beruhen ja meistens nicht auf Forschungsdaten, sondern auf den Werten einer Gesellschaft. Wissenschaftliche Erkenntnisse können solche Entscheidungsprozesse höchstens unterstützen. Kritisch wird es aber dann, wenn politische und juristische Entscheidungen mit wissenschaftlichen Argumenten begründet werden, die intuitiv plausibel klingen mögen, für die es aber keine Evidenz gibt. Das sehe ich vor allem bei der strengeren Bewertung von Computerspielen im Vergleich zu anderen Medien. Diese wird häufig damit begründet, die Interaktivität des Mediums habe angeblich verstärkende Effekte. Belege gibt es dafür aber nicht, im Gegenteil. Die wenigen Studien, die dazu bisher durchgeführt wurden, finden keinen Unterschied zwischen beispielsweise Fernsehen und Computerspielen. Was bedeutet das konkret für den Jugendmedienschutz? Da muss man zwischen zwei Dingen unterscheiden: Auf der einen Seite haben wir den Jugendschutz, und den finde ich wichtig und richtig. Unverständlich ist mir aber, warum Erwachsene nicht für sich selbst entscheiden können, welche Spiele sie spielen. Auf der einen Seite sollen sie Verantwortung für ihre Schutzbefohlenen übernehmen, auf der anderen Seite weiß der Staat aber scheinbar besser, was Erwachsenen selbst zumutbar ist. Wenn Spiele für Volljährige nur unter bestimmten Auflagen, beispielsweise unter Zensur bestimmter Inhalte, auf den deutschen Markt kommen dürfen, finde ich das problematisch – vor allem, wenn dazu wissenschaftliche Argumente herangezogen werden. Der Stand der Forschung ist hier nicht eindeutig. Meine Studie hat gezeigt, dass die bisherige Forschungsmethodik eine eindeutige Interpretation der Ergebnisse nicht zulässt. Ich halte es deshalb für bedenklich, politische Entscheidungen, die auf Wertvorstellungen beruhen, mit Forschungsergebnissen zu untermauern, die eine solche Argumentation einfach nicht hergeben. Ich halte aber ein anderes Argument für immer wichtiger: Es gibt nun seit über 20 Jahren Spiele mit Gewaltinhalten. Fast eine ganze Generation ist unter der Wirkung dieser Spiele aufgewachsen. Wenn die Effekte so groß wären, wie manchmal dargestellt, muss man sich fragen: Wo zeigen sie sich im Alltag? Die Kriminalstatistiken zeigen da keine wesentlichen Auswirkungen – Gewaltdelikte sind in den letzten Jahren eher zurück gegangen, während die Anzahl und Verbreitung gewalthaltiger Computerspiele zunimmt. Da sollte man natürlich auch keinen Kausalzusammenhang herstellen. So simpel und „klar“, wie manchmal gern behauptet wird, ist die Lage aber nicht. Ich sehe auch nicht, dass gewalthaltige Computerspiele unsere Gesellschaft spürbar verändert haben. Die Auswirkungen von Gewalt in Computerspielen spielen gesellschaftlich in meinen Augen eine eher untergeordnete Rolle. Danke für das Gespräch. Malte Elson ist Diplom-Psychologe und arbeitet als wissenschaftlicher Mitarbeiter am Institut Media & ICT der Universität Gent. Er beschäftigt sich mit der Wirkung digitaler Spiele auf aggressives Verhalten und physiologisches Arousal, stereoskopischen 3D-Spiele, Methoden der Medienwirkungsforschung, sowie Medienregulierung und Altersklassifizierung. In seiner Diplomarbeit „The Effects of Displayed Violence and Game Speed in First-Person Shooters on Physiological Arousal and Aggressive Behavior” befasste er sich eingehend mit den Auswirkungen von Gewalt und Spielgeschwindigkeit von Ego-Shootern. Die Arbeit steht unter Creative Commons (BY-NC-SA). Disclaimer: Adrian Schneider ist wissenschaftlicher Mitarbeiter bei Osborne Clarke. Die Kanzlei befasst sich u.a. intensiv mit jugendschutzrechtlichen Fragen bei Computerspielen. |
Keine Kommentare:
Kommentar veröffentlichen