Während wir uns noch oft über etwas erwartbaren, zu hölzernen oder zu blumigen Formulierungen von ChatGPT ärgern, hat ein amerikanisches Forscherteam den Beweis angetreten: KI kann kreativer denken als der Mensch. An der Universität von Arkansas wurden für die Studie 151 menschliche Teilnehmer in drei Tests gegen ChatGPT-4 angesetzt. Gemessen wurde divergentes Den-ken, das als Indikator für kreatives Denken gilt. Divergentes Denken beschreibt die Fähigkeit, eine einzigartige Lösung für eine Frage zu fin-den, für die es keine erwartete Lösung gibt, zum Beispiel „Wie vermeide ich es am besten, mit meinen Großeltern über Politik zu sprechen?“ In der Studie gab GPT-4 darauf originellere und ausführlichere Antworten als die menschlichen Teilnehmer. Im Test verwendeten die Forscher drei Arten von Aufgaben: Alternative Use Tasks, bei denen die Teilnehmer aufgefordert werden, sich kreative Verwendungsmöglichkeiten für alltägliche Gegenstände wie ein Seil oder eine Gabel auszudenken. Consequences Tasks, bei denen die Teilnehmer gefragt sind, sich die möglichen Folgen hypothetischer Situationen vorzustellen, z. B „Was wäre, wenn die Menschen keine Nahrung mehr bräuchten?“
„ChatGPT hat bei Denkaufgaben origineller und ausgefeilter geantwortet als die menschlichen Teilnehmer.“
Divergent Associations Tasks, bei denen die Teilnehmer zehn Substantive bilden sollen, die semantisch so weit wie möglich voneinander entfernt sind. So gibt es beispielsweise zwischen „Pferd“ und „Katze“ keine große semantische Distanz, während zwischen Wörtern wie „Katze“ und „Ontologie“ eine große Distanz besteht. Die Antworten wurden nach der Anzahl der Antworten, ihrer Länge und dem semantischen Unterschied zwischen den Wörtern bewertet. In der Auswertung stellte das Forscherteam fest, dass GPT-4 bei jeder der divergenten Denkaufgaben insgesamt origineller und ausgefeilter antwortete als Menschen – selbst wenn man die Geläufigkeit der Antworten berücksichtigt. Mit anderen Worten: GPT-4 zeigte ein höheres kreatives Potenzial bei einer ganzen Reihe von Aufgaben zum abweichenden Denken“. Zugegeben, zu diesem Ergebnis gibt es einige Vorbehalte, so wiesen die Autoren der Studie darauf hin, dass die in dieser Studie verwendeten Messgrößen zwar das kreative Potenzial messen, aber nicht die reale Beteiligung an kreativen Aktivitäten oder Leistungen. Da die KI im Gegensatz zum Menschen keine Handlungsfähigkeit besitzt und auf die Unterstützung eines menschlichen Nutzers angewiesen ist, stagniert das kreative Potenzial der KI, solange sie nicht dazu aufgefordert wird. Außerdem haben die Forscher nicht bewertet, wie angemessen die GPT-4-Antworten im realen Kontext waren. Während die KI also möglicherweise mehr und originellere Antworten geliefert hat, haben sich die menschlichen Teilnehmer möglicherweise dadurch eingeschränkt gefühlt, dass ihre Antworten in der realen Welt funktionieren müssten. Die Forscher räumten auch ein, dass die Menschen vermutlich weniger motiviert waren, ganz ausführliche Antworten zu verfassen und dass der Test vielleicht nicht alle Maßstäbe für divergentes Denken abdecken kann. Jenseits der methodischen Fragen, ob solche Tests ein perfektes Maß für das menschliche kreative Potenzial sind, finde ich es spannend, wie schnell sogenannte Large Language Modells Fortschritte machen. Fortschritte, die wir uns zunutze machen können, statt uns vor der Bedrohung unserer Kreativität zu fürchten. KI als Werkzeug für Inspiration im kreativen Prozess beginnt, richtig Spaß zu machen!