Künstliche Intelligenz und Kreativität
Wer ist Kreativer - Mensch oder KI?
In einer kürzlich erschienen Studie (Carolus, Koch & Feng, 2025) vergleichen wir die kreative Leistungen von Menschen und KI in der Alternate Uses Task. Hierbei sollen alternative Nutzungsmöglichkeiten für Gegenstände gefunden werden. Durch eine KI und menschliche Rater wird die Originalität (Neuartigkeit/Einzigartigkeit) der Antworten bestimmt. Die Menschen und KI befinden sich in einer von zwei Bedingungen:
- Bedingung: Entspricht der Studie von Koivisto & Grassini (2023). Es zeigt sich, dass KI durchschnittlich kreativere Antworten liefert.
- Bedingung: Wir haben die Instruktionen und die Bearbeitugngszeit aktueller Forschung folgend angepasst. In einigen Fällen verschwinden so die Unterschiede zwischen Mensch und KI.
Es sind jedoch immer noch Fragen offen. Wäre ein solche Frage etwas für Ihre Abschlussarbeit?
Thema I: Was kann methodisch an der Studie optimiert werden?
Wir nennen Limitationen unseres Ansatzes, die Sie in Ihrer Abschlussarbeit angehen können. Beispielsweise können Sie einer dieser Ideen nachgehen:
-
Das „subjective Rating“ der kreativen Antworten kann verbessert werden. In unserer Studie erfolgte es nur durch jeweils zwei Personen mit kurzer Vorbereitungszeit. Entsprechend war die Interrater-Reliabilität gering. Sie können die vorhandenen Daten nutzen und neu raten. Alternativ können Sie auch eigene Daten erheben.
-
In unserer Studie wurde divergentes Denken nur durch den Indikator Originality (Neuheit/Einzigartigkeit von kreativen Ideen) erfasst. Der Indikator Fluency (Anzahl der kreativen Ideen) wurde lediglich als Kontrolvariable betrachtet. Die Indikatoren Flexibility (Anzahl der kreativen Ideen aus unterschiedlichen Kategorien) und Elaboration (Ausarbeitung der kreativen Ideen) wurden bisher nicht betrachtet. Auch hier können Sie mit vorhandenen Daten arbeiten.
-
Bisher wurden die KIs manuell befragt. Die Instruktionen wurden händisch eingegeben, die Antworten kopiert, in eine Tabelle übertragen. Anschließend wurde die Session zurückgesetzt. Über eine Schnittstelle (API, Application Programming Interface) kann Abfrage und Erfassung der KI-Antworten automatisieren werden. Die erfordert technisches Wissen und Können.
-
Wichtig: Vorhandenes Material (Datensätze, SoSci-Fragebogen, R-Skripte, etc.) kann genutzt werden
Thema II: Wie schneiden kreative Menschen im Vergleich mit KI ab?
Sowohl wir als auch Koivisto & Grassini (2023) untersuchen in ihren Studien Stichproben, die zuvor nicht nach bestimmten Kreativitäts-bezogenen Kriterien ausgewählt wurden. Damit bleibt die Frage offen, ob Menschen, die besonders kreativ sind, sich besser gegen die KI behaupten könnten. Sie können folglich einer dieser Ideen nachgehen:
-
Replikation unserer Studie (oder Teile davon) mit verschieden-kreativen menschlichen Stichproben (Pbn aus kreativen Tätigkeiten + Pbn, die an Kreativitätstraining teilnahmen)
-
Kreativitätstraining entwickeln, dass Pbn vor Versuchsteilnahme durchlaufen
-
Einschlusskriterien „Kreative Tätigkeiten“ definieren (verschiedene Gruppen möglich)
-
Regelmäßig malen, kunsthandwerklich tätig sein, ein Instrument spielen
-
In einer kreativen Branche arbeiten (Design, Marketing, Musik, Tanz, Theater, Architektur, etc.)
-
Künstlerische Auszeichnungen erhalten haben
-
-
Kreativität kann z.B. durch Fragebögen operationalisiert werden (z.B. Fragebogen zu kreativen Tätigkeiten ICAA, Diedrich et al., 2018)
-
Wichtig: Vorhandenes Material (Datensätze als Vergleichsgruppe, SoSci-Fragebogen, R-Skripte, etc.) kann genutzt werden
Thema III: Wie schneiden Menschen vs. KI in lebensnahen Aufgaben ab?
Die Kreativitätsaufgabe, die in den Studien genutzt wurde (Alternate Uses Task), weist nur eine geringe Alltagsrelevanz auf. Zudem ist von Ermüdungseffekten bei den Teilnehmenden auszugehen, die mehrere Teilaufgaben nacheinander ausführen. Es stellt sich die Frage: Sind Menschen in lebensnäheren Aufgaben kreativer als KI? Oder kann KI die kreative Arbeit von Menschen bald übernehmen? Mögliche Ansatzpunkte für Sie:
-
Weg von den Aufgaben, hin zum kreativen Denken und hin zu Aufgaben kreativer Tätigkeit
-
Kreative Produkte erzeugen und diese blind bewerten lassen
-
Gedichte, Liedtexte, Prosa, Rhythmus, Melodie
-
Sachtext
-
Design (viele Optionen von handwerklichen Dingen bis zu Gebäuden möglich)
-
Kunstwerk
-
-
Rating könnte durch Online-Stichprobe erfolgen (größere Gruppe von unabhängigen Personen bewerten lassen): gewinnt durch „Repräsentativität“ an Validität („was findet die Bevölkerung kreativ")
Thema IV: Wie schneiden Menschen vs. KI in Aufgaben berufsbezogener Kreativität ab?
Auch die unter Studie III beschriebenen kreativen Leistungen/Tätigkeiten haben wenig mit tatsächlicher berufsbezogener Kreativität zu tun. Sie können nur für wenige Menschen auf einen professionellen Kontext übertragen werden. Da es schweirig ist, berufsbezogenen Kreativität durch Aufgaben zu messen, kann hier ein validiertes Instrument genutzt werden. Es kann die Frage beantwortet werden: Ist KI in berufsbezogenen kreativen Aufgaben besser? Kann KI die kreative Arbeit von Menschen bald übernehmen? Sie könnten untersuchen:
-
Erfassung berufsbezogener Kreativität
-
mögliche Messinstrumente
-
Diagnose berufsbezogener Kreativität – Planung und Gestaltung (DBK-PG; Schuler, Gelléri, Winzen & Görlich, 2013)
-
Möglicherweise exisitieren Alternativen
-
Stichproben: Menschen in kreativen Berufen und/oder Allgemeinbevölkerung
Thema V: Systematische Variation der Bearbeitungszeits und Prompts
Ein zentraler Befund unserer Studie ist, dass die Bearbeitungszeit und die Instruktionen einen Einfluss auf die Unterschiede hinsichtlich der Kreativität zwischen Menschen und KI haben. Es wurden jedoch nur zwei (miteinander konfundierte) Aspekte getestet. Die Bearbeitungszeit (30 sec vs. 2 min) und die Instruktion (Fokus auf Qualität vs. Fokus auf Qualität UND Quantität) wurden gemeinsam variiert (30 sec + Qualitätsinstruktion vs. 2 min und Qualitäts-Quantitätsinstruktion).
-
Weiterdenken unseres zentralen Ansatzes: die KI ist nicht zwingend kreativer, sondern die Rahmenbedingungen sind förderlicher für sie
-
Bearbeitungszeit und Instruktionen/Prompts sollten unabhängig voneinander variiert werden
-
Systematische Variation der Bearbeitungszeit und Instruktionen/Prompts, um zu schauen, wo der „break even“ point erreicht ist: feinere Abstufungen etwa der Bearbeitungszeit
-
Die Auswirkung könnte in verschiedene Tasks und unter Nutzung verschiedener Operationalisierungen (Fluency, Flexibility, Originality, Elaboration) unterschiedlich stark sein. Diese könnten als zusätzlicher Faktor mit erfasst werden.