Künstliche Intelligenz erschafft Kunstwerke, die erstaunlich wären, wenn sie absichtlich gemacht worden wären.
Durchschnittliche Lesezeit: ca. 4–6 Minuten
Nach dem anfänglichen Hype um Künstliche Intelligenz ist nun bereits gut ein Jahr vergangen, und wir haben uns an Chatbots und Bildgeneratoren gewöhnt. Meldungen darüber, dass ein Google-Chatbot ein Bewusstsein erlangt haben soll und die Bild-KI DALL·E ihr eigenes Vokabular entwickelt hat, erscheinen im Nachhinein nicht mehr allzu überraschend. Es ist an der Zeit, die Entwicklungen und Fortschritte der vergangenen Zeit noch einmal Revue passieren zu lassen.
Erstaunliche Bildergebnisse per Texteingabe
Bilder erzeugende AI der neuesten Generation ist in der Lage, aus einer Beschreibung, die in Textform vorliegt, verblüffende Visualisierungen zu erzeugen.
Das folgende Problem besteht jedoch noch immer: Eine künstliche Intelligenz, die ihre Kenntnisse und ihr Wissen aus einer Bilddatenbank bezieht, kann nur so unvoreingenommen sein, wie das Bildmaterial, das ihr vorliegt und der Algorithmus, der es verarbeitet (s. Diskriminierende KI – das Problem mit der Blackbox).
Im Rennen um Künstliche Intelligenz sind zahlreiche Akteure am Start. OpenAI präsentiert stolz DALL·E, und ist nebenbei mit dem Chatbot ChatGPT äusserst präsent. Midjourney hat sein Open-Source-Modell Stable Diffusion ins Spiel gebracht, während craiyon ebenfalls auf ein Open-Source-Modell zurückgreift, um das renommierte Vorbild DALL·E nachzuahmen. Google arbeitet derweil an Imagen, und in Microsofts Bing ist ebenfalls eine Bild-erzeugende KI integriert, die durch ihre einfache Zugänglichkeit und überzeugende Ergebnisse Aufmerksamkeit erregt.
Wie funktioniert der Algorithmus?
Um es einfach auszudrücken, folgt Künstliche Intelligenz bei der Bildkomposition diesen Schritten: Zunächst wird der eingegebene Text interpretiert, um ein Modell für das Bild zu erstellen. Anschliessend wird dieses Bild nachgezeichnet, und es werden verschiedene Variationen des Motivs erzeugt.
Der Algorithmus kann neue Bilder basierend auf Texteingaben erschaffen, Variationen eines bereits bestehenden Bildes erzeugen, bestehenden Bildern Elemente hinzufügen und entfernen oder Bilder im Stil einer Künstlerin oder eines Künstlers neu erschaffen. Wenn du mehr über die Arbeitsweise der KI erfahren möchtest, findest du hie weitere Informationen zu craiyon | DALL·E mini und hier zu DALL·E 2.
Bei seiner Recherche bedient sich das Programm über eine Schnittstelle an Bildern, die im Internet vorliegen und in der Regel von Google kuratiert werden.
Die entstehenden Bilder besitzen oft eine künstlerische Qualität, die erstaunlich wäre, wenn eine Absicht dahinterstecken würde. Doch es handelt sich lediglich um Zufallsergebnisse eines Algorithmus, der interpretiert, aber nicht wirklich versteht, was er da genau tut.
Einschränkungen, Probleme und Bedenken
Die Genialität der KI wird beeinträchtigt, da sie einfache Konzepte wie Hände oder Türen und Fenster immer noch nicht vollständig versteht, obwohl sie für uns offensichtlich sind. Vielleicht ist dies jedoch gar nicht so wichtig. Es genügt, wenn wir glauben, dass eine KI über ein Bewusstsein verfügt, wie im Fall des zu Beginn erwähnten Chatbots. Allein der Glaube daran verändert bereits unser Verhalten beim Benutzen einer App. Ebenso kann es genügen, dass wir an eine künstlerische Absicht bei der Bildgestaltung glauben, ohne dass diese den entstandenen Werken zugrunde liegen muss.
Bedeutender jedoch ist die Verzerrung, die durch einen Algorithmus entstehen kann.
Das Bild zur «Flugbegleitung» zeigt deutlich ein voreingenommenes Rollenbild, während «Arbeitende auf einer Baustelle» eine wesentlich differenziertere und ausgewogenere Darstellung bietet. Im Laufe eines Jahres wurden hier deutliche Verbesserungen vorgenommen.
KI sollte von Natur aus unvoreingenommene Entscheidungen treffen. Dennoch kann der Einsatz von KI sehr wohl, ob unbeabsichtigt oder beabsichtigt, zur Diskriminierung führen. In solchen Fällen deckt das maschinelle Lernen oft bestehende Schieflagen auf, die sich bereits seit Langem in der Gesellschaft verfestigt haben. Im Extremfall kann es diese Schieflagen sogar verstärken.
Die rechtlichen Konsequenzen sind ebenso wenig absehbar. Zum einen öffnen Algorithmen Manipulationen Tür und Tor. Selbst wenn ausdrücklich die Verwendung eines sexuell orientierten oder gewalttätigen Vokabulars gestrichen wurde. Es finden sich immer Umschreibungen, die vergleichbare Ergebnisse hervorbringen.
Auch wenn die Bildergebnisse solcher KI-Prompts teilweise als künstlich erzeugte Bilder erkennbar sind, viele sind es bereits nicht mehr. Das eröffnet Tür und Tor für Fake News! Da die Filter, die manipulative Inhalte verhindern sollen, oft nur die Eingabe, jedoch nicht das Ergebnis überprüfen, sind durch geschickte Eingaben noch immer brisante Inhalte möglich.
Und wem gehören die Rechte an den Bildern, die DALL·E und Co. erzeugen? DALL·E mini erlaubt uneingeschränkt die nicht kommerzielle Nutzung. Gehören die Rechte an einem Bild denen, die den Algorithmus entwickelt haben, dem Künstler, der sein Bildmotiv entsprechend formuliert, denen, die die Bilddatenbanken kuratieren, oder allen, die Bilder zu dieser Bilddatenbank beisteuern?
Es wäre ähnlich, zu fragen, wem gehören die Rechte an einem Gemälde? Dem Künstler, der Künstlerin, denen, die die Werkzeuge wie Pinsel, den Malgrund, die Farben herstellen? Und wie sieht es mit denen aus, die die Rohstoffe beschaffen? Oder den Modellen?
Natürlich würde vermutlich jede oder jeder hier sagen, dass dem Künstler, der Künstlerin das alleinige Recht zusteht. Doch ist es so einfach? Letztlich haben alle dazu beigetragen, dass ein Kunstwerk entstanden ist.
Die spannende Entwicklung künstlicher Intelligenz zeigt auf, dass wir in dieser Hinsicht unsere Sichtweise ändern sollten. Auch müssen wir dafür sorgen, dass Standards etabliert werden, die die Innovation nicht behindern, sondern sie in den rechten Bahnen halten. Auf diese Weise können wir sicherstellen, dass alle Beteiligten gerecht belohnt werden, während wir gleichzeitig neue Werke erschaffen und teilen.