For Sale

AI in der Werbung – was geht und was geht (noch?) nicht.

Fachartikel — 29. März 2023

Stefan Filtgen

Geschäftsführung | Kreation

Künstliche Intelligenz hält Einzug in die Werbebranche. Unser Geschäftsführer Stefan Filtgen hat sich tief in die Welt der bildgestaltenden KIs eingearbeitet und seine Erkenntnisse nach den ersten 841 Midjourney-Bildern mit der Agentur geteilt. Daraus entstanden ist ein Interview für den Fotoblog kwerfeldein.de, das wir hier auf unserem Blog noch einmal teilen.

Unsere Branche streitet über bildgenerierende KI – ist das denn wirklich „The Next Big Thing“?

Stefan: So wie wir das mit ChatGTP erlebt haben, hat auch die bildgenerierende AI, wie Midjourney oder Stable Diffusion, in den letzten Monaten unglaubliche Sprünge gemacht.

Seit ein paar Jahren kennen wir Programme und Apps, die ein Selfie in einen Comic-Avatar oder einen Elfen verwandeln, aber für ein professionelles Bild haben AIs einfach noch zu viele Fehler gemacht. Da stimmten die Proportionen und Größenverhältnisse nur selten und komplexe Strukturen wie Gesichter oder Haare wirkten eher gezeichnet, als fotografiert.

Alte Welt / Ergebnisse einer AI 2021/2022

Und das hat sich geändert?

Definitiv. Wenn es gut gemacht ist, kann man Portraits aus einer AI nur noch schwer von echter Fotografie unterscheiden. Es gibt auch tatsächlich Beispiele, in denen Fotografen für Ihre sensationellen Portraits gelobt werden und dann stellt sich heraus, dass sie dafür keine Kamera in der Hand hatten. Ärgerlich daran ist für mich nur die Behauptung, die Bilder seien wirklich fotografiert, im Beispiel beschreibt ein Instagram Fotograf sogar sein Equipment („a Nikon D810 with 24-70mm lens“).

Gute Bilder können es natürlich immer trotzdem sein.

AI generierte Bilder heute, by Stefan Filtgen

Kann ein AI Bild denn ähnlich realistisch, ich möchte fast fragen „authentisch“ wirken, wie ein Foto.

Es gibt ganze Branchen, in denen die Fotografie und ebenso die Darstellung von Menschen zunehmend artifiziell geworden ist. Zum Beispiel sehen wir in der Modefotografie oft Bilder, die kein echter Mensch so erreichen kann. Das beginnt bei der Anatomie der Modelle, über die Inszenierung und die sehr aufwändige Retusche von Haut und Gesichtsformen. Hier fließen zwei Entwicklungen gegeneinander: Fotografie wird immer künstlicher und das künstliche immer echter. Ich kann mir gut vorstellen, dass wir bald einen Gegentrend erleben und das Echte und Ungeschönte wieder Einzug in die Fotografie von Fashion und Beauty nimmt. Wenn jeder TikToker*in sich mit Filtern wie bold glamour selbst optimieren kann, werden wir das nicht durchoptimierte Bild hoffentlich wieder schätzen.

Ok, und wie einfach oder schnell ist denn ein KI Bild erzeugt?

Das erste KI Bild erzeugt man in ein paar Minuten. Einfach einen Textpromt bei Stable Diffusion oder DALL·E eingeben, dem Algorithmus 15-20 Sekunden geben und schon bietet er vier Bilder an, die mehr oder weniger mit der Aufgabe zu tun haben. Die echte Bildkreation beginnt danach. Jetzt wird man mit den Prompts immer genauer und feiner und referenziert auf alles, was bereits entstanden ist. Bis man mit dem Ergebnis zufrieden ist, können dutzende Zwischenbilder entstehen. Hier liegt das Potenzial, aber auch eine ganze Menge kreativer Arbeitszeit. Wenn ich zum Beispiel ein Bild von mir hochlade und dem Algorithmus beschreibe, was er tun soll, dann bekomme ich erst mal eine große Auswahl von Bildern, die teils schon gut aussehen, aber nicht das sind, was ich mir vorgestellt habe.

Der lange Weg zum richtigen Bild.

In diesem Beispiel sehen alle Bilder meinem Ausgangsmotiv ähnlich, aber sie sehen nicht mehr wie Fotos aus, eher wie gute Karikaturen. Das ist der Standard auf Midjourney, aber da geht mehr; also muss sich genauer beschreiben, was ich möchte, bis ich schließlich bei diesem Bild lande:

Das finale Bild. Promt (u.a.): Portrait im Stil von Richard Avedon.

Und um das Ergebnis zu erzielen, bin ich – ähnlich wie nach einem Shooting – noch durch einen Entwicklungsprozess in Capture-One und kleinere Korrekturen in Photoshop gegangen, bis ich tatsächlich zufrieden war.

Kann ich denn mit der KI auch in ein „kreatives Sparring“ gehen und mich inspirieren lassen?

Unbedingt. Für mich könnte das eine der zentralen Einsatzmöglichkeiten im Rahmen einer Kampagnen- oder Bildkreation sein. Ich kann die KI zum Beispiel bitten, mehrere Motive miteinander zu kombinieren, die Ergebnisse sind richtig interessant, ich scheue mich fast den Begriff zu benutzen, aber ja, sie sind auch höchst „kreativ“.

Kreatives Ping-Pong mit einer AI. Die beiden Motive links ergeben das rechte.

Ok, wo siehst Du Grenzen?

Hände und „Konkretes“. Die KI mischt alles, was sie hat, bei Gesichtern werden das gemischte Gesichter, aber bei Händen werden das heute noch Objekte mit 3 oder 6 Fingern, die nur in der Haltung an eine Hand erinnern, allerdings tut sich hier gerade sehr viel.

Und Konkretes. Ein bestimmter Mensch, ein bestimmtes Produkt, oder auf Textebene, eine ganz konkrete Aussage, werden wir noch lange nicht von einem Algorithmus bekommen. Das Konkrete widerspricht seiner Konstruktion, ein Ergebnis aus möglichst vielen Quellen möglichst generell zu modellieren, wenn das nicht gelingt, spricht die Branche spricht auch von halluzinieren. In Kombination mit echten Bildern, sehe ich allerdings kaum Grenzen. Wenn wir beispielsweise einen realen Produktschuss anbieten und diesen per Algorithmus in ein Bild platzieren, können wir mit den Tools in Zukunft fast alles bauen.

Ich möchte das mit einer Bildstrecke illustrieren, die nicht von mir ist. Die Instagramm Künstlerin BONNIE TSANG, sie beschreibt sich selbst als „Photographer experimenting with AI“ zeigt, wie die Werkstatt einer Bild-KI aussehen könnte und mir zeigt das, was in für uns als visuelle Storyteller alles möglich sein wird.

Quelle: https://www.instagram.com/bonnietsang/

Du sprachst vorhin schon von Karikatur, wie gut werden denn Illustrationen mit Hilfe von künstlicher Intelligenz?

Ich sehe tatsächlich die Illustration noch deutlich vor der Fotografie, wenn man so will, „bedroht“. Sobald die Abbildungen etwas freier sein dürfen und keinen fotorealistischen Anspruch mehr haben, ist das Ergebnis sehr gut und professionell anwendbar. Illustration in der Werbung war immer ein sehr briefing- und abstimmungsintensives Produkt. Das wird AI deutlich beschleunigen und damit auch günstiger machen. Ich glaube aber, dass wir Illustratoren weiter benötigen. Um diese Bilder zu schaffen, braucht man Vorstellungskraft, muss das Ergebnis kennen, bevor man es sieht und es hilft, sich gut mit Zeichentechniken auszukennen. Vielleicht erleben wir dadurch sogar ein Revival illustrierter Kampagnen, so wie es sie bis in die 60er gab. Das fände ich großartig!

Gibt es denn schon Beispiel für Kampagnen, die AI sinnvoll einsetzen, also nicht nur um zu sagen, seht her, wir haben eine AI-Kampagne?

Ja, die Antwort lautet: Mit Ketchup und Wein. Oder ausführlicher: Sehr schnell bekannt geworden ist die Kampagne „The Fine Art of Drinking“ des Weinguts Al Mulinetto. Hier sehen wir, was Illustration richtig angewandt leisten kann. Und auch der Heinz-Ketchup Spot ist aus meiner Sicht sehr gelungen. Die Idee, frag eine KI nach Ketchup und sie zeichnet dir immer eine Heinz-Flasche, greift das Thema superkreativ auf. Das dürfte aber in einem halben Jahr nicht mehr funktionieren, weil wir uns dann an den Einsatz von AI gewöhnt haben dürften. Heute schreibt ja auch kein Mensch mehr „ohne Photoshop“ oder „digital fotografiert“ zu einem Bild.

Und auch im redaktionellen Einsatz habe ich ein gutes Beispiel gesehen. Der Stern hat seine Strecke über künstliche Intelligenz mit AI-Illustrationen bebildert, die sehr gut funktioniert haben.

Quelle: https://www.instagram.com/almulinetto/

Und hast Du die KI auch schon in Deiner eigenen professionellen Fotografie genutzt?

Die Antwort ist ein Jein. Als Fotograf bin ich eher bei der Portrait- und People-Fotografie angesiedelt. Und solange Du einen bestimmten Menschen porträtieren willst, macht die KI keinen Sinn. Aber im Bereich Illustration haben wir schon einige Bilder für Kunden erzeugt. Darunter eine 3D-Präsentation für Schuhe und Werkzeugillustrationen. Und gerade arbeiten wir an einer Kampagne für einen Software-Anbieter, in der AI-Illustration eine zentrale Rolle spielen wird.

Wem gehört das Werk eigentlich? Wie sieht es mit den Bildrechten aus?

Leider ein bisher unklares Thema. Das US-amerikanische Urheberrechtsamt hat kürzlich in einer Eilentscheidung entschieden, dass die Werke vorerst überhaupt nicht dem Urheberrecht unterliegen. Also weder den Menschen, die mittels AI ein neues Bild erschaffen hat, noch den Inhabern der AI und auch nicht dem Inhaber der Bildrechte, mit denen die AI trainiert wurde. Aber es laufen eine Reihe von Grundsatzklagen, um hier Rechtssicherheit zu schaffen, unter anderem Getty gegen Stable Diffusion.

Solange wir hier keine Entscheidungen haben, befinden wir uns tatsächlich in einem ungeklärten Raum. Erste Ansätze, die Ergebnisse lizensierbar zu machen gibt es. Zum Beispiel bietet shutterstock einen eigenen Zugriff auf Stable Diffusion und verspricht, das Ergebnis zusammen mit geklärten Rechten verkaufen zu können.

Ich glaube, hier wird sich noch einiges schütteln müssen, also für sehr vorsichtige Agenturen und Kunden wahrscheinlich noch der falsche Moment, um komplett auf AI zu setzen.

Vielen Dank Stefan, für das interessante Gespräch.

Ja, auch DAAAANKE von mir und dazu ein letztes Motiv, unser Agenturlogo. Der Eingabeprompt lautete: For Sale Männchen & „a small cartoon character is shouting in a giant megaphone, stylize, cinematic, white background”

Das For Sale Agenturlogo von der AI interpretiert

Das Interview ist als Gastbeitrag bei kwerfeldein.de erschienen.