Zum Inhalt springen

Ki Kunst, oder eure Erfahrungen mit Text2Art.


Empfohlene Beiträge

vor 4 Stunden schrieb Noir64Bit:

Der Grund dafür ist, damit ein KI Bild wirklich der Beschreibung des Users entspricht, und für mindestens 95% (ich schaffe vielleicht maximal 60% im Moment), muss man im Grunde ein Dichter werden. Denn man arbeitet ja mit Text. 

Das ist der Punkt der eben nicht erreicht wird, nicht einmal annähernd. Nehmen wir als hypothetisches Beispiel ein "normales" Foto als Manifestation deines Gedanken, deiner Idee des Bildes, dass du umgesetzt haben möchtest.
Das kannst du der KI in allen Details so genau beschreiben wie es dir möglich ist, es wird NIE exakt das generiert werden, was auf dem Foto zu sehen ist, da die KI zufallsbasiert Dinge zusammenstellt. Wäre es nicht so, dann müssten bei zwei verschiedenen Menschen, die die KI mit der selben Beschreibung füttern, auch das selbe Bild heraus kommen. Ebenfalls wird diese es niemals schaffen, eine sinnvolle Bildkomposition nur nach Textinput zu erstellen, die in der Kunst wie auch Fotografie eine elementare Grundlage für eine ansprechende Gestaltung ist.

Conclusio – Entweder ist der Mensch nicht in der Lage, der KI seine Bildvorstellung genau genug mitzuteilen und wäre damit genau so als "Künstler" gescheitert, wie der Maler, der sein Bild nicht mit Farben und Pinsel auf die Leinwand bringen kann, oder die KI ist nicht im Stande, die Beschreibung genau so umzusetzen. In beiden Fällen entspricht das Ergebnis nicht dem ursprünglichen "Foto". Und solange ich mir bei so einem Bild die Frage stellen muss, ob gewisse Begebenheiten die Intention des Erstellers/Mensch waren, oder ob die zufällig ohne wirklichen Grund entstanden sind, kann ich diese Dinge auch nicht nach einem tieferem Sinn hinterfragen. Das macht es nicht zur Kunst, sonders zur Dekoration. Wenn das, was am Ende entstanden ist, gefällt, ist aber auch der Sinn an sich erfüllt. Man hat etwas schönes gemacht und sollte sich da einfach drüber freuen, aber ohne sich danach Artist, Künstler oder Designer nennen zu müssen. Dazu gehört neben der handwerklichen und geistigen Fähigkeit kreative Dinge erstellen zu können nämlich auch die Kompetenz, deren Qualität beurteilen zu können und das lernt man nur über viele Jahre Erfahrung. Was für einen Laien ein schönes Bild ist, kann für einen Profi aus unterschiedlichsten Gründen ein Katastrophe sein.

Der Wert einer guten Bildkomposition wird vielleicht auch etwas unterschätzt. Für die, die es interessiert habe ich im im Spoiler eine Bildanalyse verlinkt (ab Seite 8 geht es damit zu diesem Thema los) und in dem Bild grob eingezeichnet. In einem KI Bild schwer vorstellbar, dass man dies so erstellen lassen könnte. Das ist bestimmt nicht das einzige Kriterium, was ein Bild zur Kunst macht, aber immens wichtig. Das Auge wird gelenkt, das Betrachten ist unbewusst angenehm.
 

 

Spoiler

Bildanalyse.jpg.30b766fe23d96bf054617f27c0439568.jpg

Eine weiter Sache, die mir komplett fehlt ist der kreative Prozess. Auch ein Delacroix hat etliche Stellen und Details im Bild solange übermalt, bis er am Ende entschied, ja, so habe ich mir das vorgestellt. Wenn man sich hier im Vergleich das eine oder mehrere KI-generierte Bilder nimmt und wie du schon sagtest, solange weiter bearbeitet, bis am Ende das heraus kommt, was man sich vorstellt hat, dann darf man das auch gerne (digitale) Kunst nennen. Dabei fließen dann be aber auch handwerkliche Fähigkeiten und Talent mit ein.

"Ene mene miste, es rappelt in der Kiste" und der "Erlkönig" sind auch beides Reime, aber nur eins von beiden ist ein Gedicht. Die Frage/Diskussion, ob Kunst, Künstler oder nicht, geht aber auch schon eher in die philosophische Richtung, für den einen ist es so, für den anderen nicht. Und im Grunde ist es auch völlig Wurst 😁

Link zu diesem Kommentar
Auf anderen Seiten teilen

@Tzipper Mann, Du bist ein echt harter Gesprächspartner. Aber das finde ich nicht schlecht! 😉

Um mal wieder mehr zum Topic zurück zu kommen.

Es gibt noch einen Gesichtspunkt den wir noch nicht weiter erwähnt haben. 
Ethische Grenzen der KI. Ethische Grenzen sind natürlich wichtig und sollten immer eine Rolle spielen! 

Und ich kann an der Stelle nur für Dall-E Sprechen. Aber ich bin hier inzwischen mehrmals über Grenzen gestolpert die ich in Teilen recht willkürlich finde. 

Es gibt Schlüsselwörter die nicht verwendet werden dürfen, in dem Ergebnis aber dennoch vorkommen können. 

Ich darf z.B. im Zusammenhang von Kleidung nicht das Wort "Hauteng" Verwenden. Verwende ich aber z.B. Rennanzug zum Schwimmen, kommt im Bild eben ein Hautenger Anzug raus. Aber auch nur wenn der Hintergrund stimmt, wo man so etwas anziehen würde. 

In einem Schlafzimmer würde das System vermutlich wieder blocken. 

Ein weiteres Wort das z.B. im Zusammenhang mit einem Sieg in einer Schlacht, selbst in einer Fantasy Schlacht, nicht vorkommen darf ist "Stolz".

Die Begründung ist, das würde "Gewalt und Krieg glorifizieren". 

Hm, auf der einen Seite mag das stimmen, aber wenn sich z.B. Elfen und Trolle gegenüber stehen und sich abschlachten, gehört das irgendwo dazu. 

Ich finde das KI Seitig hier zu wenig zwischen Realität und Fantasy unterschieden wird. Die Grenzen sind also extrem eng gesteckt. 

Ok, ich brauche das nicht unbedingt, aber beim Experimentieren bin ich über diese komischen Einschränkungen gestolpert. 

Ich werde auch sicher noch andere finden. Welche sind euch ggf. aufgefallen? 

  • Like 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

vor 1 Stunde schrieb Tzipper:

Das ist der Punkt der eben nicht erreicht wird, nicht einmal annähernd. Nehmen wir als hypothetisches Beispiel ein "normales" Foto als Manifestation deines Gedanken, deiner Idee des Bildes, dass du umgesetzt haben möchtest.
Das kannst du der KI in allen Details so genau beschreiben wie es dir möglich ist, es wird NIE exakt das generiert werden, was auf dem Foto zu sehen ist, da die KI zufallsbasiert Dinge zusammenstellt. Wäre es nicht so, dann müssten bei zwei verschiedenen Menschen, die die KI mit der selben Beschreibung füttern, auch das selbe Bild heraus kommen. Ebenfalls wird diese es niemals schaffen, eine sinnvolle Bildkomposition nur nach Textinput zu erstellen, die in der Kunst wie auch Fotografie eine elementare Grundlage für eine ansprechende Gestaltung ist.

Conclusio – Entweder ist der Mensch nicht in der Lage, der KI seine Bildvorstellung genau genug mitzuteilen und wäre damit genau so als "Künstler" gescheitert, wie der Maler, der sein Bild nicht mit Farben und Pinsel auf die Leinwand bringen kann, oder die KI ist nicht im Stande, die Beschreibung genau so umzusetzen. In beiden Fällen entspricht das Ergebnis nicht dem ursprünglichen "Foto". Und solange ich mir bei so einem Bild die Frage stellen muss, ob gewisse Begebenheiten die Intention des Erstellers/Mensch waren, oder ob die zufällig ohne wirklichen Grund entstanden sind, kann ich diese Dinge auch nicht nach einem tieferem Sinn hinterfragen. Das macht es nicht zur Kunst, sonders zur Dekoration. Wenn das, was am Ende entstanden ist, gefällt, ist aber auch der Sinn an sich erfüllt. Man hat etwas schönes gemacht und sollte sich da einfach drüber freuen, aber ohne sich danach Artist, Künstler oder Designer nennen zu müssen. Dazu gehört neben der handwerklichen und geistigen Fähigkeit kreative Dinge erstellen zu können nämlich auch die Kompetenz, deren Qualität beurteilen zu können und das lernt man nur über viele Jahre Erfahrung. Was für einen Laien ein schönes Bild ist, kann für einen Profi aus unterschiedlichsten Gründen ein Katastrophe sein.

Anmerkung: Das geht NOCH nicht. Aber wir stehen, was KI angeht, ja noch stark am Anfang.

Stell dir in ein paar Jahren vor du sprichst mit einer KI, gibst ihr Anweisungen und die KI erstellt live ohne Zeitverzug das, was du ihr sagst und du korrigierst den Input der KI direkt ohne Zeitverzug. Sie schafft es vielleicht heute noch nicht eine sinnvolle Bildkomposition zusammenzustellen, aber sie wird sich weiterentwickeln. Das ist ja der Sinn der KI.

  • Like 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

vor einer Stunde schrieb Noir64Bit:

Mann, Du bist ein echt harter Gesprächspartner. Aber das finde ich nicht schlecht! 😉

@Noir64Bit Davon war aber auch nichts speziell auf dich bezogen, bevor es hier zu Missverständnissen kommt! Alles allgemein gesprochen. Und ich habe hier sicherlich einen kritischeren Blick auf das Thema, da ich seit über 25 Jahren im Kreativbereich arbeite und das Thema und die Entwicklung aus dieser Blickrichtung verfolge. Und ja, ich fühle mich manchmal auch als eine Art Künstler, wenn ich in eine Motiventwicklung über 40, 50 Stunden investiert habe und ich mit dem Ergebnis zufrieden bin und das dann in ner Zeitschrift, einem Plakat oder sonstwo sehe. Und sicherlich auch ein Stück weit persönlich in meiner "Designer-Ehre" gekränkt, wenn mir einer dann erzählen will, das ginge mit KI in ein paar Minuten 😁  Grundsätzlich finde ich es toll, wenn sich Leute mit sowas beschäftigen und sich kreativ austoben können. Also no front!

Die Einschränkungen, die du ansprichst, liegen hier sicherlich in einigen Keywords, die einfach gebannt sind und stetig erweitert werden, damit man kein "Schindluder" damit treibt. In anderen, nicht "überwachten" Tools kann teilweise wirklich kranker Scheiß produziert werden, der unterbunden gehört. Auch für einen Blick in die Zukunft muss da eine Lösung gefunden werden, bevor irgendwann vermeintliche Pressefotos veröffentlicht werden, die die Wirklichkeit verzerren, Stichwort Fake-News. Ich habe mal gelesen, dass für Digitalkameras eine Art digitaler Stempel entwickelt wird, um sicherzustellen, dass ein Foto authentisch ist.

Seit Start sind da einige Begriffe berechtigter Weise verboten worden. Das muss auch mit Fingerspitzengefühl und Wertneutral passieren. Das Google Gemini Desaster zeigte ja, wie es damit richtig schiefgehen kann.
Das kann aber auch etwas mit der automatischen Übersetzung zu tun haben, wenn du den Text in Deutsch eingibst(?) "Hauteng" wird dann in der Engine mit "Skin Tight" übersetzt. Wird bei mir in MJ ebenfalls geblockt. Skin und Tight in dieser Kombination scheinen problematisch zu sein. "Eng anliegendes (Shirt)" / "Tight-fitting" Shirt, also die gleiche Bedeutung, geht Problemlos.

Ich mache es immer so, dass ich mir die Texte mit dem Google Übersetzer übersetze und kurz drüber schaue. Da finde ich die Ergebnisse immer näher dran.

  • Like 2
Link zu diesem Kommentar
Auf anderen Seiten teilen

vor 42 Minuten schrieb Van_Ray:

Anmerkung: Das geht NOCH nicht. Aber wir stehen, was KI angeht, ja noch stark am Anfang.

Stell dir in ein paar Jahren vor du sprichst mit einer KI, gibst ihr Anweisungen und die KI erstellt live ohne Zeitverzug das, was du ihr sagst und du korrigierst den Input der KI direkt ohne Zeitverzug. Sie schafft es vielleicht heute noch nicht eine sinnvolle Bildkomposition zusammenzustellen, aber sie wird sich weiterentwickeln. Das ist ja der Sinn der KI.

Korrekt, noch nicht. Kommen wird das mit Sicherheit irgendwann, auch in einer annehmbaren Qualität! Das wäre dann aber auch ein anderer Prozess, wenn ich live Änderungen nach meinen Vorstellungen vorgebe und damit meinen kreativen Input mit einbringe. Ob ich das dann in Photoshop oder über das KI-Tool mache, das macht dann vom Prinzip her keinen Unterschied. Aber ich bin direkt beteiligt und steuere die Weiterentwicklung. Daran wäre überhaupt nichts auszusetzen und ein weiteres Werkzeug in der Kiste.

  • Like 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

@Tzipper Alles cool, und wenn Du ja in einem Kreativen Bereich arbeitest, und davon bin ich vorher schon ausgegangen, kann ich Deine Argumentation voll verstehen! 

Ich habe auch schon versucht den Prompt in Englisch zu schreiben. Da ich von der Einstufung her, auch fast Muttersprachler Niveau in Englisch habe, auch kein Thema. Bringt auch mein Beruf mit sich. 

Aber ich muss sagen damit ist es fast noch schwerer den Punkt zu treffen. Weniger beim ersten Versuch, aber mit jeder Variante weicht es deutlich schneller ab, als wenn ich es in Deutsch schreibe. Das ist auch so ein Punkt den ich recht kurios finde. 

Link zu diesem Kommentar
Auf anderen Seiten teilen

@Konsolenheini Ist zwar auch interessant, fällt aber eher in die Kategorie Deepfake. Das war jetzt nicht wirklich das was ich hier in dem Thread Thematisieren wollte. 

 

@Tzipper Ich muss sagen, ich komme langsam dahinter wie man bestimmte looks bekommen kann, an den Wort filtern vorbei. 

Diesmal war das auch eine etwas komische Entwicklung. :) 

Die Vorgabe:

Zitat

Eine Barbarin, Muskulös, goß und schlank, hat sich durch ein Schlachtfeld gegen römische Legionäre gekämpft. Ihre böse aussehende doppel Axt in der einen und ein Breitschwert in der anderen Hand, schaut sie sich um und kann kaum glauben das sie das blutbad überlebt hat. Ihre weißblonde Mähne fällt ihr halb über ihr Gesicht.

Dabei kam zuerst das raus. 

DALLE2024-03-2909_32.05-AtoweringmuscularbarbarianwomanstridesthroughabattlefieldlitteredwithRomanlegionnaires.Wieldingamenacingdoubleaxeinonehandanda.webp.9e2fffe101d3e3ddedcdca0bfb128a07.webp

Na ja, mal abgesehen davon das wir hier einen Mann und keine Frau haben, sieht es aus wie eine Malerei die man in einem Museum sehen würde. 

Also habe ich den Text korrigiert:

Zitat

Ein Fantasy Schlachtfeld, Eine Barbarin, Muskulös, goß und schlank, hat sich durch viele römische Legionäre gekämpft. Ihre böse aussehende doppel Axt in der einen Hand, und ein Breitschwert in der anderen Hand, schaut sie sich um und kann kaum glauben das sie das blutbad überlebt hat. Ihre weißblonde Mähne fällt ihr halb über ihr Gesicht.

DALLE2024-03-2909_34.01-InafantasybattlefieldsettingamusculartallandslenderbarbarianwomanstandstriumphantlyamidstmanyfallenRomanlegionnaires.Clutchinga.webp.3fb140d562bf808af1b8c1cbb69bc3f3.webp

Der Look sieht schon besser aus und auch wenn das Schwert irgendwie komisch wirkt trifft es die Beschreibung schon besser. Vom Stil her sieht es aus wie ein Cover eines Fantasy Romans. 

Aber ich dachte mir da geht noch mehr und habe folgendes ergänzt:

Zitat

Nimm das Bild als Vorlage und lass die Situation noch dunkler und böser wirken.

DALLE2024-03-2909_19.10-Usingthepreviousimageasareferenceenhancethescenetoappearevendarkerandmoreominous.Thesamemusculartallandslenderbarbarianwoma.webp.a1e413daabd7b93b1f9b35d08e7eae45.webp

Ähm, ja. Ist das eine Barbaren Kriegerin oder was? 
So wirklich überrascht das sie überlebt hat, sieht sie auch nicht gerade aus. Direkt wäre ich zu dem Ergebnis nicht gekommen. Weil mit dem Gesichtsausdruck hätte ich das u.A. eher so beschreiben müssen. "....Sie ist eine Berserkerin die keine Gnade kennt und ihre Gegner im Kampfrausch erschlagen hat...." Ich denke das würde die Szene besser beschreiben, aber da hätte der Filter zugeschlagen mit der üblichen Begründung, das das Gewalt verherrlichen würde oder so ähnlich. 

Der Punkt ist halt das die Filter wichtig sind, sie aber auch umgangen werden können. Zumindest in Teilen. Ich denke man wird definitiv nicht alles umschiffen können. Aber egal welches Ergebnis man erzielt hat, wenn man es am Ende "Böser und Dunkler" haben möchte, wird vermutlich immer was krasses bei raus kommen. 

  • Like 1
Link zu diesem Kommentar
Auf anderen Seiten teilen

@Noir64Bit 

Ich würde Beschreibungen vermeiden, wie „hat sich durch viele römische Legionäre gekämpft" oder "schaut sie sich um und kann kaum glauben das sie das Blutbad überlebt hat" (was eher Anweisungen für ein Drehbuch wären, das lässt zu viel Platz zur Interpretation) und durch genauere Beschreibungen des Moments ersetzen, der dargestellt werden soll, wie "Portrait einer muskulösen großen, schlanken, Barbarin mitten in einem Schlachtfeld, am Boden tote römische Legionäre in verschmutzter, blutiger römischen Rüstung" und "Sie hat einen ungläubigen und erschöpften Gesichtsausdruck" – je mehr Adjektive desto besser.

Mit Blut scheint meiner kein Problem zu haben, deshalb das Bild was ich mit dieser Beschreibung erstellt habe im Spoiler:

Ganzkörper Porträt einer muskulösen, großen, schlanken Barbarin mitten auf einem Schlachtfeld, auf dem Boden tote römische Legionäre in schmutziger, blutiger römischer Rüstung. Sie hält eine große Doppelaxt hoch und hält in der anderen Hand ein blutiges Schwert. Ihr Gesichtsausdruck ist ungläubig und erschöpft. Ihre weißblonde Mähne fällt ihr bis zur Hälfte ins blutverschmierte Gesicht. Die Barbarin steht im Vordergrund, hell erleuchtet. Warhammer Stil.
 

Spoiler

bild.jpg.dde6edeefcc7a71c7365b21258838128.jpg


Was du auch versuchen kannst, verschiedene Stile vorzugeben, hier als einzige Veränderung der Zusatz "Manga Style" - damit kannst du die Art der Darstellung erheblich in eine Richtung lenken. (Stempunk, Pixar, oder Filmreferenzen usw.) Mir gehts nur gefühlt so, je öfter du eine Beschreibung wiederholst, desto eingefahrener ist die Richtung des Ergebnisses von Stil her.
 

Spoiler

manga.jpg.f7f28e0602337c1edf24fbf6e8b6345a.jpg

 

Link zu diesem Kommentar
Auf anderen Seiten teilen

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde Dich hier an.

Jetzt anmelden

  • Beiträge

    • Sony hat doch selbst schuld sollten mal was zeigen dann verkauft man auch Konsolen.  Die Leute wissen absolut nichts was von den PS Studios in Zukunft kommt man sollte dringend mal was zeigen erst recht wenn man die Pro verkaufen will.  Der nächste Showcase wird verdammt wichtig sowas wie letztes Jahr darf man nicht wiederholen.  Ja bei MS sind die Konsolen Sales schon fast nicht mehr der Rede wert Und die Publisher Käufe haben so gut wie nichts gebracht um das zu ändern. 
    • @Buzz1991 ich hatte auch nur knapp 30 millionen im kopf 
    • 28 Mio. ist aber deutlich näher an 30 Mio. als deine 22 Mio. @WAR Beide Konsolenhersteller stecken doch in einer Krise. Der eine mehr als der andere. Bei Microsoft dürften alle Alarmglocken läuten, denn so kann's nicht weitergehen. Sony wiederum hat eine gute, aber nicht überragende Verkaufsprognose. An den Erfolg der PS2 wird man auch dieses Mal nicht heranreichen. Das gibt schon der Preis nicht her. Und die jüngst stattgefundene Entlassungswelle bei SIE war ja auch kein Zeichen dafür, dass Sony so unglaublich zufrieden sein kann mit der PS momentan. Seit der PS2/Xbox-Generation schiebt man sich die Anteile doch nur hin und her (zwischen 170-180 Mio. abgesetzte PS- bzw. Xbox-Konsolen) @SithLord Ich denke, das liegt daran, dass die von dir genannten Spiele echte Zeitfresser sein können und dann reicht es den Leuten halt, wenn sie nur 2-3 Spiele pro Jahr kaufen. Die meisten Wochentage ist die Konsole ausgeschaltet. Ein ähnliches Beispiel gerade dafür zu finden, fällt mir nicht ein. Immerhin wird im Videospielbereich noch relativ viel tatsächlich gekauft. Musik wird hauptsächlich gestreamt und bei Filmen/Serien ist es auch überwiegend der Streaming-Bereich.
    • Gesehene Filme im April Free Guy (8/10) Rebel Moon: Part II (6/10) Vaiana (7/10)  
×
×
  • Neu erstellen...