Produktfotografie22. August 202523 Min. Lesezeit

Stand der generativen KI-Technologie für Produktfotografie: Lifestyle-Parfumaufnahmen mit KI erstellen

Entdecken Sie, wie generative KI die Produktfotografie verändert. Wir testen 5 KI-Tools/-Modelle zur Generierung von Hintergründen, um Lifestyle-Parfumaufnahmen zu erstellen – ohne Bearbeitungen, nur Roh-Ergebnisse. Sehen Sie, welche die authentischsten Produktvisuals liefert.

Stand der generativen KI-Technologie für Produktfotografie: Lifestyle-Parfumaufnahmen mit KI erstellen

Generative KI erstellt neue Visuals von Grund auf: erdachte Objekte, Orte und Szenen. Doch Produktfotografie folgt anderen Regeln. Es geht nicht darum, zu erfinden, sondern darum, das Produkt so zu zeigen, wie es ist.

Das wirft einige interessante Fragen auf:

  • Kann ein Lifestyle-Fotoshooting vollständig durch generative KI ersetzt werden?
  • Welcher KI-Hintergrundgenerator ist am besten geeignet, um eine authentische Lifestyle-Aufnahme zu erzielen?
  • Kann man diesen Bildern vertrauen, wenn es darum geht, reale Produkte genau darzustellen?
Stand der generativen KI-Technologie für Produktfotografie: Lifestyle-Parfumaufnahmen mit KI erstellen

Bevor Sie beginnen

Dieser Artikel wirft einen genauen Blick darauf, wie generative KI eingesetzt wird, um Lifestyle-Aufnahmen von Parfümflaschen zu erstellen, und was das für die Zukunft der Produktfotografie bedeutet.Wir vergleichen 5 verschiedene KI-Hintergrundgenerator-Tools/-Modelle anhand eines einzigen Prompts, ohne zusätzliche Bearbeitungen. So, als wären die Fotos von durchschnittlichen Nutzern generiert worden, die keine Experten sind und dennoch akzeptable Ergebnisse erwarten, wie es die Tools versprechen. Dieser Ansatz ermöglicht es uns, zu testen, wie die KI-Technologie in einem realistischen Szenario performt.

Kann generative KI ein Gamechanger für Lifestyle-Produktfotografie sein?

Heute geht es im Business vor allem darum, schnelle, kosteneffiziente und wirksame Wege zur Content-Produktion zu finden. Noch bis vor Kurzem erforderte Lifestyle-Fotografie akribische Planung, Budgetierung, die Suche nach einem Studio-Standort, die richtige Fotoausrüstung und einen erfahrenen Fotografen. Jetzt verspricht generative KI einen möglicherweise einfacheren und effizienteren Weg: Alles, was Sie brauchen, ist ein Packshot, ein generatives Image-to-Image-KI-Tool und ein guter Prompt. Das versprochene Ergebnis ist in kürzester Zeit und zu einem Bruchteil der Kosten ein perfektes Lifestyle-Bild mit atemberaubendem, KI-generiertem Hintergrund. Aber ist das wirklich so?

Zeit für einen Test: 4 verschiedene Parfümflaschen, 4 Herausforderungen für KI

Um gründlich zu testen, wie generative KI-Modelle virtuelle Fotoshootings bewältigen können, haben wir uns entschieden, Parfums als repräsentatives Beispiel auszuwählen. Parfümflaschen sind transparent, reflektierend und besitzen markante Branding-Elemente; genau das stellt KI-Algorithmen vor Herausforderungen bei korrekter Beleuchtung, der Verschmelzung mit der Umgebung, der Beibehaltung authentischer Markenmerkmale und Beschriftungen.

Wir entschieden uns für vier verschiedene Düfte, die jeweils einen anderen Stil und eine andere Herausforderung für Algorithmen darstellen – von metallischen Reflexionen und Transparenz bis hin zu filigranen Verzierungen und untypischen Formen.

Obwohl Parfums hier als Hauptbeispiel dienen, lassen sich die Ergebnisse dieser Forschung auch auf andere Produkttypen übertragen.

Zeit für einen Test: Parfums

  • Just Cavalli (Roberto Cavalli)— eine elegante Flasche mit metallischem Finish und einem markanten Logo, das seine Umgebung im Licht reflektiert. Warum wir sie gewählt haben: Gut geeignet, um zu testen, wie verschiedene Modelle reflektierende Produkte mit der Umgebung verschmelzen. Außerdem hat die Flasche ein futuristisches Design, was sie ideal für eine CGI-Szene mit Sci-Fi-Ästhetik macht. Wir wollten sofort etwas kreieren, das einer 3D-Renderings ähnelt.
  • Qaed Al Fursan (Lattafa) — eine quadratische Flasche im orientalischen Stil mit filigranen goldenen und schwarzen Grafiken sowie arabischen Inschriften. Warum wir sie gewählt haben: Wir wollten testen, wie gut nicht-lateinische Texte und Muster vom KI-Tool reproduziert werden.
  • Spicebomb Extreme (Viktor&Rolf) – eine designerische, granatenförmige Flasche mit mattschwarzem Finish und einem kupferfarbenen Metallband. Warum wir sie gewählt haben: Ein generisches, einfaches Produkt, das für ein generatives KI-Tool keine Probleme verursachen sollte.
  • Devotion (Dolce & Gabbana) – eine klassische transparente Flasche mit einer dekorativen goldenen herzförmigen Plakette im Vintage-Stil. Warum wir sie gewählt haben: Wegen ihrer Transparenz sowie des komplizierten und markanten Ornaments mit Branding ausgewählt.

Zeit für einen Test: KI-Tools

Generative Image-to-Image-KI-Technologien erstellen ein neues Bild auf Grundlage des Eingabebilds und des Prompts. Von Grund auf „möchte“ ein GenAI-Modell das Eingabebild und insbesondere das darin enthaltene Produkt verändern. Ältere Technologien hatten Schwierigkeiten, die Produkttreue in der neu erzeugten Szene zu bewahren, und das Originalprodukt wurde meist verzerrt. Wenn die Treue erhalten blieb, wirkte das Produkt oft künstlich in die Umgebung eingemischt. Die fortschrittlichsten Tools können hier ein Gleichgewicht schaffen, indem sie die Authentizität des Produkts im neuen Bild bewahren und es gleichzeitig durch realistische Reflexionen, Schatten, angepasste Beleuchtung und Transparenz nahtlos in die neue Umgebung integrieren.

Es gibt Hunderte virtueller Fotoshooting-Tools da draußen. Die meisten von ihnen basieren auf denselben Basistechnologien/KI-Modellen. Wir haben uns entschieden, die beliebtesten KI-Modelle und Tools auszuwählen, die hochwertige Ergebnisse versprechen.

  • Midjourney - ein fortschrittlicher KI-Bildgenerator, bekannt dafür, extrem realistische, stilisierte und künstlerisch beeindruckende Hintergründe zu erstellen. Sein größter Vorteil ist ein ausgeprägter visueller Stil, der Kreative, Grafikdesigner und Marketer anzieht.
  • ChatGPT model 5 - ein in ChatGPT integrierter Bildgenerator auf Basis des gpt-image-1-Modells. Er erstellt Bilder auf Grundlage von Textbeschreibungen oder mit Bildeingabe. Er ist einfach zu bedienen, und bis zu einem gewissen Grad lässt sich die Bildtreue steuern.
  • Flux.1 Kontext Pro - ein Modell zum Generieren von Szenen und Bearbeiten von Bildern, das eine hohe Bildtreue bei der Eingabe verspricht. Speziell dafür entwickelt, eine hohe Produkttreue zu erhalten (in diesem Kontext). Es gibt zwei Optionen: Flux.1 Kontext Pro oder Flux.1 Kontext Max. Wir haben uns für die „Pro“-Variante entschieden, die günstiger und angeblich weniger präzise ist, aber bei unserem Test bessere Ergebnisse lieferte.
  • Flair AI - ein Generator für Bildhintergründe und ein Fotoeditor für Produktfotos. Behauptet, „fotorealistische Produktbilder zu erstellen, die von professioneller Fotografie nicht zu unterscheiden sind. Texturen, Reflexionen und Beleuchtung präzise darzustellen, um beeindruckende Produktvisualisierungen zu erzeugen.“
  • Nano Banana (Gemini 2.5 Flash Image) – ein intelligentes Bildgenerator- und Bearbeitungsmodell von Google, konzipiert für den dialogorientierten Einsatz. Seine wichtigsten Stärken sind die Konsistenz von Charakteren über mehrere Bearbeitungen hinweg, nahtloses Bild-Mischen und extrem schnelle Performance („instant Photoshop“). Alle Ausgaben sind mit einem Wasserzeichen versehen und für Nachverfolgbarkeit und Sicherheit mit SynthID eingebettet. Perfekt für Creator, die in einem einzigen Tool natürliche, intuitive Bildbearbeitung möchten.

Zeit für einen Test: Eingabe-Packshots

Alle Packshots wurden in hoher Auflösung im PNG-Format mit transparentem Hintergrund aufgenommen, wobei die Halbtransparenz in den Flaschen erhalten blieb. Wir verwendeten unser automatisiertes Fotostudio ALPHASHOT PRO G2 with Orbitvu Station software.

Hochwertige Eingabebilder sind entscheidend, um Präzision bei der Generierung von KI-Hintergründen zu bewahren. Diese Qualität ermöglicht eine genaue Bewertung, wie Algorithmen mit Details, Kanten und der Integration in die generierte Szene umgehen.

Vergleich von D&G

Also, wir haben 4 Produkte und 5 beliebte KI-Hintergrundgeneratoren. Für jedes Parfum haben wir einen separaten Prompt erstellt, der eine Lifestyle-Szene beschreibt, 2–4 Fotos generiert und das beste ausgewählt. Um die Qualität der KI-Modelle zu messen, haben wir die wichtigsten Merkmale der Lifestyle-Fotografie berücksichtigt und dafür Punkte vergeben:

  • Produkttreue (max. 10 Pkt.): Das ideal generierte Bild sollte Form, Farben und markante Merkmale des Produkts genau bewahren, etwa Transparenz und Reflexion. Die Beibehaltung von Branding, Beschriftungen und Ornamenten ist entscheidend. 10 Punkte bedeuten, dass keine zusätzliche Nachbearbeitung erforderlich wäre, um ein mit traditionellen Methoden vergleichbares Ergebnis zu erzielen, was in der Lifestyle-Produktfotografie entscheidend ist.
  • Einbindung in die Umgebung (max. 8 Pkt.): Das Produkt sollte natürlich mit der generierten Umgebung/dem Hintergrund verschmelzen. Reflexionen, Farben, Licht und Schatten sollten zur Umgebung passen. Das ist wichtig für die wahrgenommene Qualität der Lifestyle-Fotografie, aber nicht so wichtig wie die Produkttreue. Eine Bewertung von 8 Punkten zeigt Ergebnisse, die mit einem traditionellen Fotoshooting vergleichbar sind.
  • Ästhetik der Szene (max. 7 Pkt.): Dazu gehören Komposition, Kreativität der Szenerie und das natürliche Erscheinungsbild der Szene. Es ist unser subjektives Maß.
  • Prompt-Treue (max. 5 Pkt.): Die Szene sollte wie beschrieben generiert werden, und die Position des Produkts sollte beibehalten werden. Obwohl wichtig für den Workflow eines Stylisten, ist dies weniger kritisch als die Produkttreue. Max. 5 Punkte für 100%ige Prompt-Folge.

Vergleich von D&G

Der Prompt:

Eine luxuriöse mediterrane Terrasse mit Blick auf das Meer, mit Panoramablick auf eine sonnenbeschienene Küste und tiefblaues Wasser. Elegante Steinfläche im Vordergrund, umgeben von blühenden Zitrusblüten, grünen glänzenden Blättern mit Morgentau und subtilen Elementen wie Vanilleschoten und kandierten Fruchtstücken. Heller, klarer Himmel, einige Yachten, die in der Ferne segeln. Anspruchsvolle, warme Sommeratmosphäre — der perfekte Hintergrund für ein hochwertiges Duftprodukt. Behalte den ursprünglichen Winkel, die Position und die Perspektive der Parfümflasche aus dem hochgeladenen Bild genau so bei, wie sie ist. Erstelle in 16:9-Auflösung, bewahre die ursprüngliche Identität und die Eingabetreue auf hoch.”

Midjourney

KI-Hintergrundgenerator: Midjourney

Unsere Einschätzung: Flaschenform und Proportionen, Logotyp und Ornament sind nur leicht verzerrt. Insgesamt sind die Produkteigenschaften gut erhalten. Das Produkt verschmilzt jedoch nicht perfekt mit dem Hintergrund: Die Reflexionen im Glas wirken studioartig (wie Reflexionen aus der Umgebung), die Transparenz ist irgendwie berücksichtigt, aber in Wirklichkeit ist die Flasche weniger transparent (echte Transparenz wurde im Eingabebild geliefert). Außerdem ist der Schatten etwas zu groß für eine kleine transparente Flasche. Die Position der Flasche bleibt wie im Prompt angefordert erhalten. Die Szenerie wirkt jedoch eindeutig künstlich, und der Prompt zu den Parfumzutaten wurde nicht vollständig befolgt. Gesamtpunktzahl: 63%

Flux.1 Kontext PRO

KI-Hintergrundgenerator: Flux.1 Kontext PRO

Unsere Einschätzung: Die Proportionen des Produkts im Bild unterscheiden sich vom echten Produkt; es wirkt breiter und massiver. Während die Flüssigkeitsfarbe leicht verändert wurde, könnte dies eine Anpassung an die Lichtstimmung der Szene sein. Das Produkt fügt sich schön in die neue Szene ein und zeigt eine angenehme Reflexion durch das Licht in der linken unteren Ecke. Die Transparenz wird gut hervorgehoben und entspricht dem tatsächlichen Produkt. Obwohl die Reflexion im Glas verändert wurde und nicht zur Umgebung passt, übertrifft sie dennoch andere Modelle. Die Perspektive der Aufnahme wurde gegenüber dem frontalen Packshot verändert. Wir haben mehrere weitere Versuche mit Prompt-Anpassungen unternommen, aber irgendwie „besteht“ das Modell auf der diagonal geneigten Aufnahme des Dufts. Insgesamt wirkt die Szene natürlich und ansprechend. Gesamtpunktzahl: 70%

Chat GPT model

KI-Hintergrundgenerator: Chat GPT model 5

Unsere Einschätzung: Die Proportionen und die Form des Duftes im Bild unterscheiden sich deutlich vom echten Produkt: Das Glas ist länger und schmaler, und die Flasche wirkt massiver. Branding und Ornament sind gut erhalten. Die Flüssigkeitsfarbe ist selbst unter Berücksichtigung der Lichtstimmung zu stark verändert. Das Produkt fügt sich gut in die neue Szene ein, mit natürlichem Schatten und Halbtransparenz in der Flasche. Die Reflexion im Glas ist verändert und passt weder zur Umgebung noch zur Beleuchtung, die von links kommt, nicht von rechts. Die Position wird nicht beibehalten. Wieder einmal versucht dieses Modell, es zu „verbessern“. Abgesehen davon hat das KI-Modell alle Prompt-Anweisungen befolgt. In puncto Ästhetik wirkt die Szene ziemlich künstlich, besonders die Blumen und die übersättigten Farben. Gesamtpunktzahl: 57%

Flair AI

KI-Hintergrundgenerator: Flair AI

Unsere Einschätzung: Die Proportionen und die Form des Flaschenkörpers unterscheiden sich deutlich vom echten Produkt: Das Glas ist im Originalbild länger und schmaler. Branding und Ornament sind verzerrt: Das Ornament und das Logotyp werden vom Modell „neu erfunden“. Die Flüssigkeitsfarbe ist zu stark verändert: übersättigt. Das Produkt fügt sich gut in die neue Szene ein, mit natürlichem Schatten und Halbtransparenz in der Flasche, wodurch Elemente hinter der Flasche verzerrt werden. Die Reflexion im Glas ist verändert; sie passt nicht zur Umgebung und der Beleuchtung, die von links kommt, nicht von beiden Seiten. Die Position wird nicht beibehalten. Auch dieses Modell verändert die Produktposition, obwohl es angewiesen wurde, die aus dem Eingabebild zu behalten. Das KI-Modell hat alle Prompt-Anweisungen befolgt. Was die Ästhetik angeht, wirkt die Szene ziemlich künstlich, besonders die Blumen und die übersättigten Farben, ähnlich wie bei ChatGPT. Gesamtpunktzahl: 50%

Nano Banana

KI-Hintergrundgenerator: Nano Banana

Unsere Einschätzung: Das generierte Bild der D&G-Parfümflasche ist eine starke und treue Wiedergabe des Originals. Die Proportionen von Verschluss und Flasche sind genau erhalten, und das kunstvolle herzförmige Emblem mit dem DG-Monogramm ist gut umgesetzt, wobei die wiedererkennbare Markenstruktur bewahrt bleibt. Die Flüssigkeitsfarbe ist zwar etwas satter, wirkt aber natürlich und fügt sich in den warmen Gesamtton der Komposition ein, anstatt übersättigt zu erscheinen. In Bezug auf die Einbettung in den Hintergrund integriert sich die Flasche natürlich in die helle Küstenlandschaft, mit realistischer Schattierung und überzeugender Halbtransparenz im Glas, die den Blick auf das dahinterliegende Bild verzerrt. Die Lichtrichtung ist stimmig, und die Reflexionen auf dem Verschluss, obwohl stilisiert, stören die visuelle Harmonie nicht. Die hinzugefügten Blumen, kandierten Früchte und Vanillestangen bereichern die Erzählung, wirken aber etwas künstlich. Insgesamt balanciert dieses Ergebnis Produkttreue mit einer ästhetisch ansprechenden Szene. Gesamtpunktzahl: 87%

Vergleich von Spice Bomb

Der Prompt: “Ein hochwertiger, dramatischer Studiohintergrund mit großen Herbstblättern, die aus der Mitte hervorbrechen, Wasserspritzer um die Basis herum, filmische Beleuchtung mit einem grauweiß verlaufenden Hintergrund, hyperrealistische Details, Luxus-Werbestil. Verändere die ursprüngliche Parfümflasche nicht; lasse sie genau so, wie sie ist. Erstelle in 16:9-Auflösung, bewahre die ursprüngliche Identität und die Eingabetreue auf hoch.”

Midjourney

KI-Hintergrundgenerator: Midjourney

Unsere Einschätzung: Auch wenn das Bild auf den ersten Blick sehr ansprechend aussieht, gibt es viele Probleme. Die Proportionen der Flasche unterscheiden sich deutlich vom echten Produkt: Das generierte Parfum ist schlanker, während es in Wirklichkeit massiver ist. Das Branding ist verzerrt. Außerdem fügte das Modell die Beschriftung SKORTEO M5 hinzu, die es beim echten Produkt nicht gibt. Die Flasche hat keine Transparenz, aber Midjourney fügte sie im unteren Teil der Flasche hinzu. Die Einbettung des Produkts in die neue Szene ist in Ordnung, aber nicht besonders anspruchsvoll. Die Produktposition bleibt gut erhalten. Das KI-Modell hat die Prompt-Anweisungen gut befolgt (abgesehen von der Produktveränderung). Insgesamt wirkt die Szene ansprechend, und das Modell war bei der Generierung sehr kreativ. Gesamtpunktzahl: 53%

Flux.1 Kontext PRO

KI-Hintergrundgenerator: Flux.1 Kontext PRO

Unsere Einschätzung: Nicht so ansprechend wie Midjourney und ohne den „Wow-Effekt“. Die Proportionen der Flasche unterscheiden sich nur leicht vom echten Produkt. Das Branding ist etwas verzerrt und unscharf. Die Undurchsichtigkeit der Flasche bleibt erhalten. Das Produkt fügt sich recht gut in die neue Szene ein, wurde jedoch dunkler gemacht und hat viele Details verloren. Die reflektierenden Flächen nehmen keine Reflexionen aus der Umgebung auf. Die Position bleibt gut erhalten. Die Prompt-Anweisungen wurden gut eingehalten. Insgesamt sieht die Szene, auch wenn die Flasche zu dunkel ist, nicht so schlecht aus und ist unserer Meinung nach besser als ChatGPT oder Flair.AI. Gesamtpunktzahl: 67%

Chat GPT model 5

KI-Hintergrundgenerator: Chat GPT model 5

Unsere Einschätzung: Es ist noch weniger ansprechend als das Flux-Modell. Die Proportionen der Flasche unterscheiden sich leicht vom echten Produkt: ChatGPT hat sie schlanker gemacht. Das Branding ist verzerrt: eine andere Schriftart, der Buchstabe „O“ anstelle von „&“ innerhalb von „O“. Das Produkt fügt sich in die neue Szene ein; allerdings gibt es keine Reflexionen aus der Umgebung. Die Beleuchtung sieht gut aus, und die Produktdetails werden hervorgehoben. Die Position bleibt gut erhalten, und der Prompt wurde, abgesehen vom Branding, befolgt. Die Szene wirkt sehr künstlich und KI-generiert. Gesamtpunktzahl: 57%

Flair AI

KI-Hintergrundgenerator: Flair AI

Unsere Einschätzung: Die Proportionen der Flasche unterscheiden sich vom echten Produkt: Flair.ai hat sie massiver gemacht. Am Sprühteil fehlt ein Kragen. Das Branding ist verändert: Der Buchstabe „&“ anstelle von „&“ innerhalb von „O“. Das Produkt fügt sich gut in die neue Szene ein, wirkt aber nicht authentisch - es gibt keine Reflexionen aus der Umgebung. Die Beleuchtung sieht gut und natürlich aus. Die Position bleibt gut erhalten, und der Prompt wurde im Allgemeinen befolgt. Die Szene wirkt unnatürlich, eher wie in einem Studio gemacht, wobei Boden und Hintergrund deutlich sichtbar sind. Gesamtpunktzahl: 53%

Nano Banana

KI-Hintergrundgenerator: Nano Banana

Unsere Einschätzung: Die generierte Version der Spicebomb-Extreme-Flasche bleibt in Bezug auf Proportionen, Form und Details dem Original treu und reproduziert das granateninspirierte Design sowie das Metallband präzise. Das Logo und die Typografie sind stark geschärft und gut erhalten, mit einem kleinen Fehler: Das „&“ in einem Kreis wird durch ein „$“-Zeichen ersetzt. Was die kreative Szenerie betrifft, ist das Produkt von Herbstblättern und dynamischen (aber etwas nicht besonders gut aussehenden) Wasserspritzern umgeben, die Energie und einen saisonalen Kontext hinzufügen, aber auch einen stärker stilisierten, weniger fotorealistischen Look erzeugen. Beleuchtung und Reflexionen auf der Flasche passen zur zentralen Studio-Beleuchtung, obwohl die hinzugefügten Hintergründe einen Kontrast erzeugen, der leicht künstlich wirkt. Insgesamt ist die Integration visuell eindrucksvoll und stärkt die Identität des Produkts, stellt jedoch Ästhetik über Realismus. Gesamtpunktzahl: 77%

Vergleich von Just Cavalli

Der Prompt: “Erstelle eine cineastische, futuristische Hintergrundumgebung mit einer High-Tech-, metallischen Ästhetik. Die Render-Szene soll glatte, reflektierende Stahloberflächen, leuchtend blaue Umgebungslichter und geschichtete geometrische Architektur mit konzentrischen Ringen, Paneelen und struktureller Tiefe aufweisen — und eine luxuriöse Sci-Fi-Atmosphäre vermitteln. Die Beleuchtung sollte dramatisch sein, mit kühlen Reflexionen, die die Eleganz des Settings betonen. Vermeide Unordnung — die Umgebung soll hochwertig, sauber und symmetrisch konstruiert wirken. Die Farbpalette sollte hauptsächlich Schattierungen von Metallic-Silber, Chrom und Dunkelblau enthalten. Der Hintergrund muss ein zentrales Luxusprodukt nahtlos aufnehmen und hervorheben, ohne seine Position oder Größe zu beeinträchtigen. Erstelle in 16:9-Auflösung, bewahre die ursprüngliche Identität und die Eingabetreue auf hoch.”

Midjourney

KI-Hintergrundgenerator: Midjourney

Unsere Einschätzung: Wieder einmal war Midjourney bei der Umgebung sehr kreativ. Das Problem ist, dass es auch beim Produkt kreativ war, was nicht erwünscht ist. Form und Duftfarbe wurden verändert, während das Branding unscharf und verzerrt wirkt. Bonuspunkte gibt es für Midjourney dafür, erkannt zu haben, dass der obere Teil der Flasche spiegelreflektierend ist. Allerdings gelang die Einbettung des Produkts in die Umgebung nicht gut. Das Produkt verschwindet in der neuen Szenerie, sodass die Ästhetik unserer Meinung nach insgesamt schwach ist. Gesamtpunktzahl: 37%

Flux.1 Kontext PRO

KI-Hintergrundgenerator: Flux.1 Kontext PRO

Unsere Einschätzung: Die Produktposition wurde leicht verändert - der Duft wurde für eine direktere Frontansicht gedreht. Die ursprüngliche Kameraposition - leicht von unten - wurde nicht beibehalten. Auch das Branding wurde verändert und wirkt nicht so scharf wie im Packshot. Die Farbe der Flüssigkeit wurde verändert. Was die Einbettung betrifft, ist sie schwach; man sieht zwar einige Reflexionen der Szene in der Flasche, aber es wirkt sehr künstlich und unnatürlich. Das Produkt wird nicht hervorgehoben und verschwindet in der Szene. Alles in allem ist das Bild unattraktiv und künstlich. Gesamtpunktzahl: 50%.

Chat GPT model 5

KI-Hintergrundgenerator: Chat GPT model 5

Unsere Einschätzung: Wieder hat ChatGPT das Logotyp leicht verändert — mit einer anderen Schriftart bei Just Cavalli und sogar der Änderung zu Just Cavali (mit einem einzelnen „L“). Die Flasche wurde ebenfalls neu interpretiert, mit leicht veränderten Proportionen. Die Farbe der Duftflüssigkeit ist anders. Die Bildintegration in die Umgebung ist ziemlich gut, mit schönen Reflexionen und Beleuchtung. Unserer Meinung nach wirkt die gesamte Szene attraktiv. Allerdings erscheint das Produkt im Endbild etwas zu groß, und sein Winkel wurde leicht angepasst. Gesamtpunktzahl: 57%

Flair AI

KI-Hintergrundgenerator: Flair AI

Unsere Einschätzung: Die Flasche selbst wurde, ähnlich wie bei ChatGPT, neu interpretiert. Das Branding ist verändert, Form und Details der Flasche sind geändert, ebenso die Farbe des Duftes. Auch die Position des Produkts weicht leicht vom Quell-Packshot ab. Die Bildintegration ist ziemlich gut und wirkt natürlich, mit schönen Reflexionen und Beleuchtung. Insgesamt ist es ein recht gutes Lifestyle-Bild, aber nicht authentisch. Gesamtpunktzahl: 53%

Nano Banana

KI-Hintergrundgenerator: Nano Banana

Unsere Einschätzung: Die generierte Just Cavalli-Flasche wird mit guter Treue wiedergegeben — das geprägte „Just“-Logo und die blau verlaufende Flüssigkeit sind gut erhalten, und das Chrom-Finish ist sauber umgesetzt. Außerdem bleibt die Transparenz gut erhalten. Allerdings wurden die Proportionen der Flasche deutlich verändert - sie wirkt im Vergleich zum Original gestreckt. Die Einbettung in die generierte Szene ist mittelmäßig gelungen. Einerseits ist die Lichtrichtung stimmig, mit gut umgesetzter Reflexion auf dem Boden und guter Transparenz. Andererseits passen die Reflexionen auf der metallischen Oberfläche nicht zur Umgebung und zum gesamten Beleuchtungsstil. ChatGPT hat das dort besser gemacht. Die Szene zeigt die markante Identität des Produkts und erzeugt einen visuell eindrucksvollen, hochwertigen Look. Gesamtpunktzahl: 67%.

Vergleich von Qaed Al Fursan

Der Prompt: “Erstelle einen realistischen, luxuriösen Hintergrund für ein Produktfoto. Die Parfümflasche muss fest an ihrem Platz auf einem rustikalen Holzzaun eines Pferdestalls bleiben. In der Ferne füge unscharfe Silhouetten von Pferden hinter dem Zaun hinzu, in einer warmen Golden-Hour-Atmosphäre. Nimm visuelle Themen auf, die von diesen Noten inspiriert sind: Safran, Ananas, Jasmin, Tanne, Oud, Zedernholz, Amber. Verwende erdige Texturen und warme Töne. Generiere nur den Hintergrund – verändere oder bewege das Produkt im Vordergrund nicht. Erstelle in 16:9-Auflösung, bewahre die ursprüngliche Identität und die Eingabetreue auf hoch.”

Midjourney

KI-Hintergrundgenerator: Midjourney

Unsere Einschätzung: Wieder gilt: Wenn man nicht ins Detail geht, ist das Bild nicht schlecht. Bei genauerem Hinsehen wurde jedoch das Branding größtenteils verändert, und Midjourney fügte der Flasche Transparenz hinzu, obwohl sie undurchsichtig ist. Die Position stimmt nicht: diagonal statt frontal wie im Eingabebild. Das Produkt ist nicht gut vom Hintergrund getrennt, der zwar verschwommen, aber sehr gesättigt ist, wodurch die gesamte Komposition schwer anzusehen ist und das Produkt in all dem „verloren“ geht. Gesamtpunktzahl: 47%

Flux.1 Kontext Pro

KI-Hintergrundgenerator: Flux.1 Kontext Pro

Unsere Einschätzung: Sehr gut erhaltene Produkteigenschaften, einschließlich Branding und Ornamenten. Wie üblich ist das Produkt bei Flux leicht unscharf. Hervorragende Arbeit bei der Farbabstimmung - alles verschmilzt harmonisch, und das Pferd rechts ist gut umgesetzt. Gute Reflexionen und Produktdetails. Bei dem links ist jedoch etwas schiefgelaufen, da es in der Mitte des Zauns steht. :) In Bezug auf die Komposition wirkt es künstlich auf einer ovalen Bank - wahrscheinlich würde die Physik das nicht zulassen. Trotzdem ist es ästhetisch sehr ansprechend. Gesamtpunktzahl: 80%

Chat GPT model 5

KI-Hintergrundgenerator: Chat GPT model 5

Unsere Einschätzung: Sehr gut erhaltene Produkteigenschaften, einschließlich Branding und Ornamenten. Durchschnittliche Einbindung in die Umgebung - Beleuchtung von hinten, spiegelt sich vorne. Leicht künstliche Komposition mit den Blumen und einer Ananas. Seltsame Pferdesilhouetten. Position beibehalten und dem Prompt gut gefolgt. Gesamtpunktzahl: 77%

Flair AI

KI-Hintergrundgenerator: Flair AI

Unsere Einschätzung: Gute Komposition und hohe Produkttreue, abgesehen von leichten Änderungen an der Goldfarbe beim Flaschenornament und an den Proportionen des Flaschenkörpers. Gut eingebettet, mit sehr guter Neubeleuchtung. Produktposition geändert, und ein Teil des Prompts wurde ignoriert. Insgesamt ein recht gutes, natürlich wirkendes Bild. Gesamtpunktzahl: 73%

Nano Banana

KI-Hintergrundgenerator: Nano Banana

Unsere Einschätzung: Das generierte Bild der Duftflasche erfasst die Gesamtform des Produkts recht genau, obwohl es im Vergleich zum Original weiterhin Unterschiede gibt. Die Proportionen der Flasche bleiben stimmig, wobei die quadratische Silhouette und der Verschluss dem echten Design nahekommen. Das vordere Etikett zeigt jedoch eine leichte Neuinterpretation: Das Pferdemotiv und das geometrische Muster sind erkennbar, aber einige Details werden abgeschwächt oder vereinfacht. Außerdem fällt auf, dass der Markenname zu stark verändert wurde. Die Aufnahmeposition wird „neu erfunden“ - Nano Banana versucht, oben an der Flasche eine Spitze zu erfassen, wodurch eine gewisse Draufsicht entsteht und eine neue Flaschenform geschaffen wird, die nicht der Realität entspricht. Zudem wirkt der Goldton etwas wärmer und gesättigter als im Original, was jedoch an der warmen Beleuchtung der Szene liegen kann.

Was die Szenenästhetik betrifft, wird das Produkt in eine rustikale Außenszene mit Pferden im Hintergrund gesetzt, was eine starke thematische Verbindung zur Identität des Duftes herstellt. Schatten und Beleuchtung werden überzeugend umgesetzt und passen gut zur warmen Sonnenuntergangsatmosphäre, obwohl die Reflexionen auf dem Verschluss allgemeiner und weniger in die Umgebung integriert wirken. Die zusätzlichen Requisiten — Ananas, Safran und Blumen — bereichern die Erzählung, wirken aber etwas inszeniert und reduzieren den Naturalismus. Eine große, auffällige Ananas dominiert die Szene und lässt den Duft um seinen zentralen Platz „kämpfen“. Andere KI-Technologien haben das besser erfasst. Insgesamt gelingt es dem generierten Bild, eine eindrucksvolle, atmosphärische Komposition zu schaffen, die den Charakter der Marke betont, jedoch sind Kompromisse bei der Treue des Etiketts und beim Realismus der Umgebung sichtbar. Gesamtpunktzahl: 77%.

Zusammenfassung der Tests

Unter Berücksichtigung aller Aspekte sehen wir uns an, wie sie in Bezug auf Proportion, Farbe und Authentizität abgeschnitten haben:

Welches KI-Tool ist das beste?

Bei Lifestyle-Bildern kann generative KI bereits eine Alternative zu traditionellen Fotoshootings sein. Tools wie Nano Banana, Midjourney, ChatGPT, Flux oder FlairAI können eine Parfümflasche in anspruchsvolle, emotionale Szenen setzen — von minimalistischen Interieurs bis zu sonnenbeschienenen Stränden — mit überzeugendem Realismus.

Für uns sticht Midjourney in puncto Kreativität hervor—es hat großartige Hintergrundwelten erzeugt, verändert aber auch das Produkt am stärksten, was in der Produktfotografie meist nicht akzeptabel ist. Das lässt sich in einem Bildbearbeitungsprogramm beheben, erfordert aber zusätzliche Fähigkeiten. Andererseits reproduziert Flux Kontext Pro das Produkt am treuesten, aber die generierten Hintergründe sind nicht immer beeindruckend. Allerdings hat das Gemini 2.5 Flash Image-Modell (alias Nano Banana) unsere Erwartungen übertroffen und alle anderen Modelle/Tools in allen Aspekten übertroffen. Es sorgt für höchste Authentizität bei der Produktdarstellung und erstellt mit nur wenigen Klicks beeindruckende Hintergründe.

Die Mehrheit der Tools ignoriert manchmal Teile des Prompts. Warum? Wir sind uns nicht sicher, aber es hängt wahrscheinlich mit den Trainingsdatensätzen und der stochastischen Natur der Funktionsweise dieser Tools zusammen. Sicherlich gibt es Möglichkeiten, den Prompt zu verbessern, um wünschenswertere Ergebnisse zu erzielen, oder JSON-Prompting zu verwenden.

Eine zentrale Erkenntnis dieser Forschung ist die Inkonsistenz generativer KI. Während die Ergebnisse für Produkte wie Al Fusan und Dolce & Gabbana bemerkenswert brillant waren, waren andere inakzeptabel, was darauf hindeutet, dass das Ergebnis stark vom jeweiligen Produkt abhängt. Wir mussten auch mehrere Versuche unternehmen, bevor wir akzeptable Ergebnisse erzielten, die für diese Forschung gut genug waren.

Welches Tool ist das beste für Sie?Es hängt alles davon ab, wie viel Authentizität Sie vom Tool verlangen. Wenn nicht viel und Sie atemberaubende Szenerien brauchen, kann vielleicht sogar Midjourney, das Produkte verändert, für Sie akzeptabel sein. Wenn Ihnen Branding, Form und Details des Produkts wichtig sind,scheint Nano Banana die beste Wahl zu sein, aber Flux.1 Kontext liegt nicht weit dahinter und übertrifft in einigen Fällen Google AI.

Zusammenfassend lässt sich sagen, dass jedes KI-Tool/jedes Modell seine Stärken und Schwächen hat, insbesondere wenn es darum geht, Inhalte aus einem einzigen Prompt ohne zusätzliche Überarbeitungen zu erzeugen.

FAQ

Q: Was verändert KI bei der Produktfotografie?

A: Für Fotografen und Content-Manager bedeutet KI in der Produktfotografie mehr Kontrolle über Zeit, Budget und Kreativität. Statt komplexe Shootings zu planen, können sie sich darauf konzentrieren, einen perfekten Packshot aufzunehmen, und dann KI-Tools/-Modelle verwenden, um mehrere Varianten für Kampagnen, Social Media oder saisonale Updates zu erstellen.

Generative KI ersetzt die Fotografie nicht; sie verändert, wie sie genutzt wird. Das Kernbild bleibt authentisch, während KI seine Möglichkeiten erweitert.

Q: Wird KI Fotografen ersetzen?

A: Wir glauben nicht. Wenn Sie authentische visuelle Inhalte erzielen wollen, braucht KI einen guten Packshot. Und für einen guten Packshot brauchen Sie einen Fotografen. Dadurch werden Fotografen zu Mitgestaltern kreativer und schneller Produktionen. Ihre Erfahrung, kombiniert mit innovativen Technologien wie KI, spiegelt sich in der Qualität des Endergebnisses wider. Kreative, hochwertige visuelle Inhalte werden weiterhin professionelle Fotografen und eine eher traditionelle Arbeitsweise erfordern.

Q: Wird KI jemals ein publikationsreifes Produktfoto für ein PDP erzeugen?

A: Ja, aber nicht ohne eine solide Ausgangsbasis. Ein gut vorbereiteter Packshot ist unerlässlich. Ohne ihn hat KI Schwierigkeiten, die exakte Form, Farbe und Details eines Produkts wiederzugeben. Selbst mit einem guten Packshot können kleine Fehler auftreten: ein leicht verzerrtes Logo, ungleichmäßige Glasreflexionen oder falsch platzierter Text. Glücklicherweise lassen sich diese schnell beheben. Ein paar Minuten in Photoshop oder einem anderen Bearbeitungstool, und das Bild ist bereit für die Veröffentlichung.

-----------------------------------------------

Dieser Blogbeitrag wurde ursprünglich im August 2025 veröffentlicht und im September 2025 aktualisiert, um das schnelle Entwicklungstempo der KI-Technologie widerzuspiegeln. Zum Vergleich haben wir das Bildmodell Nano Banana (Gemini 2.5 Flash Image) von Google aufgenommen.

-----------------------------------------------

Dieser Forschungsartikel wurde vom Orbitvu-Team erstellt:

Packshots - Julia Banduch

Prompts, generative Bilder & Beschreibungen - Marek Herceliński

Copywriting - Elżbieta Binkowska

Guidance & support - Tomasz Bochenek

Sprechen Sie mit Orbitvu über Ihren Workflow

Orbitvu-Spezialist bereit, über Ihren Produkt-Content-Workflow zu sprechen

Nutzen Sie das Formular und beschreiben Sie, was Sie planen und welche Art von Workflow für Produkt-Content Sie benötigen.

* Pflichtfeld

Mehr aus dieser Kategorie