Es wäre der absolute Traum jedes HTML-Producers, der Newsletter-Vorlagen erstellt. Denn die Template-Produktion ist unglaublich zeitaufwändig und mühsam. Schuld daran sind die vielen Bugs und Unzulänglichkeiten der Mail-Programme, allen voran Outlook,

Kann man diese Aufgabe also an eine KI auslagern?

Ein aktueller Test von Knak hat genau das untersucht. Drei führende LLMs mussten typische Produktions-Aufgaben lösen, und das Ergebnis war eindeutig: Keines der Modelle lieferte durchgehend produktionsreife Resultate.

 

Was und wie wurde getestet?

Es ging nicht um theoretische Beispiele, sondern um konkrete, praxisnahe Anforderungen aus dem Alltag von E-Mail-Marketing-Teams.

Die Modelle mussten unter anderem komplette HTML-Newsletter erstellen, Layouts strukturieren, responsive Elemente umsetzen und Call-to-Actions korrekt integrieren. Dabei wurde natürlich erwartet, dass die generierten Mails in unterschiedlichen E-Mail-Clients funktionieren.

 

Das zentrale Problem: „Sieht gut aus“ reicht nicht.

Viele der generierten E-Mails bestanden zunächst einen oberflächlichen Test, weil sie im Browser korrekt dargestellt wurden.

Genau hier liegt allerdings ein gravierender Denkfehler, denn E-Mail ist technisch einfach ein völlig anderes Umfeld als das Web.

Unterschiedliche E-Mail-Clients interpretieren HTML und CSS sehr unterschiedlich. Outlook verwendet eine eigene Rendering-Engine, Gmail filtert bestimmte Styles und andere Anbieter ignorieren Teile des Codes vollständig. Das führt dazu, dass eine im Browser funktionierende Mail im Posteingang plötzlich fehlerhaft oder komplett zerstört dargestellt wird.

Genau dieses Problem trat im Test mehrfach auf.

 

Die größten Schwächen der LLMs im Test.

Die Analyse zeigt mehrere wiederkehrende Muster, die für den praktischen Einsatz entscheidend sind.

Rendering-Probleme
Ein großer Teil der generierten E-Mails funktionierte nicht zuverlässig in verschiedenen Clients. Layouts wurden zerschossen, Styles nicht korrekt übernommen oder Inhalte falsch positioniert. Besonders problematisch war, dass einige Clients CSS weitgehend ignorieren, wodurch Mails teilweise komplett „unformatiert“ dargestellt wurden. Damit sind solche Vorlagen für den produktiven Versand nicht geeignet.

Fehlende Compliance
Ein häufig unterschätzter Punkt ist die Einhaltung rechtlicher Anforderungen. In mehreren Fällen fehlten Pflichtangaben oder gesetzliche Vorgaben wurden nicht korrekt berücksichtigt. Gerade im E-Mail-Marketing ist das jedoch kritisch, da Verstöße direkte rechtliche Konsequenzen haben können. Hier zeigt sich deutlich, dass LLMs aktuell kein verlässliches Verständnis für regulatorische Anforderungen haben.

Fehlende Robustheit
Die Modelle lieferten oft Ergebnisse, die auf den ersten Blick korrekt wirkten, sich aber nicht konsistent reproduzieren ließen. Kleine Änderungen im Prompt führten zu deutlich unterschiedlichen Resultaten, und selbst ähnliche Aufgaben wurden nicht immer gleich gelöst. Für produktive Prozesse ist diese fehlende Verlässlichkeit ein zentrales Problem.

Unzureichendes Verständnis für E-Mail-spezifische Anforderungen
Zwar beherrschen LLMs grundsätzlich HTML, allerdings gelten im E-Mail-Bereich eigene Regeln, die sich stark vom klassischen Web unterscheiden. Dazu gehören beispielsweise die Verwendung von Tabellenlayouts statt moderner CSS-Strukturen, Inline-Styles, spezifische Fallbacks für Outlook oder Anpassungen für Dark Mode.

Diese Besonderheiten wurden von den Modellen häufig nur teilweise oder fehlerhaft berücksichtigt, was die Praxistauglichkeit zusätzlich einschränkt.

 

Warum das Ergebnis nicht überrascht

Bei genauer Betrachtung ist das Ergebnis wenig überraschend, da E-Mail-HTML zu den komplexesten Bereichen in der Frontend-Entwicklung gehört. Die Kombination aus fragmentierten Rendering-Engines, fehlenden Standards und zahlreichen Sonderfällen macht die Umsetzung tatsächlich besonders anspruchsvoll.

Genau diese Art von Detailtiefe und Ausnahmefällen ist aktuell nicht die Stärke von LLMs.

In der Praxis zeigt sich, dass KI besonders dort Mehrwert liefert, wo es um Vorbereitung und Struktur geht. Dazu gehört beispielsweise die Generierung von Layout-Ideen, das Erstellen von Textvarianten für A/B-Tests, die Entwicklung erster Konzepte oder die Unterstützung beim Debugging.

Damit fungiert die KI vor allem als Assistenzsystem, das Prozesse beschleunigt, aber nicht vollständig ersetzt.

Kritisch wird der Einsatz überall dort, wo es auf Stabilität und Genauigkeit ankommt. Dazu zählen produktionsfertige HTML-Templates, komplexe Layouts, die client-übergreifend funktionieren müssen, sowie alle rechtlich relevanten Inhalte. In al diesen Bereichen ist eine sorgfältige manuelle Kontrolle leider weiterhin zwingend erforderlich.

 

Fazit: KI ist ein Werkzeug, kein Ersatz

LLMs entwickeln sich schnell weiter und werden auch im E-Mail-Marketing eine immer größere Rolle spielen.

Aktuell eignen sie sich jedoch vor allem für Entwürfe und vorbereitende Aufgaben, während sie für den direkten Einsatz in produktiven Umgebungen noch nicht ausreichend zuverlässig sind.

Aber wer weiß: Angesichts der rasend schnellen Entwicklungen kann sich das alles sehr bald ändern.

Die DSGVO & E-Mail Marketing in 60 Minuten

Über den Autor

Michael Kornfeld ist mit einer über 25-jährigen Laufbahn ein leidenschaftlicher Verfechter von E-Mail-Marketing. Er hält zahlreiche Seminare und Fachvorträge und zählt zu den renommiertesten Experten Österreichs auf diesem Gebiet.

Michael Kornfeld kontaktieren