DALL-E mini ist ein Versuch, die Bilderzeugungs-KI DALL-E mit einem Open-Source-Modell zu reproduzieren.
Kannst du dich noch an meinen Blogbeitrag über "neuronale Netzwerke, die nach Satzvorgabe eigenständige Geschichten schreiben und illustrieren" erinnern? Sicher kannst du das [hier ist der Link] . Künstliche Intelligenz ist latent in unserem Leben vorhanden und entwickelt sich aktuell mit einer gefühlt rasenden Geschwindigkeit weiter. Gerade erst hat Google einen seiner Forscher beurlaubt, weil dieser der Sprach-KI von Google ein Bewusstsein zusprechen wollte. Das klingt nach Zukunftsromanen und Sci-Fi-Filmen, ist aber schon real - also, bis auf das Bewusstsein. Der Output stammt nicht durch eigenständiges Denken, sondern durch Algorithmen, welche aus zuvor zugefügten Daten und Begebenheiten berechnet werden.Besinnen wir uns also an diese Geschichtsschreib-KI und die passenden Illustrationen, so haben wir bei den Bildern die KI Dall-E im Kopf, welche aus Sätzen Bilder zaubern kann. Schreibe ich "Villa on a pink Lake", so überrascht mich der Output der Mini-Variante von DALL-E als Webprojekt mit den passenden Bildern, welche durch ein neuronales Netzwerk erzeugt wurden.
Der große Bruder dieses kleinen Proof-of-Concepts kann dann in einer sehr überzeugenden Qualität aus einer Beschreibung in natürlicher Sprache realistische Bilder und Kunstwerke erstellen. DALL-E 2 wird damit sicher als KI-System einige Illustratoren arbeitslos machen. Fluch und Segen liegen wie immer dicht beieinander.
Boris Daymas kleines Projekt auf Basis dieser KI, befindet sich als kleine anwendbare WebApp auf Hugging Face, einem AI Netzwerk. Das Open-Source-Projekt kann schon beeindrucken und zeigt, wie der Hase läuft. Ethische Fragen mal außen vor gelassen, denn natürlich kann so eine KI gesellschaftliche Vorurteile verstärken oder verschlimmern. Das Ausmaß und die Art der Vorurteile des DALL-E-Minimodells müssen daher noch vollständig dokumentiert werden. Da das Modell auf ungefilterten Daten aus dem Internet trainiert wurde, kann es Bilder erzeugen, die Stereotypen gegen Minderheitengruppen enthalten. Die Arbeiten zur Analyse der Art und des Ausmaßes dieser Einschränkungen sind noch im Gange und werden in der DALL-E-Mini-Modellkarte daher vom Entwickler ausführlicher dokumentiert.
Boris Daymas kleines Projekt auf Basis dieser KI, befindet sich als kleine anwendbare WebApp auf Hugging Face, einem AI Netzwerk. Das Open-Source-Projekt kann schon beeindrucken und zeigt, wie der Hase läuft. Ethische Fragen mal außen vor gelassen, denn natürlich kann so eine KI gesellschaftliche Vorurteile verstärken oder verschlimmern. Das Ausmaß und die Art der Vorurteile des DALL-E-Minimodells müssen daher noch vollständig dokumentiert werden. Da das Modell auf ungefilterten Daten aus dem Internet trainiert wurde, kann es Bilder erzeugen, die Stereotypen gegen Minderheitengruppen enthalten. Die Arbeiten zur Analyse der Art und des Ausmaßes dieser Einschränkungen sind noch im Gange und werden in der DALL-E-Mini-Modellkarte daher vom Entwickler ausführlicher dokumentiert.
Hier ein kurzer Podcast aus der SWR-Kulturmedienschau zum Thema:
Im Moment ist der große Bruder Dall-E 2 noch nicht für die Öffentlichkeit zugänglich, aber man kann sich in einer Warteliste eintragen. Die Entwickler von OpenAI setzten sich noch mit den potenziellen Risiken des Missbrauchs auseinander, so wie es auch Googler mit der KI-Plattform Imagen macht. Daher sind diese Plattformen noch nicht für die Öffentlichkeit freigegeben. Aus gutem Grund, denn diese Bildgeneratoren sind stark und können nahezu realistische Bilder erzeugen.
In beiden Fällen haben die Unternehmen Forscher und Künstler eingestellt, um die Programme zu testen, den Betrieb und die Trainingsdaten zu verbessern, die Sicherheit zu gewährleisten und die Kunst zu verbessern. Beim DALL-E mini Projekt ist die Qualität des Outputs noch gering und man kann direkt erkennen, dass es sich um KI-generierte Bilder handelt. Aber der Weg geht in Richtung Deepfake und daher muss man überaus vorsichtig mit einer, wenn auch genialen Technik, sein.
Wenn du jetzt die KI auch mal ausprobieren magst, dann schreibe deine Textanweisungen in englischer Sprache in die DALL-E mini Zeile und drücke auf RUN. Es dauert einen kleinen Augenblick bis alle Daten eingesammelt werden und die Umsetzung wird dir dann in 9 verschiedenen Platten angezeigt. Eine Reproduktion des gleichen Outputs ist natürlich nie wieder möglich. Also kannst du dir deine Ergebnisse screenshotten.
huggingface.co/spaces/dalle-mini/dalle-mini