Im Wettlauf um die mächtigste Künstliche Intelligenz (KI) rüstet Meta auf und nutzt dafür einen scheinbar unschlagbaren Vorteil: die Bilderflut von Instagram und Facebook.

Wie Metas Produktchef Chris Cox auf dem Bloomberg Tech Summit enthüllte, füttert der Konzern seine Text-zu-Bild-KI namens Emu mit öffentlich zugänglichen Fotos und Texten der Plattformen. „Wir trainieren nicht mit privaten Inhalten oder solchen, die Nutzer mit Freunden teilen, sondern ausschließlich mit öffentlichem Material“, betonte Cox.

Meta trainiert KI-Bilder

Die hohe Qualität der von Emu erzeugten Bilder führt Cox auf die Vielfalt der auf Instagram verfügbaren Fotos zurück, die „Kunst, Mode, Kultur und natürlich auch Menschen“ abbilden. Nutzer können auf Meta AI Bilder generieren lassen, indem sie eine Anfrage mit dem Wort „imagine“ beginnen.

Dass KI-Modelle für ihre Leistungsfähigkeit mit Daten gefüttert und trainiert werden müssen, ist bekannt. Doch die Beschaffung dieser Daten ist umstritten, da urheberrechtlich geschützte Inhalte kaum vom Zugriff der KI-Systeme ausgeschlossen werden können. Das US Copyright Office arbeitet seit Anfang letzten Jahres an einer Aktualisierung der Gesetze, um dieser Herausforderung zu begegnen.

Unternehmen gehen verschiedene Wege, um an Daten zu gelangen. OpenAI beispielsweise arbeitet mit Medienhäusern zusammen, um deren Inhalte lizenzieren und seine Modelle weiterentwickeln zu können. Meta soll laut einem Bericht der New York Times sogar überlegt haben, den Verlag Simon & Schuster zu kaufen, um noch mehr Trainingsdaten zu erhalten.

Neben reinen Datensätzen nutzen Unternehmen sogenannte „Feedback-Schleifen“ – Daten aus vergangenen Interaktionen und Ergebnissen, die analysiert werden, um die zukünftige Leistung zu verbessern. Dazu gehören Algorithmen, die KI-Modelle auf Fehler hinweisen, damit diese daraus lernen können.

Es bleibt abzuwarten, ob Metas Strategie aufgeht und ob die Nutzung der Bilderflut tatsächlich zu einem entscheidenden Vorteil im KI-Wettlauf führt.

Leitlinie