Interview mit KI-Forscher Björn Ommer
KI made in Germany? Das erwartet ein Forscher für die Zukunft

Künstliche Intelligenz kommt nicht nur aus den USA. Björn Ommer hat den Bildergenerator Stable Diffusion in München mitentwickelt. Ein Gespräch über Gefahren und Chancen der Technologie.

25. Juni 2024, 15:28 Uhr, von Wiebke Harms, Wirtschaftsredakteurin

Collage aus Bergen, Schlössern und grinsendem Gemüse mit bunten Farben und geometrischen Formen.
Mehr als Burgen und Schlösser: So stellt sich die KI Stable Diffusion "Made in Germany" vor.
© Getty Images/Jupiterimages; Mit Stable Diffusion generierte Fotos (4)

In bekannten Text-zu-Bild-Generatoren wie Midjourney steckt generative Künstliche Intelligenz (KI) made in Germany: Das Modell heißt Stable Diffusion und stammt aus München. Entwickelt hat es der Informatik-Professor Björn Ommer mit seinem Team an der Ludwig-Maximilians-Universität. Im Gegensatz zu den Technologiekonzernen machen die Wissenschaftler kein Geheimnis aus dem Quellcode ihrer KI, sondern stellen das Modell per Open-Source-Lizenz allgemein zur Verfügung.

impulse: Wie lernt eine Künstliche Intelligenz, realistisch aussehende Bilder zu generieren?
Björn Ommer: Was wir trainiert haben, ist ein sogenanntes ­Diffusionsmodell. Das Vorgehen dabei kann man sich so vorstellen: Sie nehmen ein einzelnes Foto und addieren auf das Bild im ersten Schritt Rauschen, also eine Bildstörung. Nur so wenig, dass ein Mensch dieses Rauschen kaum sehen kann. Diesen Schritt wiederholen Sie jedoch Tausende Male. Das Endergebnis sieht so aus wie das Schneegestöber auf einem Fernseher, bei dem jemand das Antennenkabel gezogen hat. Das ­ursprüngliche Bild ist nicht mehr zu erkennen.

Was bringt das?
Dieses verrauschte Bild zeigen wir der KI. Dann nehmen wir das Rauschen Schritt für Schritt ­wieder weg. Am Ende ist das Bildmotiv wieder zu erkennen. Die KI lernt durch den Entrauschungsprozess, stückweise Bildinhalte zu ergänzen – bis sie ganze Szenen generieren kann. Besonders ist jedoch: Wir haben uns von Anfang an vorgenommen, dass unser Modell auf einem normalen Computer laufen soll.

Der Experte
Björn OmmerDer Informatik-Professor Björn Ommer, 44, forscht und lehrt an der LMU München. Er hat sich darauf spezialisiert, Künstlicher Intelligenz das Sehen beizubringen. Aktuell arbeitet seine Forschungsgruppe unter anderem an Video-KIs.

Warum ist Ihnen das wichtig?
Ein Problem generativer KI ist, dass sowohl das Training als auch die Anwendung der Modelle sehr viel Rechenkapazität brauchen. Damit eine KI sinnvolle Aussagen über unsere Welt machen kann, muss sie Milliarden von Bildern sehen. Also viele, viele Terabyte Daten. Eine ­Infrastruktur zu betreiben, auf der entsprechend riesige Modelle laufen, können sich nur große Firmen leisten. Unser Ziel war, generative KI durch eine Steigerung ihrer Effizienz zu demokratisieren. Inzwischen läuft unser Modell sogar auf ­einem Mobiltelefon.


Sie möchten weiterlesen?
impulse+ icon Anmelden
impulse-Mitglieder können nach dem Anmelden auf alle impulse+ icon-Inhalte zugreifen.
impulse+ icon impulse-Mitglied werden
  • impulse-Magazin
  • alle impulse+ icon-Inhalte
  • digitales Unternehmer-Forum
  • exklusive Mitglieder-Events
  • und vieles mehr …
In eigener Sache
Power-Hour: Change-Management
Gratis Webinar für Unternehmer
Power-Hour: Change-Management
60 Minuten, 5 Lektionen, 1 Ziel: Ihr Unternehmen zielsicher durch Veränderungen führen – ohne dass jemand durchdreht.
Mehr lesen über