Video und KI…

Ein Beitrag aus unserem mebim-Adventskalender 2024


Nach Text und Audio hat die Künstliche Intelligenz nun auch die Videoerstellung erreicht. Im letzten Jahr hat sich hier Erstaunliches getan.

Im Folgenden möchte ich euch einen kurzen Abriss der Entwicklung zeigen:

Bereits 2018 wurden die ersten Deepfake-KI-Videos erstellt, allerdings mit enormem technischen Aufwand, z.B. in Universitäts-Laboren.

Ende 2023 gab es dann die ersten Möglichkeiten zum Ausprobieren bei Pikalabs  – mit einer Videodauer von 3 Sekunden. Hier rechts ein Beispiel mit dem Prompt
Marienplatz, München, unter Wasser“.

Die Dor Brothers bauten aus den 3-Sekunden-Schnipseln schon Ende 2023 einen „für damalige Verhältnisse“ beeindruckenden, eineinhalbminütigen Clip im Van-Gogh-Stil: „Can you paint a Taste?“.

Ein Wendepunkt kam im Frühjahr 2024 mit den ersten Preview Videos von Open AIs Sora (siehe hier rechts).
Sora ist bis heute noch nicht in Deutschland verfügbar – vielleicht ist das ganz gut so, weil die Auswirkungen von täuschend echten und massenhaft produzierten Fake-Videos nicht abschätzbar sind. Auf der Open AI Sora.Website finden sich jedoch noch zahlreiche weitere beeindruckende Beispiele.

In einem schönen Video von der Deutschen Welle wird gezeigt, wie (momentan!) noch Artefakte  in diesen Videos auffindbar sind. Die gleiche Entwicklung war auch noch Ende 2022 bei generierten Bildern zu beobachten, ist dort jedoch heute kein Thema mehr.


In den letzten  Monaten sind etliche weitere Anbieter aufgetaucht, von denen ich zwei hier vorstellen möchte:

Runway liefert bereits beeindruckende Einstellungsmöglichkeiten: Zum Beispiel ein einziges hochgeladenes Portraitbild, das zu einer kompletten Figur ergänzt und dann wie ein 3D-Modell von allen Seiten betrachtet / „gefilmt“ werden kann.

Aus dem Upload des obigen Bildes erzeugte Runway dieses Video…. Beeindruckend, auch wenn ich im Prompt eigentlich eingegeben hatte, dass das Paar sich streiten sollte, anstatt sich zu küssen…(-:
Wenn man allerdings genau hinsieht, kann man erkennen, dass die Dame am Anfang an der linken Hand sechs Finger hat und dass später im Video der Ansatz einer dritten Hand des Mannes am Rücken der Frau auftaucht.


Als zweites möchten ich euch noch kurz LTX Studio vorstellen, das bereits ganze Videoprojekte mit zig verschiedenen dafür benötigten Kameraeinstellungen erstellen kann.
Als Beispiel hier rechts die (kostenlos erstellten) Kameraeinstellungen eines Drehbuchs und eine kurze Einstellung nach dem Animationsklassiker Ratatouille.


Youtube wird gegenwärtig von KI generierten Videos berühmter Personen geflutet. Noch sind diese relativ schnell erkennbar, aber auch hier stehen wir erst am Anfang.

Zum Abschluss noch eine lustige KI Animation von James Gerde und ein unterhaltsames Video der Shy Kids, bei dem die KI-Einbindung wirklich Sinn ergibt.

In den nächsten 12 Monaten werden KI-Videos sicher so perfektioniert werden, dass sie von gefilmten Videos nicht mehr unterscheidbar sind. Damit rollt eine Flut neuer Aufgaben und Probleme, aber auch Lösungen auf uns zu. Was denkt ihr darüber?