Tech News

Technik & Digital

Sora ist das erste echte Text-zu-Video-Modell, aber es wird nicht das letzte sein


Die zentralen Thesen

  • Sora wird wahrscheinlich kostspielig sein und vor der Markteinführung einer genauen Prüfung unterzogen.
  • Microsoft und Google konkurrieren im Text-zu-Video-Bereich.
  • Alle Unternehmen beeilen sich, KI-Modelle für die Videogenerierung zu entwickeln.


Sora wurde kürzlich von OpenAI als echtes Text-zu-Video-Generierungsmodell vorgestellt, und damit gingen eine Reihe von Fragen hinsichtlich der gesellschaftlichen Auswirkungen eines solchen Tools einher. Die Möglichkeit, mit Leichtigkeit authentisch aussehende Videos zu erstellen, wirft Fragen hinsichtlich der Integrität von Videos als Beweismittel auf, wirft aber auch Fragen darüber auf, wo OpenAI sein Modell überhaupt trainiert hat.

Natürlich wird Sora höchstwahrscheinlich ein von OpenAI geschütztes Tool sein. Ich vermute, dass das, was auch immer erzeugt wird, einer strengen Prüfung durch die Mitarbeiter des Unternehmens unterliegen wird, wenn es schließlich auf den Markt kommt, und ich vermute auch, dass die Kosten zunächst ziemlich unerschwinglich sein werden. Allerdings ist es vielleicht das erste seiner Art, aber es wird mit ziemlicher Sicherheit nicht das letzte sein.


Wir können aus der Geschichte lernen

Google, Microsoft und andere versuchen bereits, dasselbe zu tun

Sora ist das erste echte Text-zu-Video-Modell, aber es wird nicht das letzte sein


Wie schon beim ersten Start von ChatGPT bemühten sich sowohl Microsoft als auch Google, an etwas Ähnlichem zu arbeiten. Microsoft nutzte die GPT-Technologie von OpenAI, um das zu betreiben, was damals als Bing Chat bekannt war, während Google Bard schnell auf den Markt brachte – zu schnell, könnte man sagen. Auch der Rest der Branche sträubte sich: Hunderte von KI-Modellen von Unternehmen und Start-ups kamen auf den Markt und wurden auf Plattformen wie Hugging Face geteilt.

Bei Sora hat es mit ziemlicher Sicherheit den gleichen Effekt. Vielleicht nicht in dem Ausmaß, als würde Google zum ersten Mal überhaupt seine eigene Sterblichkeit bei der Suche in Frage stellen, aber genug, dass Unternehmen befürchten, ins Hintertreffen zu geraten, und das nicht zulassen wollen. Sora hat weitreichende Auswirkungen auf die Zukunft des Videos, und auch Google, Microsoft und andere werden ein Stück vom Kuchen haben wollen. Es ist nicht genau möglich, die Zukunft ausschließlich auf der Grundlage der Vergangenheit vorherzusagen, aber wir können einige ziemlich gute Vermutungen anstellen.


Ich vermute, dass Sora in naher Zukunft von offenen, kostenlosen Modellen flankiert wird, die jeder nutzen kann, und dass damit die Gefahr des Missbrauchs verbunden ist. Stable Video Diffusion funktioniert bereits, ist jedoch langsam, kurz und erfordert ein erstes Bild zur Animation. Es ist kein Text-zu-Video-Modell wie Sora, aber es könnte in der Zukunft sein. Das Fundament ist fast da und selbst sechssekündige Videos können überzeugen.

Was kommt als nächstes?

Andere kommen

Explorer aus den Sora OpenAI-Videos, KI generiert

Quelle: OpenAI

Egal was passiert, es kommen noch andere. Start-ups werden versuchen, die Ersten zu sein, Microsoft hat bereits angekündigt, dass es eine eigene Version von Sora haben wird, und ich bezweifle wirklich, dass Google außen vor bleiben möchte. Da sich die Technologie immer weiter ausbreitet, wird es schwierig sein, die Weitergabe gefälschter Videos zu verhindern. Was das für die Zukunft des Informationsaustauschs, der Politik und anderer Branchen bedeutet, ist nicht ganz klar, aber ich vermute nicht, dass es schön sein wird.


Wenn Unternehmen wie Mistral ihr Mixtral-KI-Modell unter dem Banner einer ungehemmten KI ohne Leitplanken auf den Markt bringen, signalisiert das mehrere Dinge. Obwohl es technisch gesehen Innovationen fördern kann, ist es anfällig für Missbrauch. Text ist Text, und das ist nicht so schädlich, aber eine ähnliche Einstellung gegenüber der Videogenerierung könnte in Zukunft für alle große Probleme bereiten, selbst für die größten Befürworter einer solchen offenen Technologie.



Source link