Tech News

Technik & Digital

5 Dinge, die wir von GPT-5 sehen wollen


Die zentralen Thesen

  • GPT-5 benötigt ein größeres Kontextfenster, um wettbewerbsfähig zu sein
  • Die Videoeingabefähigkeit ist entscheidend für den Erfolg von GPT-5
  • GPT-5 muss die Reaktionsgeschwindigkeit und das logische Denken für ein größeres Upgrade verbessern


GPT-5 ist schon seit einiger Zeit ein heißes Thema, und Sam Altman, CEO von OpenAI, äußerte sich kürzlich im Podcast von Lex Fridman zur Zukunft des GPT-Modells. In diesem Podcast erklärte er, dass GPT-4 jetzt „irgendwie scheiße“ sei und dass er sich auf das freue, was als nächstes kommt. Er weigerte sich, es als „GPT-5“ zu bezeichnen, aber ein aktueller Bericht von Geschäftseingeweihter hat es so genannt, wobei Leute, die mit dem LLM vertraut sind, es im Vergleich zu GPT-4 als „wesentlich besser“ bezeichnen.


Größeres Kontextfenster

Ein Teil dessen, was Zwillinge so mächtig macht

5 Dinge, die wir von GPT-5 sehen wollen

Quelle: Google

Ein Kontextfenster gibt im Wesentlichen an, wie viel ein LLM zu einem bestimmten Zeitpunkt „sehen“ kann, und ein Teil dessen, was Gemini so leistungsstark macht, ist seine Fähigkeit, ein Kontextfenster von bis zu 10 Millionen Token zu haben. Auch wenn der dafür erforderliche Speicherbedarf absurd ist, wäre ein größeres Kontextfenster dennoch erstaunlich. GPT 4 hat ein Kontextfenster von 32 KB und GPT-4 Turbo erhöht dieses auf 128 KB. Das ist durchaus beachtlich, aber Google hat diese Zahl mit Gemini 1.5 immer noch deutlich übertroffen.


Wie bereits erwähnt, gibt es hier Speicherbeschränkungen, die das Unternehmen auf der Serverseite herausfinden müsste, aber es gibt Fortschritte in diesem Bereich, die dies für Endbenutzer ermöglichen könnten.

Verwandt

Googles Gemini 1.5 Ultra muss mit GPT-5 und nicht mit GPT-4 konkurrieren

Googles Gemini 1.5 Pro-Modell hat uns begeistert, und das Ultra-Modell könnte noch besser sein.

Video Eingang

Echte Multimodalität

Bitten Sie ChatGPT, ein Bild einer Katze mit Flügeln zu identifizieren

GPT-4 mit Vision ist ein Modell, das bereits existiert und visuelle Daten interpretieren kann, um sie dann bei der Entscheidungsfindung zu verwenden. Das Problem besteht darin, dass es zu langsam ist, um mehrere Bilder schnell genug richtig zu interpretieren, sodass eine Videoeingabe derzeit nicht in Frage kommt. Es wäre großartig, wenn OpenAI in diesem Bereich Fortschritte machen würde, sodass GPT-5 Videoeingaben wirklich berücksichtigen könnte. Ich bin zuversichtlich, insbesondere da das Unternehmen im Bereich der Video-KI im Allgemeinen gute Fortschritte gemacht hat, insbesondere mit der Enthüllung von Sora. Google arbeitet mit Gemini 1.5 auch an der Videoeingabe, und es sieht vielversprechend aus.


Verwandt

Sora von OpenAI ist noch nicht das Ende der Welt

Das neue Sora-Videomodell von OpenAI ist noch nicht das Ende der Welt, obwohl unklar ist, was die Zukunft bringen könnte.

Schnellere Antworten

GPT-4 ist viel langsamer als die Konkurrenz

Mit der Zeit ist GPT-4 einfach zu langsam geworden, wenn es darum geht, Antworten zu generieren. Während ein Teil davon mit ziemlicher Sicherheit auf die Flut an Datenverkehr zurückzuführen ist, die OpenAI täglich erhält, gelingt es Konkurrenten wie Google und Anthropic, viel schneller zu reagieren. OpenAI muss die Antwortgenerierungszeiten verbessern, und hoffentlich kann GPT-5 ein effizienteres Modell sein, das dies kann.

Persönlich ist das derzeit mein größter Kritikpunkt an GPT-4. Googles Gemini Advanced besonders ist so viel schneller als das, was OpenAI bieten kann, bis zu dem Punkt, dass ich eine Antwort generieren kann, von der ich weiß, dass sie auf beide Dienste lange dauern wird und Gemini als Ganzes fertig sein wird Minute Schneller.


Verbessertes logisches Denken

GPT-4 beginnt ins Hintertreffen zu geraten

claude-3-python-script-1

Logisches Denken ist für jedes LLM schwierig, insbesondere da es sich lediglich um verherrlichte Musterverwaltungsalgorithmen handelt. Sie können Antworten aufbauen, die auf Dingen basieren, die sie zuvor gesehen haben, aber alles andere ist eine Vermutung. Im Fall der Mathematik haben LLMs Schwierigkeiten, denn wenn eine Frage nicht in ihrem Trainingssatz enthalten ist, erraten sie einfach, wie die Antwort lauten sollte, um die Lücken zu schließen.

Das logische Denken muss massiv verbessert werden, damit OpenAI einen weiteren großen Vorteil erzielen kann, da Unternehmen wie Googles Gemini Advanced und Claude 3 Opus es geschafft haben, sich in diesem Bereich sprunghaft zu verbessern.

Microsoft und Google haben 365 und G Suite, aber was hat OpenAI?

Verwenden von Copilot Pro zum Senden einer E-Mail in Microsoft 365

Quelle: Microsoft


Wenn Sie Microsoft Copilot Pro oder Google Gemini Advanced verwenden, kennen Sie wahrscheinlich die Tool-Integrationen, die Sie mit beiden Diensten erhalten. Copilot Pro verfügt über eine vollständige Microsoft 365-Integration und Gemini Advanced über eine vollständige Google Suite-Integration. Das sind ziemlich große Vorteile gegenüber der Konkurrenz, bis hin zu dem Punkt, dass Copilot Pro für die meisten Menschen einfach ein besserer Kauf gegenüber ChatGPT Plus ist.

Mit GPT-5 wäre es schön, wenn sich diese Änderung mit mehr Integrationen für andere Dienste sehen würde. Angesichts der Tatsache, dass die Plugin-Unterstützung zugunsten benutzerdefinierter GPTs nachzulassen scheint, erwarte ich, dass die Liste der Vorteile, die OpenAI bietet, immer kleiner wird, insbesondere angesichts der Tatsache, dass Copilot auch benutzerdefinierte GPTs hat. Ich würde gerne sehen, dass OpenAI mit anderen Unternehmen zusammenarbeitet, um exklusive Funktionen einzuführen.


Verwandt

4 Gründe, warum Copilot Pro besser ist als ChatGPT Plus

Microsoft nutzt die Modelle von OpenAI, um den Abonnementdienst Copilot Pro anzubieten, und dennoch ist es eine bessere Option als ChatGPT Plus.

GPT-5 wird hoffentlich groß sein

Dies sind einige der wichtigsten Dinge, auf die ich bei der nächsten Version von GPT hoffe, aber um ehrlich zu sein, könnte das Unternehmen in jede Richtung gehen. Da Altmans Kommentare offenbar darauf hindeuten, dass GPT-5 ein großes Upgrade sein wird, sind wir durchaus zuversichtlich, aber es gibt keine Garantie dafür, dass es dem Unternehmen gelingen wird, den massiven Vorteil, den es bei der Einführung von ChatGPT gegenüber dem Rest der Branche hatte, zurückzugewinnen .



Source link