Tech News

Technik & Digital

Gemini 1.5 Flash ist ein neues Modell von Google, das darauf abzielt, Ihnen superschnelle Antworten zu bieten


Die zentralen Thesen

  • Gemini 1.5 Flash konzentriert sich auf Geschwindigkeit für hochfrequente Aufgaben mit multimodalen Argumentationsfunktionen für Text, Bilder und Videos.
  • Das Modell verfügt über das lange Kontextfenster von Google für die Verarbeitung von bis zu 1 Million Token und destilliert wesentliches Wissen aus der größeren Pro-Version.
  • Das kleinere Flash-Modell positioniert sich als Konkurrent von OpenAIs GPT-4o und verspricht schnellere Reaktionen und bessere Benutzerfreundlichkeit.


Google hat in seiner Gemini-Ära gerade einen weiteren großen Schritt nach vorne gemacht und Gemini 1.5 Flash auf der diesjährigen Google I/O vorgestellt. Es handelt sich um ein kleineres Gemini-Modell, das auf engere oder hochfrequente Aufgaben abzielt und sich eher auf die Geschwindigkeit der Bereitstellung als auf die Qualität und das tiefe Wissen der Antworten konzentriert. Es ist derzeit in über 200 Ländern in der Vorschau verfügbar und wird im Juni allgemein verfügbar sein.

Gemini 1.5 Flash liegt zwischen 1.5 Pro und 1.5 Nano, aber laut Google ist es genauso leistungsstark wie die Pro-Variante. Eines der herausragenden Merkmale von Gemini 1.5 Flash ist seine Fähigkeit zum multimodalen Denken. Es kann verschiedene Arten von Informationen, einschließlich Text, Bildern und Videos, verarbeiten und schlussfolgern, was es für viele verschiedene Arten von Aufgaben vielseitig einsetzbar macht.


Noch größer ist, dass Gemini 1.5 Flash, genau wie andere Modelle der Gemini-Familie, über das enorm lange Kontextfenster von Google verfügt, das bis zu 1 Million Token verarbeiten kann. „Destillation“ ist der Prozess, mit dem Google die wesentlichsten Kenntnisse und Fähigkeiten vom größeren Gemini 1.5 Pro-Modell auf das kleinere Flash-Modell überträgt.

Gemini 1.5 Flash wird in Zukunft für mehr Menschen verfügbar sein, allerdings ist noch nicht bekannt, welche Software und Dienste es umfassen wird. Es scheint ein brauchbarer Konkurrent für GPT-4o von OpenAI zu sein, vorausgesetzt, es kann entweder schneller reagieren oder bessere Antworten geben, aber das bleibt abzuwarten. Das Kontextfenster von Google ist hier die größte Neuigkeit, da 1 Million Token für ein multimodales LLM es ihm ermöglichen, eine große Menge an Text, Bildern, Audio- oder Videodaten auf einmal zu verstehen, was für viele äußerst hilfreich sein kann Menschen.

Google wird einen technischen Bericht für Gemini 1.5 Flash veröffentlichen, aber vorerst können Sie sich ansehen, wie es in Benchmarks abschneidet.


0:47

Verwandt

Wir haben GPT-4o ausprobiert und es ist viel schneller als GPT-4

Wenn Sie neugierig sind, wie viel schneller GPT-4o ist, ist der Unterschied zwischen GPT-4 und GPT-4 atemberaubend.



Source link