Tech News

Technik & Digital

Facebook entwickelt eine neue KI, die zukünftige Prozessschritte vorhersagen und Aktivitäten anleiten kann


Dies könnte insbesondere im Zusammenhang mit der Weiterentwicklung von AR-Wearables durch Facebook interessant sein.

Das soziale Netzwerk hat heute einen neuen maschinellen Lernprozess namens „Anticipative Video Transformer (AVT)‘, der in der Lage ist, zukünftige Aktionen in einem Prozess basierend auf visueller Interpretation vorherzusagen.

Facebook entwickelt eine neue KI, die zukünftige Prozessschritte vorhersagen und Aktivitäten anleiten kann

Wie Sie in diesem Beispiel sehen können, ist der neue Prozess in der Lage, eine Aktivität zu analysieren und dann zu antizipieren, welche Aktion als Ergebnis wahrscheinlich als nächstes folgen wird.

Die eine Reihe von Anwendungen haben könnte – wie von Facebook erklärt:

„AVT könnte besonders für Anwendungen wie einen AR-„Action-Coach“ oder einen KI-Assistenten nützlich sein, indem es jemanden darauf aufmerksam macht, dass er beim Erledigen einer Aufgabe möglicherweise einen Fehler macht, oder indem er vorzeitig mit einer hilfreichen Aufforderung für die nächste reagiert Schritt in eine Aufgabe. AVT könnte beispielsweise jemanden warnen, dass die Pfanne, die sie aufnehmen möchten, heiß ist, basierend auf den vorherigen Interaktionen der Person mit der Pfanne.

Das klingt wie aus einem Science-Fiction-Film und ermöglicht alle neuen Smart-Home-Anwendungen. Und wiederum im Zusammenhang mit AR-Brillen, die eine Reihe nützlicher Hinweise bieten könnten, die den Menschen zu Hause oder am Arbeitsplatz bei der Bewältigung einer Vielzahl von Aufgaben unterstützen.

„Wir trainieren das Modell, um zukünftige Aktionen und Funktionen anhand von drei Verlusten vorherzusagen. Zuerst klassifizieren wir die Merkmale im letzten Frame eines Videoclips, um eine beschriftete zukünftige Aktion vorherzusagen; zweitens regressieren wir das Merkmal des Zwischenrahmens auf die Merkmale der nachfolgenden Rahmen, wodurch das Modell trainiert wird, vorherzusagen, was als nächstes kommt; Drittens trainieren wir das Modell, um Zwischenhandlungen zu klassifizieren. Wir haben gezeigt, dass unser Modell durch die gemeinsame Optimierung der drei Verluste zukünftige Aktionen um 10 bis 30 Prozent besser vorhersagt als Modelle, die nur mit bidirektionaler Aufmerksamkeit trainiert wurden.“

Es ist nicht etwas, das Facebook sofort einführen möchte, aber das Potenzial hier ist beträchtlich und könnte schließlich alle neuen Wege ermöglichen, Benutzeraktionen zu leiten und Fehler zu minimieren, indem zukünftige Schritte vorhergesehen werden.

Facebook verwendet das Beispiel des Autoreifenwechsels, wobei eine AR-Brille Ihnen hilft, den richtigen Weg zu weisen, aber auch als Erinnerung für Ihre morgendlichen Routinen dienen kann, basierend auf einer visuellen Beurteilung, wo Sie sich befinden und was Sie tun.

Wirklich, die potenziellen Anwendungen hier sind endlos, und wenn man auch bedenkt, wie sich Google Glass zu einem wichtigen Werkzeug in Industriearbeitsplätzen entwickelt hat, indem es In-View-Points und Anleitungen für technische Anwendungen bietet, ist das zusätzliche Potenzial für die tragbaren AR-Geräte von Facebook beträchtlich.

Es ist ein Stück weit davon entfernt, ein verbraucherorientiertes Produkt in irgendeiner Form zu sein, aber das Projekt unterstreicht die laufende KI-Entwicklung von Facebook und weist auf die sich entwickelnden Funktionen hin, die wahrscheinlich in eine kommende Phase seiner AR-Brillenprojekte integriert werden.

Weitere Informationen zum Anticipative Video Transformer (AVT)-Prozess von Facebook finden Sie hier.

.



Source link