Tech News

Technik & Digital

Ich habe meinen Raspberry Pi mit OpenVoiceOS in einen KI-Sprachassistenten verwandelt


Wenn es um Sprachassistenten geht, dominieren drei Namen das Spiel. Siri war der Erste, der 2010 mit neuen iOS-Geräten auf den Markt kam. Als nächstes kam Cortana (obwohl es nur von kurzer Dauer war), gefolgt von Alexa und Google Assistant, die zu den beiden größten Playern geworden sind. Aber was wäre, wenn ich Ihnen sagen würde, dass es eine andere Option gibt, eine Open-Source-Option? Hier kommt Open Voice OS ins Spiel, ein modularer Open-Source-Sprachassistent.


Aber eines sollten wir gleich zu Beginn klarstellen. Open Voice OS befindet sich zweifellos noch im „Projekt“-Entwicklungsstadium. Es müssen einige Probleme behoben werden, bevor dies als brauchbares Instrument für die breite Masse angesehen werden kann. Zum jetzigen Zeitpunkt der Entwicklung handelt es sich um eine Hülle dessen, was „richtige“ Sprachassistenten leisten können, und eignet sich am besten für Power-User, die mit Linux und Python bestens vertraut sind.

Verwandt

Wie ich durch den Einbau einer SSD mehr Geschwindigkeit aus meinem Raspberry Pi 5 herausgeholt habe

Wechseln Sie von SD zu SSD (das zusätzliche S steht für Geschwindigkeit).

Open Voice OS auf dem Raspberry Pi 5 installieren

Immer noch hier? Großartig, lasst uns Open Voice OS auf dem Raspberry Pi 5 einrichten.

Bevor Sie beginnen, stellen Sie sicher, dass Sie über ein Mikrofon verfügen, damit Sie mit dem Sprachassistenten sprechen können, und über eine Möglichkeit zur Tonausgabe. Ich habe mir die Webcam von meinem Desktop-Computer ausgeliehen und für diesen Build die Lautsprecher in meinem tragbaren HDMI-Monitor verwendet.


Ich habe alle diese Schritte bei einer Neuinstallation des 64-Bit-Raspberry-Pi-Betriebssystems mit Desktop durchgeführt.

  1. Beginnen Sie mit der Aktualisierung Ihrer Paketliste, indem Sie „Sudo apt-Update” in das Terminal.
    Ausgabe des Sudo apt-Updates für Raspberry Pi 5

  2. Als nächstes müssen Sie Git und Curl installieren, also geben Sie „sudo apt install -y git curl” in das Terminal. Wenn Sie Open Voice OS auf einer vollständigen RPiOS-Installation installieren, sollten diese bereits installiert sein.
    Raspberry Pi 5 installiert Curl und Git

  3. Um mit der Installation von Open Voice OS zu beginnen, geben Sie den folgenden Befehl ein oder kopieren Sie ihn in das Terminal:
    sh -c "curl -s https://raw.githubusercontent.com/OpenVoiceOS/ovos-installer/main/installer.sh -o installer.sh && chmod +x installer.sh && sudo ./installer.sh && rm installer.sh"
  4. Nach etwa 30 Sekunden sollte der erste Vorinstallationsdialog erscheinen, der Sie auffordert, eine Sprache auszuwählen. Benutzen Sie die Pfeiltasten navigieren, Leertaste um Ihre Auswahl zu markieren, und eingeben um zum nächsten Bildschirm zu gelangen.
    Raspberry Pi 5 Open Voice OS Sprache auswählen

  5. Die nächsten beiden Bildschirme sind nur eine Begrüßung der Entwickler und Ihre erkannten Systemeinstellungen. Drücken Sie Eingeben weitermachen.

  1. Wählen Sie als Nächstes aus, ob Sie die Installation in einem Docker-Container oder in einer virtuellen Python-Umgebung durchführen möchten. Ich habe mich für die virtuelle Umgebung entschieden.
    Installationsmethode für Raspberry Pi 5 Open Voice OS

  2. Der nächste Bildschirm zeigt, dass Open Voice OS noch sehr experimentell ist. Sie können die stabile Version nicht installieren, da es keine gibt. Drücken Sie Eingeben weitermachen.
    Entwicklungsversion von Raspberry Pi 5 Open Voice OS

  3. Wählen Sie aus, welche Funktionen aktiviert werden sollen. Dieser Bildschirm ist keine Entweder-Oder-Wahl. Sie können beides wählen, aber ich konnte die GUI nie zum Laufen bringen. Vielleicht haben Sie mehr Glück. Drücken Sie Eingeben weitermachen.
    Funktionsauswahl für Raspberry Pi 5 Open Voice OS

  4. Wählen Sie aus, ob Sie möchten, dass Open Voice OS seine Software so optimiert, dass sie besser auf Ihrem Pi funktioniert. Ich habe mich für Ja entschieden.
    Raspberry Pi 5 Open Voice OS Pi-Tuning

  5. Bestätigen Sie als Nächstes Ihre bisher getroffenen Entscheidungen.
    Raspberry Pi 5 Open Voice OS bestätigt die Funktionen

  6. Wählen Sie abschließend aus, ob Sie Telemetriedaten mit Open Voice OS teilen möchten.
    Raspberry Pi 5 Open Voice OS teilt Telemetrie


An diesem Punkt sollte der vollständige Installationsprozess beginnen. Das Ganze hat bei mir etwa acht Minuten gedauert, aber das hängt vom Speichermedium (SSD ist schneller als SD) und der Internetgeschwindigkeit ab. Sobald der Vorgang abgeschlossen ist, wird in Ihrem Terminal eine Bestätigungsmeldung angezeigt. Drücken Sie die Eingabetaste, um es zu schließen.

Die Installation des Raspberry Pi 5 Open Voice OS ist abgeschlossen

Ihr neuer KI-Sprachassistent ist jetzt einsatzbereit! Um es zu verwenden, sagen Sie „Hey Mycroft“ und stellen Sie dann Ihre Frage. Wenn Sie das Aktivierungswort verwenden, sollten Sie einen Benachrichtigungston hören, der Sie darüber informiert, dass Ihnen aktiv zugehört wird.

Wenn Sie Probleme mit Ihrer Installation hatten, ist das Entwicklungsteam hinter dem Projekt sehr hilfreich und wird versuchen, Ihre Probleme zu lösen, wenn Sie geduldig und höflich damit umgehen. Sie unterhalten einen Matrix-Chatroom (eine Art Open-Source-Slack oder Discord), dessen Nutzung kostenlos ist.


Verwandt

Hier sind 6 Projekte, bei denen Mini-PCs SBCs zerstören

SBCs mögen viele Anwendungsfälle haben, aber einige Projekte erfordern die überlegene Rechenleistung eines Mini-PCs

Installieren von Fähigkeiten mit Open Voice OS

Sobald Sie Ihren Sprachassistenten eingerichtet haben, möchten Sie ihn wahrscheinlich um einige Fähigkeiten erweitern. Alle OpenVoiceOS-Kenntnisse liegen in Form von Python-Paketen vor. Der einfachste Weg, sie hinzuzufügen, ist daher die Verwendung des Befehls „pip install“ in Ihrem Terminal. Aber bevor Sie das tun, müssen Sie mit diesem Befehl die virtuelle Umgebung von Python in OpenVoiceOS aktivieren.

source ~/.venvs/ovos/bin/activate

Kompetenzen finden Sie auf dieser Seite. Sobald Sie den neuen Skill installiert haben, müssen Sie Ihren Sprachassistenten mit dem „systemctl –user restart ovos-core“ Befehl.

Ich muss hier noch einmal betonen, dass sich nahezu alles an diesem Projekt noch im experimentellen Stadium befindet. Möglicherweise müssen Sie einige Einstellungen in den Skills-Konfigurationsdateien anpassen, damit alles funktioniert (lesen Sie die Skill-Dokumentation), oder dem Skill fehlen möglicherweise Funktionen. Bei meinen Tests konnte ich keine nicht standardmäßigen Fertigkeiten ordnungsgemäß funktionieren lassen. Der ChatGPT-Skill konnte nicht auf ChatGPT zugreifen und der TuneIn-Skill konnte problemlos Musik abspielen, aber es gab keine einfache Möglichkeit, die Musik zu stoppen.


Verwandt

Dies sind die nächsten 5 Projekte auf meiner SBC-To-Do-Liste

Zusammenbau erforderlich

Wie ist Open Voice OS?

Mal ehrlich: Meine Erfahrung mit Open Voice OS war nicht so gut. Die Software hat mich häufig falsch verstanden und mir standardmäßige Antworten vom Typ „Könnten Sie das wiederholen?“ gegeben. Auch die Reaktionsgeschwindigkeit schwankte erheblich. Normalerweise dauerte es etwa fünf Sekunden, bis eine Antwort auf die Frage „Wie spät ist es?“ kam. Abfrage, aber manchmal war es sehr schnell, manchmal konnte es 10 oder mehr Sekunden dauern.

Standardmäßig wird Open Voice OS mit Fähigkeiten für Uhrzeit, Datum, Alarme, Timer und Wetter installiert. Ich konnte nie erfolgreich einen Alarm oder einen Timer einstellen, aber die anderen Fähigkeiten funktionierten größtenteils wie sie sollten, wenn meine Stimme richtig interpretiert wurde.

Wenn Sie einen besseren Einblick in das Geschehen unter der Haube erhalten möchten, können Sie den Befehl „journalctl –user -xlefu ovos-listener„Um zu sehen, was Ihr Sprachassistent hört, können Sie „journalctl –user -xlefu ovos-core”, um zu sehen, wie diese Informationen verarbeitet werden. Ich habe beide gleichzeitig in zwei Terminalfenstern ausgeführt, als ich alles getestet habe.


Trotz alledem möchte ich, dass dieses Projekt gelingt. Die großen Sprachassistenten, die es gibt (Alexa, Siri, Google Assistant und Copilot), funktionieren gut, aber jeder bevorzugt sein eigenes Ökosystem und tut sein Bestes, um Sie zu einer Antwort von Amazon, Apple, Google oder Microsoft zu leiten. Verbraucher brauchen eine offene Alternative, die ihnen unvoreingenommene Hilfe bietet. Wenn Sie sich jedoch mehr für Retro-Spiele als für Sprachassistenten interessieren, könnte Ihnen stattdessen dieses Emulationsprojekt gefallen.



Source link