PocketSphinx

Zusammenfassung mit KI ⊛

PocketSphinx ist ein Open-Source-Spracherkennungstoolkit, das von der Carnegie Mellon University entwickelt wurde. Es handelt sich um ein großvokabulares, sprecherunabhängiges kontinuierliches Spracherkennungssystem.

Installation

PocketSphinx kann über pip installiert werden:

pip3 install pocketsphinx

Alternativ kann es auch aus dem Quellcode kompiliert werden. Es wird empfohlen, dies in einer virtuellen Umgebung durchzuführen.

Verwendung

PocketSphinx bietet eine Vielzahl von Optionen und Einstellungen, um die Spracherkennung anzupassen. Es gibt Beispiele für die Verwendung des Tools in der examples-Verzeichnis. Die Dokumentation für die Python-API und die C-API sind auch verfügbar.

LiveSpeech

Die LiveSpeech-Klasse ermöglicht die kontinuierliche Spracherkennung oder die Schlüsselwort-Suche von einem Mikrofon. Ein Beispiel für die Verwendung dieser Klasse ist:

from pocketsphinx import LiveSpeech for phrase in LiveSpeech(): print(phrase)

AudioFile

Die AudioFile-Klasse ermöglicht die kontinuierliche Spracherkennung oder die Schlüsselwort-Suche von einer Datei. Ein Beispiel für die Verwendung dieser Klasse ist:

from pocketsphinx import AudioFile for phrase in AudioFile("goforward.raw"): print(phrase)

Lizenz

PocketSphinx wird unter der BSD-Lizenz veröffentlicht. Die vollständigen Lizenzbedingungen sind in der LICENSE-Datei zu finden.

Weitere Informationen

Weitere Informationen zu PocketSphinx, einschließlich der Dokumentation und der Verwendung, sind auf der offiziellen Website und auf GitHub verfügbar.

Installation

Verwendung

LiveSpeech

AudioFile

Lizenz

Weitere Informationen

Ähnliche KI-Apps

Julius Speech Recognition System

Open Speech Recognition Toolkit

Picovoice

IBM Speech To Text