Das Kaldi Speech Recognition Toolkit ist ein Open-Source-Werkzeug für die automatische Spracherkennung. In diesem Artikel werden wir einen Überblick über das Toolkit und seine Verwendung geben.
Die Installation von Kaldi kann einige Stunden dauern und benötigt etwa 40 GB an Festplattenspeicher. Es gibt zwei Möglichkeiten, Kaldi zu installieren: automatisch oder manuell.
Für die automatische Installation benötigen Sie wget
und git
auf Ihrem System. Führen Sie die folgenden Befehle aus, um die Installation zu starten:
wget https://raw.githubusercontent.com/AssemblyAI/kaldi-asr-tutorial/master/setup.sh
sudo bash setup.sh
Wenn Sie mehrere CPUs haben, können Sie die Installation parallel durchführen, indem Sie die Anzahl der Prozessoren angeben, die Sie verwenden möchten.
Für die manuelle Installation müssen Sie einige Pakete installieren, bevor Sie Kaldi installieren können. Führen Sie die folgenden Befehle aus:
sudo apt update && sudo apt upgrade
yes | sudo apt install unzip git-all
yes | sudo apt-get install wget g++ make automake autoconf sox gfortran libtool subversion python2.7 python3.8 zlib1g-dev
Anschließend können Sie das Kaldi-Repository klonen und die Installation durchführen.
Nach der Installation können Sie Kaldi verwenden, um Audio-Dateien zu transkribieren. Weitere Informationen zur Verwendung von Kaldi finden Sie in unserem Tutorial.
Wir hoffen, dass dieser Artikel Ihnen einen guten Überblick über das Kaldi Speech Recognition Toolkit gegeben hat. Wenn Sie weitere Fragen haben, kontaktieren Sie uns bitte.
* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.