Spracherkennung mit common voice und deep speech

Ich möchte an dieser Stelle nochmal auf die beiden Projekte common voice und deep speech von mozilla aufmerksam machen.

common voice sammelt Audioaufnahmen und deren Transskripte. Deep Speech ist ein Algorithmus, um ein Sprachmodell zu trainieren, dass zur Spracherkennung genutzt werden kann. Der Algorithmus ist schon sehr gut ausgereift.

Für die deutsche Sprache gibt es aber zu wenig Daten, um das Sprachmodell zu trainieren. Vorteil des Algorithmus ist die Ausführbarkeit auf rechenschwachen Geräten (raspberry pi ist vollkommen ausreichend), die lokale Ausführbarkeit und die quelloffene Umsetzung.

Ich möchte deshalb darum bitten, aktiv an common voice mitzuarbeiten. Je mehr Sprachdaten ihr selbst liefert, desto besser wird das Modell auch auf Eure Stimme trainiert.

Hier könnt ihr teilnehmen:

English please, this is an international community.

1 Like

Another option might be the German forum.

German openHAB - KNX-User-Forum