docs: add HuggingFace diarization setup instructions to SETUP.md

This commit is contained in:
2026-04-02 01:18:55 +02:00
parent 5f384af6cf
commit 56d41b8620
+32
View File
@@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen**
Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
---
## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup
Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell
ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen.
### 1. HuggingFace-Account
Falls noch kein Account vorhanden: https://huggingface.co/join
### 2. Modell-Zugriff beantragen
1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen
2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren
### 3. Read-Token erstellen
1. https://huggingface.co/settings/tokens aufrufen
2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen
3. Token kopieren (beginnt mit `hf_`)
### 4. Token in Transkriptor eintragen
Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**:
- Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren
- Token in das Feld **HuggingFace Token** eintragen
- **Speichern**
Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.