docs: add HuggingFace diarization setup instructions to SETUP.md

2026-04-02 01:18:55 +02:00
parent 5f384af6cf
commit 56d41b8620
1 changed files with 32 additions and 0 deletions
@@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen**
 Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
 gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
 ---
 ## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup
 Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell
 ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen.
 ### 1. HuggingFace-Account
 Falls noch kein Account vorhanden: https://huggingface.co/join
 ### 2. Modell-Zugriff beantragen
 1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen
 2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren
 ### 3. Read-Token erstellen
 1. https://huggingface.co/settings/tokens aufrufen
 2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen
 3. Token kopieren (beginnt mit `hf_`)
 ### 4. Token in Transkriptor eintragen
 Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**:
 - Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren
 - Token in das Feld **HuggingFace Token** eintragen
 - **Speichern**
 Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.