docs: add HuggingFace diarization setup instructions to SETUP.md

2026-04-02 01:18:55 +02:00
parent 5f384af6cf
commit 56d41b8620
1 changed files with 32 additions and 0 deletions
@@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen**

 Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
 gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
+
+---
+
+## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup
+
+Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell
+ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen.
+
+### 1. HuggingFace-Account
+
+Falls noch kein Account vorhanden: https://huggingface.co/join
+
+### 2. Modell-Zugriff beantragen
+
+1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen
+2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren
+
+### 3. Read-Token erstellen
+
+1. https://huggingface.co/settings/tokens aufrufen
+2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen
+3. Token kopieren (beginnt mit `hf_`)
+
+### 4. Token in Transkriptor eintragen
+
+Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**:
+
+- Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren
+- Token in das Feld **HuggingFace Token** eintragen
+- **Speichern**
+
+Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.