From 56d41b8620fe4cd500d13e262f46ccae58f0b385 Mon Sep 17 00:00:00 2001
From: "thomas.kopp" <thomas.kopp@tueit.de>
Date: Thu, 2 Apr 2026 01:18:55 +0200
Subject: [PATCH] docs: add HuggingFace diarization setup instructions to
 SETUP.md

---
 docs/SETUP.md | 32 ++++++++++++++++++++++++++++++++
 1 file changed, 32 insertions(+)
diff --git a/docs/SETUP.md b/docs/SETUP.md
index 0a773ee..d93d445 100644
--- a/docs/SETUP.md
+++ b/docs/SETUP.md
@@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen**
 
 Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
 gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
+
+---
+
+## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup
+
+Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell
+ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen.
+
+### 1. HuggingFace-Account
+
+Falls noch kein Account vorhanden: https://huggingface.co/join
+
+### 2. Modell-Zugriff beantragen
+
+1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen
+2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren
+
+### 3. Read-Token erstellen
+
+1. https://huggingface.co/settings/tokens aufrufen
+2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen
+3. Token kopieren (beginnt mit `hf_`)
+
+### 4. Token in Transkriptor eintragen
+
+Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**:
+
+- Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren
+- Token in das Feld **HuggingFace Token** eintragen
+- **Speichern**
+
+Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.