From 56d41b8620fe4cd500d13e262f46ccae58f0b385 Mon Sep 17 00:00:00 2001 From: "thomas.kopp" Date: Thu, 2 Apr 2026 01:18:55 +0200 Subject: [PATCH] docs: add HuggingFace diarization setup instructions to SETUP.md --- docs/SETUP.md | 32 ++++++++++++++++++++++++++++++++ 1 file changed, 32 insertions(+) diff --git a/docs/SETUP.md b/docs/SETUP.md index 0a773ee..d93d445 100644 --- a/docs/SETUP.md +++ b/docs/SETUP.md @@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen** Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json` gespeichert. Bei App-Stop können sie mit `pactl unload-module ` entladen werden. + +--- + +## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup + +Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell +ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen. + +### 1. HuggingFace-Account + +Falls noch kein Account vorhanden: https://huggingface.co/join + +### 2. Modell-Zugriff beantragen + +1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen +2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren + +### 3. Read-Token erstellen + +1. https://huggingface.co/settings/tokens aufrufen +2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen +3. Token kopieren (beginnt mit `hf_`) + +### 4. Token in Transkriptor eintragen + +Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**: + +- Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren +- Token in das Feld **HuggingFace Token** eintragen +- **Speichern** + +Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.