docs: add HuggingFace diarization setup instructions to SETUP.md
This commit is contained in:
@@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen**
|
||||
|
||||
Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
|
||||
gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
|
||||
|
||||
---
|
||||
|
||||
## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup
|
||||
|
||||
Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell
|
||||
ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen.
|
||||
|
||||
### 1. HuggingFace-Account
|
||||
|
||||
Falls noch kein Account vorhanden: https://huggingface.co/join
|
||||
|
||||
### 2. Modell-Zugriff beantragen
|
||||
|
||||
1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen
|
||||
2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren
|
||||
|
||||
### 3. Read-Token erstellen
|
||||
|
||||
1. https://huggingface.co/settings/tokens aufrufen
|
||||
2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen
|
||||
3. Token kopieren (beginnt mit `hf_`)
|
||||
|
||||
### 4. Token in Transkriptor eintragen
|
||||
|
||||
Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**:
|
||||
|
||||
- Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren
|
||||
- Token in das Feld **HuggingFace Token** eintragen
|
||||
- **Speichern**
|
||||
|
||||
Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.
|
||||
|
||||
Reference in New Issue
Block a user