docs: add HuggingFace diarization setup instructions to SETUP.md
This commit is contained in:
@@ -149,3 +149,35 @@ Einstellungen → Audio → **Combined Source erstellen**
|
|||||||
|
|
||||||
Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
|
Die PipeWire-Module werden in `~/.config/tueit-transcriber/pipewire-modules.json`
|
||||||
gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
|
gespeichert. Bei App-Stop können sie mit `pactl unload-module <id>` entladen werden.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
|
## Diarisierung (Sprecher-Erkennung) — HuggingFace-Setup
|
||||||
|
|
||||||
|
Die Diarisierung verwendet das Modell `pyannote/speaker-diarization-3.1`. Das Modell
|
||||||
|
ist kostenfrei, erfordert aber eine einmalige Zustimmung zu den Nutzungsbedingungen.
|
||||||
|
|
||||||
|
### 1. HuggingFace-Account
|
||||||
|
|
||||||
|
Falls noch kein Account vorhanden: https://huggingface.co/join
|
||||||
|
|
||||||
|
### 2. Modell-Zugriff beantragen
|
||||||
|
|
||||||
|
1. https://huggingface.co/pyannote/speaker-diarization-3.1 aufrufen
|
||||||
|
2. **"Access repository"** klicken und die Nutzungsbedingungen akzeptieren
|
||||||
|
|
||||||
|
### 3. Read-Token erstellen
|
||||||
|
|
||||||
|
1. https://huggingface.co/settings/tokens aufrufen
|
||||||
|
2. **"New token"** → Name z.B. `transkriptor` → Typ **Read** → erstellen
|
||||||
|
3. Token kopieren (beginnt mit `hf_`)
|
||||||
|
|
||||||
|
### 4. Token in Transkriptor eintragen
|
||||||
|
|
||||||
|
Als Admin einloggen → Zahnrad-Icon → Einstellungen → **Diarisierung**:
|
||||||
|
|
||||||
|
- Checkbox **"Sprecher-Erkennung aktivieren"** aktivieren
|
||||||
|
- Token in das Feld **HuggingFace Token** eintragen
|
||||||
|
- **Speichern**
|
||||||
|
|
||||||
|
Beim ersten Einsatz lädt pyannote das Modell herunter (~1 GB) und cached es lokal.
|
||||||
|
|||||||
Reference in New Issue
Block a user