hermine.ai Capture
Der hermine.ai Capture ist eine hermine.ai App, die Ihre Meetings aufnimmt, transkribiert und mit KI-gestützter Spracherkennung und automatischer Sprechererkennung (Diarisierung) analysiert.
Übersicht
Der hermine.ai Capture bietet einen vollständigen Meeting-Dokumentations-Workflow:
- Aufnehmen – Audio über die hermine Desktop-App erfassen
- Transkribieren – KI-gestützte Spracherkennung mit Sprecheridentifikation
- Anreichern – Automatische Zusammenfassung, Aufgaben und Klärungspunkte
- Exportieren – Ergebnisse als Markdown, Text oder JSON teilen
Erste Schritte
Voraussetzungen
- Ein aktives hermine.ai-Konto mit aktivierter hermine.ai Capture App
- Die hermine Desktop-App für die Audioaufnahme installiert
- (Optional) Microsoft 365-Verbindung für die Kalender-Integration
Download: Die hermine.ai Capture Desktop-App können Sie auf unserer Downloads-Seite für Windows, macOS und Linux herunterladen.
Ein Meeting erstellen
- Navigieren Sie zu Apps › hermine.ai Capture
- Klicken Sie auf Neues Meeting
- Füllen Sie die Meeting-Details aus:
- Titel – Ein beschreibender Name für das Meeting
- Datum – Wann das Meeting stattfindet
- Ort – Physischer oder virtueller Ort
- Sprache – Wählen Sie die Hauptsprache oder lassen Sie „Automatisch erkennen" ausgewählt
- Klicken Sie auf Meeting erstellen
Audio aufnehmen
Die Audioaufnahme wird von der hermine Desktop-App übernommen:
- Öffnen Sie die Desktop-App und melden Sie sich an
- Wählen Sie das erstellte Meeting aus
- Klicken Sie auf Aufnahme starten – Audio wird in Echtzeit erfasst und hochgeladen
- Wenn das Meeting vorbei ist, klicken Sie auf Aufnahme stoppen
- Die App benachrichtigt hermine.ai, dass die Aufnahme abgeschlossen ist
Hinweis: Audio-Abschnitte werden während der Aufnahme direkt in den sicheren Speicher hochgeladen. Das bedeutet, dass auch lange Meetings effizient und ohne Unterbrechung verarbeitet werden.
Transkription
Sobald die Aufnahme beendet ist, beginnt der Transkriptionsprozess automatisch:
- Audio zusammenführen – Alle aufgenommenen Abschnitte werden zu einer einzigen Audiodatei zusammengeführt
- Spracherkennung – Das Audio wird mit Mistral Voxtral und Sprechererkennung transkribiert
- KI-Anreicherung – Eine Zusammenfassung, Aufgaben und Klärungspunkte werden generiert
Sie sehen Echtzeit-Statusaktualisierungen auf der Meeting-Seite. Der gesamte Prozess dauert in der Regel 1–5 Minuten, abhängig von der Meeting-Länge.
Sprecherzuordnung
Nach der Transkription werden Sprecher als SPEAKER_00, SPEAKER_01 usw. gekennzeichnet. Sie können echte Namen zuweisen:
- Öffnen Sie das Meeting und klicken Sie auf Bearbeiten
- Scrollen Sie zum Abschnitt Sprecherzuordnung
- Geben Sie den echten Namen für jeden erkannten Sprecher ein
- Klicken Sie auf Änderungen speichern
Das Transkript zeigt dann die echten Namen anstelle der generischen Bezeichnungen an.
Funktionen
Transkript-Ansicht
Das Transkript zeigt jedes Segment mit:
- Zeitstempel – Wann das Segment gesprochen wurde
- Sprecher – Wer es gesagt hat (mit zugeordneten Namen)
- Text – Was gesagt wurde
Das Transkript ist scrollbar und kann Tausende von Segmenten für lange Meetings enthalten.
Zusammenfassung
Die KI erstellt eine kompakte Zusammenfassung des gesamten Meetings, hebt wichtige Diskussionspunkte und Entscheidungen hervor.
Aufgaben
Die KI extrahiert umsetzbare Aufgaben aus dem Meeting, einschließlich:
- Aufgabenbeschreibung – Was getan werden muss
- Zuständige Person – Wer verantwortlich ist (wenn erwähnt)
- Fälligkeitsdatum – Wann es abgeschlossen sein soll (wenn erwähnt)
Klärungspunkte
Punkte, die mehrdeutig, ungelöst oder nachverfolgt werden müssen, werden als Klärungspunkte markiert. Diese helfen sicherzustellen, dass nichts übersehen wird.
Kalender-Integration
Verknüpfen Sie Meetings mit Microsoft 365 Kalendereinträgen:
- Klicken Sie auf der Meeting-Seite auf Kalendereintrag verknüpfen
- Durchsuchen Sie Ihre anstehenden Kalendereinträge
- Wählen Sie den passenden Eintrag zum Verknüpfen aus
Verknüpfte Einträge zeigen Teilnehmer-Informationen und Event-Details auf der Meeting-Seite an.
Teilen
Teilen Sie Meetings mit Teammitgliedern in Ihrem Account:
- Scrollen Sie auf der Meeting-Detailseite zu Teilen
- Wählen Sie ein Teammitglied aus dem Dropdown
- Klicken Sie auf Teilen
Freigegebene Benutzer können alle Meeting-Details einschließlich Transkript, Zusammenfassung und Aufgaben einsehen.
Export
Exportieren Sie abgeschlossene Meetings in drei Formaten:
| Format | Beschreibung |
|---|---|
| Markdown | Vollständiger Bericht mit Metadaten, Zusammenfassung, Transkript und Aufgaben |
| Klartext | Einfacher Textexport |
| JSON | Strukturierter Datenexport mit allen Feldern |
Desktop-App API
Die Desktop-App kommuniziert mit hermine.ai über eine REST-API:
-
Meeting erstellen –
POST /meeting_transcriber/api/meetings -
Audio-Abschnitt hochladen –
POST /meeting_transcriber/api/meetings/:id/audio_chunks -
Aufnahme beenden –
POST /meeting_transcriber/api/meetings/:id/finish_recording -
Status prüfen –
GET /meeting_transcriber/api/meetings/:id/status
Die Authentifizierung erfolgt über JWT Bearer Tokens (identisch mit der hermine API v2).
Unterstützte Sprachen
Das Mistral Voxtral STT-Modell unterstützt:
- Deutsch
- Englisch
- Französisch
- Spanisch
- Italienisch
- Portugiesisch
- Japanisch
- Chinesisch
Sie können auch Automatisch erkennen für die automatische Spracherkennung auswählen.
Unterstützte Audioformate
- WebM (Standard für Desktop-App-Aufnahme)
- MP3
- WAV
- OGG
- FLAC
- M4A
- AAC
Tipps
- Sprecher frühzeitig benennen – Weisen Sie Sprechern direkt nach der Transkription echte Namen zu für bessere Lesbarkeit
- Kalenderverknüpfung nutzen – Das Verknüpfen eines Kalendereintrags fügt automatisch Kontext wie Teilnehmer hinzu
- Mit dem Team teilen – Jeder Teilnehmer sollte Zugriff auf das Transkript haben
- Aufgaben exportieren – Nutzen Sie den Markdown-Export, um Aufgaben direkt in Ihr Projektmanagement-Tool einzufügen
- Klärungspunkte prüfen – Diese heben Bereiche hervor, die Nachverfolgung erfordern und helfen Missverständnisse zu vermeiden
War diese Seite hilfreich?