Capture

hermine.ai Capture

Der hermine.ai Capture ist eine hermine.ai App, die Ihre Meetings aufnimmt, transkribiert und mit KI-gestützter Spracherkennung und automatischer Sprechererkennung (Diarisierung) analysiert.

Übersicht

Der hermine.ai Capture bietet einen vollständigen Meeting-Dokumentations-Workflow:

Aufnehmen – Audio über die hermine Desktop-App erfassen
Transkribieren – KI-gestützte Spracherkennung mit Sprecheridentifikation
Anreichern – Automatische Zusammenfassung, Aufgaben und Klärungspunkte
Exportieren – Ergebnisse als Markdown, Text oder JSON teilen

Erste Schritte

Voraussetzungen

Ein aktives hermine.ai-Konto mit aktivierter hermine.ai Capture App
Die hermine Desktop-App für die Audioaufnahme installiert
(Optional) Microsoft 365-Verbindung für die Kalender-Integration

Download: Die hermine.ai Capture Desktop-App können Sie auf unserer Downloads-Seite für Windows, macOS und Linux herunterladen.

Ein Meeting erstellen

Navigieren Sie zu Apps › hermine.ai Capture
Klicken Sie auf Neues Meeting
Füllen Sie die Meeting-Details aus:
- Titel – Ein beschreibender Name für das Meeting
- Datum – Wann das Meeting stattfindet
- Ort – Physischer oder virtueller Ort
- Sprache – Wählen Sie die Hauptsprache oder lassen Sie „Automatisch erkennen" ausgewählt
Klicken Sie auf Meeting erstellen

Audio aufnehmen

Die Audioaufnahme wird von der hermine Desktop-App übernommen:

Öffnen Sie die Desktop-App und melden Sie sich an
Wählen Sie das erstellte Meeting aus
Klicken Sie auf Aufnahme starten – Audio wird in Echtzeit erfasst und hochgeladen
Wenn das Meeting vorbei ist, klicken Sie auf Aufnahme stoppen
Die App benachrichtigt hermine.ai, dass die Aufnahme abgeschlossen ist

Hinweis: Audio-Abschnitte werden während der Aufnahme direkt in den sicheren Speicher hochgeladen. Das bedeutet, dass auch lange Meetings effizient und ohne Unterbrechung verarbeitet werden.

Transkription

Sobald die Aufnahme beendet ist, beginnt der Transkriptionsprozess automatisch:

Audio zusammenführen – Alle aufgenommenen Abschnitte werden zu einer einzigen Audiodatei zusammengeführt
Spracherkennung – Das Audio wird mit Mistral Voxtral und Sprechererkennung transkribiert
KI-Anreicherung – Eine Zusammenfassung, Aufgaben und Klärungspunkte werden generiert

Sie sehen Echtzeit-Statusaktualisierungen auf der Meeting-Seite. Der gesamte Prozess dauert in der Regel 1–5 Minuten, abhängig von der Meeting-Länge.

Sprecherzuordnung

Nach der Transkription werden Sprecher als SPEAKER_00, SPEAKER_01 usw. gekennzeichnet. Sie können echte Namen zuweisen:

Öffnen Sie das Meeting und klicken Sie auf Bearbeiten
Scrollen Sie zum Abschnitt Sprecherzuordnung
Geben Sie den echten Namen für jeden erkannten Sprecher ein
Klicken Sie auf Änderungen speichern

Das Transkript zeigt dann die echten Namen anstelle der generischen Bezeichnungen an.

Funktionen

Transkript-Ansicht

Das Transkript zeigt jedes Segment mit:

Zeitstempel – Wann das Segment gesprochen wurde
Sprecher – Wer es gesagt hat (mit zugeordneten Namen)
Text – Was gesagt wurde

Das Transkript ist scrollbar und kann Tausende von Segmenten für lange Meetings enthalten.

Zusammenfassung

Die KI erstellt eine kompakte Zusammenfassung des gesamten Meetings, hebt wichtige Diskussionspunkte und Entscheidungen hervor.

Aufgaben

Die KI extrahiert umsetzbare Aufgaben aus dem Meeting, einschließlich:

Aufgabenbeschreibung – Was getan werden muss
Zuständige Person – Wer verantwortlich ist (wenn erwähnt)
Fälligkeitsdatum – Wann es abgeschlossen sein soll (wenn erwähnt)

Klärungspunkte

Punkte, die mehrdeutig, ungelöst oder nachverfolgt werden müssen, werden als Klärungspunkte markiert. Diese helfen sicherzustellen, dass nichts übersehen wird.

Kalender-Integration

Verknüpfen Sie Meetings mit Microsoft 365 Kalendereinträgen:

Klicken Sie auf der Meeting-Seite auf Kalendereintrag verknüpfen
Durchsuchen Sie Ihre anstehenden Kalendereinträge
Wählen Sie den passenden Eintrag zum Verknüpfen aus

Verknüpfte Einträge zeigen Teilnehmer-Informationen und Event-Details auf der Meeting-Seite an.

Teilen Sie Meetings mit Teammitgliedern in Ihrem Account:

Scrollen Sie auf der Meeting-Detailseite zu Teilen
Wählen Sie ein Teammitglied aus dem Dropdown
Klicken Sie auf Teilen

Freigegebene Benutzer können alle Meeting-Details einschließlich Transkript, Zusammenfassung und Aufgaben einsehen.

Export

Exportieren Sie abgeschlossene Meetings in drei Formaten:

Format	Beschreibung
Markdown	Vollständiger Bericht mit Metadaten, Zusammenfassung, Transkript und Aufgaben
Klartext	Einfacher Textexport
JSON	Strukturierter Datenexport mit allen Feldern

Desktop-App API

Die Desktop-App kommuniziert mit hermine.ai über eine REST-API:

Meeting erstellen – POST /meeting_transcriber/api/meetings
Audio-Abschnitt hochladen – POST /meeting_transcriber/api/meetings/:id/audio_chunks
Aufnahme beenden – POST /meeting_transcriber/api/meetings/:id/finish_recording
Status prüfen – GET /meeting_transcriber/api/meetings/:id/status

Die Authentifizierung erfolgt über JWT Bearer Tokens (identisch mit der hermine API v2).

Unterstützte Sprachen

Das Mistral Voxtral STT-Modell unterstützt:

Deutsch
Englisch
Französisch
Spanisch
Italienisch
Portugiesisch
Japanisch
Chinesisch

Sie können auch Automatisch erkennen für die automatische Spracherkennung auswählen.

Unterstützte Audioformate

WebM (Standard für Desktop-App-Aufnahme)
MP3
WAV
OGG
FLAC
M4A
AAC

Datenaufbewahrung & Löschung

hermine.ai Capture wendet strenge Aufbewahrungsrichtlinien an, um die Speicherung personenbezogener Daten gemäß DSGVO (Art. 5 Abs. 1 lit. c+e) zu minimieren.

Audiodateien

Audiodateien werden automatisch und unwiderruflich gelöscht gemäß folgender Regeln:

Szenario	Aufbewahrungsfrist	Konfigurierbar
Erfolgreiche Transkription	72 Stunden nach Verarbeitungsabschluss	Nein
Fehlgeschlagene oder ausstehende Verarbeitung	30 Tage nach Erstellung	Nein

Diese Fristen sind nicht konfigurierbar. Es gibt keinen Papierkorb.

Transkripte

Roh-Transkripte (Wortlaut, Sprecherdaten, Sprecherzuordnungen) werden nach einer konfigurierbaren Aufbewahrungsfrist automatisch gelöscht:

Einstellung	Frist
Standard	365 Tage nach Meeting-Erstellung
Minimum	30 Tage
Maximum	Unbegrenzt (Enterprise-Tarife)

Workspace-Administratoren können die Transkript-Aufbewahrungsfrist unter Apps › Capture › Einstellungen › Datenaufbewahrung anpassen.

Hinweis: Zusammenfassungen, Aufgaben und Klärungspunkte bleiben erhalten, auch nachdem das Roh-Transkript gelöscht wurde. Nur der wörtliche Transkripttext, Sprechersegmente und Sprecherzuordnungen werden entfernt.

Manuelle Löschung

Sie können jedes Meeting (einschließlich aller Audio-, Transkript- und abgeleiteten Daten) jederzeit löschen:

Öffnen Sie die Meeting-Detailseite
Klicken Sie auf Meeting löschen
Bestätigen Sie die Löschung

Die manuelle Löschung ist sofort und unwiderruflich. Es gibt keinen Papierkorb.

Account-Löschung

Wenn ein Benutzerkonto oder Workspace gelöscht wird, werden alle zugehörigen Meetings, Audiodateien, Transkripte und abgeleiteten Daten innerhalb von 30 Tagen gelöscht.

Aufnahme & Einwilligung

⚠️ Wichtiger rechtlicher Hinweis

Die Aufnahme von Meetings erfordert die vorherige Einwilligung aller Teilnehmer.

Deutschland: Das Aufnehmen von Gesprächen ohne Einwilligung ist gemäß § 201 StGB (Verletzung der Vertraulichkeit des Wortes) strafbar und kann mit bis zu 3 Jahren Freiheitsstrafe geahndet werden.

DSGVO: Für die Verarbeitung von Sprachaufnahmen ist eine Rechtsgrundlage nach Art. 6 DSGVO erforderlich.

Die Verantwortung für die Einholung der Einwilligung liegt bei Ihnen (dem Nutzer), nicht bei hermine.ai.

Wir empfehlen, alle Teilnehmer vor Beginn der Aufnahme zu informieren und deren Einwilligung zu dokumentieren.

Tipps

Sprecher frühzeitig benennen – Weisen Sie Sprechern direkt nach der Transkription echte Namen zu für bessere Lesbarkeit
Kalenderverknüpfung nutzen – Das Verknüpfen eines Kalendereintrags fügt automatisch Kontext wie Teilnehmer hinzu
Mit dem Team teilen – Jeder Teilnehmer sollte Zugriff auf das Transkript haben
Aufgaben exportieren – Nutzen Sie den Markdown-Export, um Aufgaben direkt in Ihr Projektmanagement-Tool einzufügen
Klärungspunkte prüfen – Diese heben Bereiche hervor, die Nachverfolgung erfordern und helfen Missverständnisse zu vermeiden

Suche

Menu