Capture

hermine.ai Capture

Der hermine.ai Capture ist eine hermine.ai App, die Ihre Meetings aufnimmt, transkribiert und mit KI-gestützter Spracherkennung und automatischer Sprechererkennung (Diarisierung) analysiert.

Übersicht

Der hermine.ai Capture bietet einen vollständigen Meeting-Dokumentations-Workflow:

  1. Aufnehmen – Audio über die hermine Desktop-App erfassen
  2. Transkribieren – KI-gestützte Spracherkennung mit Sprecheridentifikation
  3. Anreichern – Automatische Zusammenfassung, Aufgaben und Klärungspunkte
  4. Exportieren – Ergebnisse als Markdown, Text oder JSON teilen

Erste Schritte

Voraussetzungen

  • Ein aktives hermine.ai-Konto mit aktivierter hermine.ai Capture App
  • Die hermine Desktop-App für die Audioaufnahme installiert
  • (Optional) Microsoft 365-Verbindung für die Kalender-Integration

Download: Die hermine.ai Capture Desktop-App können Sie auf unserer Downloads-Seite für Windows, macOS und Linux herunterladen.

Ein Meeting erstellen

  1. Navigieren Sie zu Apps › hermine.ai Capture
  2. Klicken Sie auf Neues Meeting
  3. Füllen Sie die Meeting-Details aus:
    • Titel – Ein beschreibender Name für das Meeting
    • Datum – Wann das Meeting stattfindet
    • Ort – Physischer oder virtueller Ort
    • Sprache – Wählen Sie die Hauptsprache oder lassen Sie „Automatisch erkennen" ausgewählt
  4. Klicken Sie auf Meeting erstellen

Audio aufnehmen

Die Audioaufnahme wird von der hermine Desktop-App übernommen:

  1. Öffnen Sie die Desktop-App und melden Sie sich an
  2. Wählen Sie das erstellte Meeting aus
  3. Klicken Sie auf Aufnahme starten – Audio wird in Echtzeit erfasst und hochgeladen
  4. Wenn das Meeting vorbei ist, klicken Sie auf Aufnahme stoppen
  5. Die App benachrichtigt hermine.ai, dass die Aufnahme abgeschlossen ist

Hinweis: Audio-Abschnitte werden während der Aufnahme direkt in den sicheren Speicher hochgeladen. Das bedeutet, dass auch lange Meetings effizient und ohne Unterbrechung verarbeitet werden.

Transkription

Sobald die Aufnahme beendet ist, beginnt der Transkriptionsprozess automatisch:

  1. Audio zusammenführen – Alle aufgenommenen Abschnitte werden zu einer einzigen Audiodatei zusammengeführt
  2. Spracherkennung – Das Audio wird mit Mistral Voxtral und Sprechererkennung transkribiert
  3. KI-Anreicherung – Eine Zusammenfassung, Aufgaben und Klärungspunkte werden generiert

Sie sehen Echtzeit-Statusaktualisierungen auf der Meeting-Seite. Der gesamte Prozess dauert in der Regel 1–5 Minuten, abhängig von der Meeting-Länge.

Sprecherzuordnung

Nach der Transkription werden Sprecher als SPEAKER_00, SPEAKER_01 usw. gekennzeichnet. Sie können echte Namen zuweisen:

  1. Öffnen Sie das Meeting und klicken Sie auf Bearbeiten
  2. Scrollen Sie zum Abschnitt Sprecherzuordnung
  3. Geben Sie den echten Namen für jeden erkannten Sprecher ein
  4. Klicken Sie auf Änderungen speichern

Das Transkript zeigt dann die echten Namen anstelle der generischen Bezeichnungen an.

Funktionen

Transkript-Ansicht

Das Transkript zeigt jedes Segment mit:

  • Zeitstempel – Wann das Segment gesprochen wurde
  • Sprecher – Wer es gesagt hat (mit zugeordneten Namen)
  • Text – Was gesagt wurde

Das Transkript ist scrollbar und kann Tausende von Segmenten für lange Meetings enthalten.

Zusammenfassung

Die KI erstellt eine kompakte Zusammenfassung des gesamten Meetings, hebt wichtige Diskussionspunkte und Entscheidungen hervor.

Aufgaben

Die KI extrahiert umsetzbare Aufgaben aus dem Meeting, einschließlich:

  • Aufgabenbeschreibung – Was getan werden muss
  • Zuständige Person – Wer verantwortlich ist (wenn erwähnt)
  • Fälligkeitsdatum – Wann es abgeschlossen sein soll (wenn erwähnt)

Klärungspunkte

Punkte, die mehrdeutig, ungelöst oder nachverfolgt werden müssen, werden als Klärungspunkte markiert. Diese helfen sicherzustellen, dass nichts übersehen wird.

Kalender-Integration

Verknüpfen Sie Meetings mit Microsoft 365 Kalendereinträgen:

  1. Klicken Sie auf der Meeting-Seite auf Kalendereintrag verknüpfen
  2. Durchsuchen Sie Ihre anstehenden Kalendereinträge
  3. Wählen Sie den passenden Eintrag zum Verknüpfen aus

Verknüpfte Einträge zeigen Teilnehmer-Informationen und Event-Details auf der Meeting-Seite an.

Teilen

Teilen Sie Meetings mit Teammitgliedern in Ihrem Account:

  1. Scrollen Sie auf der Meeting-Detailseite zu Teilen
  2. Wählen Sie ein Teammitglied aus dem Dropdown
  3. Klicken Sie auf Teilen

Freigegebene Benutzer können alle Meeting-Details einschließlich Transkript, Zusammenfassung und Aufgaben einsehen.

Export

Exportieren Sie abgeschlossene Meetings in drei Formaten:

Format Beschreibung
Markdown Vollständiger Bericht mit Metadaten, Zusammenfassung, Transkript und Aufgaben
Klartext Einfacher Textexport
JSON Strukturierter Datenexport mit allen Feldern

Desktop-App API

Die Desktop-App kommuniziert mit hermine.ai über eine REST-API:

  1. Meeting erstellenPOST /meeting_transcriber/api/meetings
  2. Audio-Abschnitt hochladenPOST /meeting_transcriber/api/meetings/:id/audio_chunks
  3. Aufnahme beendenPOST /meeting_transcriber/api/meetings/:id/finish_recording
  4. Status prüfenGET /meeting_transcriber/api/meetings/:id/status

Die Authentifizierung erfolgt über JWT Bearer Tokens (identisch mit der hermine API v2).

Unterstützte Sprachen

Das Mistral Voxtral STT-Modell unterstützt:

  • Deutsch
  • Englisch
  • Französisch
  • Spanisch
  • Italienisch
  • Portugiesisch
  • Japanisch
  • Chinesisch

Sie können auch Automatisch erkennen für die automatische Spracherkennung auswählen.

Unterstützte Audioformate

  • WebM (Standard für Desktop-App-Aufnahme)
  • MP3
  • WAV
  • OGG
  • FLAC
  • M4A
  • AAC

Tipps

  • Sprecher frühzeitig benennen – Weisen Sie Sprechern direkt nach der Transkription echte Namen zu für bessere Lesbarkeit
  • Kalenderverknüpfung nutzen – Das Verknüpfen eines Kalendereintrags fügt automatisch Kontext wie Teilnehmer hinzu
  • Mit dem Team teilen – Jeder Teilnehmer sollte Zugriff auf das Transkript haben
  • Aufgaben exportieren – Nutzen Sie den Markdown-Export, um Aufgaben direkt in Ihr Projektmanagement-Tool einzufügen
  • Klärungspunkte prüfen – Diese heben Bereiche hervor, die Nachverfolgung erfordern und helfen Missverständnisse zu vermeiden

War diese Seite hilfreich?