Audio-KI

Meeting-Copilot

Live-Transkription + Claude-Flüster-Panel

Gebaut von Nicholas Falshaw · Desktop-Meeting-Assistent · Electron, Windows-first

Das Problem

Notizen während Kundengesprächen killen Präsenz. Cloud-Meeting-Bots sind unheimlich, zeichnen alles auf und schicken deine Gespräche an unbekannte Dritte. Die meisten „KI-Meeting-Assistenten“ sind bessere Transkriptoren und spucken erst nach dem Meeting eine Zusammenfassung aus — zu spät, um nützlich zu sein.

Was ich gebaut habe

Ein Desktop-Copilot, der einem laufenden Gespräch zuhört (Systemaudio + Mikrofon), live transkribiert und in einem Seitenpanel kontext-bewusst flüstert: Talking Points, Rückfragen, Einwandbehandlung und eine rollierende Zusammenfassung. Läuft lokal; nur der STT-Stream verlässt den Rechner.

Architektur

  • Electron-Shell

    Immer im Vordergrund, transparentes Overlay, konfigurierbare Hotkeys, Tray-Integration

  • Audio-Capture

    Windows WASAPI-Loopback für Systemaudio + Standardmikrofon, gemischt auf einen 16-kHz-PCM-Stream

  • Streaming-STT

    Deepgram Streaming API mit Sprecher-Diarisierung, Interim- + Final-Ergebnisse

  • Transcript-Buffer

    Rolling-Window mit Sprecher-Labels, liefert dem Agenten konfigurierbare Look-back-Länge

  • Claude Agent SDK

    Tool-nutzender Agent, der strukturierte Flüster-Einwürfe ausgibt (Talking Points, Fragen, Zusammenfassung) in konfigurierbarer Frequenz

  • Overlay-UI

    React, zeigt Interim-Transkript, aktuellen Flüsterer, rollierende Zusammenfassung und exportierbare Post-Meeting-Notizen

Tech-Stack

ElectronNode.jsTypeScriptReactDeepgram SDKClaude Agent SDKWASAPI

Ergebnis

Echtzeit-Meeting-Coach, der auf dem Rechner des Operators läuft. Transkript und Zusammenfassung bleiben lokal; nur der STT-Stream geht zu Deepgram. Im Einsatz bei Kundengesprächen, internen Reviews und Übungseinheiten.

Rogue AI • Production Systems •