Logo
PhonerLite
VoIP Softphone für Windows
⬇️

KI-Einstellungen

PhonerLite unterstützt 2 Arten von KI (Künstliche Intelligenz):

Gemini

Gemini ist eine Familie von KI-Modellen von Google. Sie können Text, Code, Bilder und mehr verstehen und erstellen. Dafür braucht man einen Gemini API-Schlüssel. Dann greift PhonerLite per REST-API auf den Online-Dienst von Google Gemini zu.

Der notwendige API-Schlüssel (Access Token) kann kostenlos hier erstellt werden: https://aistudio.google.com/app/api-keys

Um auf vorherige Fragen und Antworten aus dem Dialog Bezug nehmen zu können, sollte eine gewisse Verlaufslänge eingestellt sein. Über den ⟳-Button kann eine Liste der verfügbaren Modelle heruntergeladen werden.

Wenn ein gültiger API-Schlüssel hinterlegt und eine Internet-Verbindung vorhanden ist, kann mittels CLI (beispielsweise per "Ask"-Befehl) das automatisiert in ein Script integriert werden. Alternativ kann das auch interaktiv direkt auf der "Ausprobieren"-Seite getestet werden.

Ollama

Ollama ist ein Open-Source-Tool, das die lokale Ausführung großer Sprachmodelle (LLMs) wie Llama 3 oder Mistral auf dem eigenen Computer vereinfacht. Da die Modelle nach einem einmaligen Download direkt auf dem lokalen Gerät laufen, kann die KI offline genutzt werden, was maximale Datenkontrolle und Datenschutz gewährleistet.

Die Installation eines Ollama-Servers erfolgt typischerweise durch das Ausführen eines einfachen Installationsskripts oder eines Installers, wodurch ein lokaler Dienst eingerichtet wird. Dieser Server ist standardmäßig unter der REST-API-Adresse http://localhost:11434 erreichbar, um von Anwendungen mit den heruntergeladenen, lokalen Sprachmodellen zu interagieren. Die notwendige Hardware hängt direkt von der Größe des Sprachmodells (LLM) ab, das lokal mit Ollama ausgeführt werden soll. Für gängige Modelle (wie 7B-Parameter-Modelle) ist eine Mindestanforderung von 16 GB RAM und vorzugsweise eine dedizierte Grafikkarte (GPU) mit mindestens 8 GB VRAM empfehlenswert, da die GPU die Verarbeitungsgeschwindigkeit stark beschleunigt.

Transkribieren

Transkription bezeichnet den Prozess der Umwandlung gesprochener Sprache in einen geschriebenen Text. Dies geschieht automatisiert durch Spracherkennungssoftware (Speech-to-Text). PhonerLite verwendet dazu Whisper, das über den "Installieren"-Button heruntergeladen werden kann (465 MB).

Zusätzliche Modelle ("Medium [1,42 GB]" und "Large [2,88 GB]") können manuell installiert werden. Diese benötigen zwar wesentlich mehr CPU- bzw. GPU-Ressourcen, bieten dafür jedoch eine geringere Wortfehlerrate.

Ausprobieren

Auf dieser Seite kann man interaktiv einen Dialog mit einer KI-Gegenstelle (Gemini oder Ollama) führen. Um die Transkription zu testen, muss man den ▶-Button mit gedrückter Strg-Taste lange anklicken. Während dieser Zeit wird das Mikrofonsignal in Text umgewandelt.

KI Chat